「不完美」的百度文心一言,背水一戰
國產(chǎn)ChatGPT應用,仍待市場(chǎng)檢驗。
大概百度CEO李彥宏自己也沒(méi)有想到,GPT-4會(huì )突然“搶跑”。
因此在今日下午的文心一言發(fā)布會(huì )現場(chǎng),李彥宏的話(huà)語(yǔ)之間少了些從容,多了幾分緊張,開(kāi)場(chǎng)白中也多次提及GPT-4。
在隨后的展示環(huán)節中,李彥宏親自展示了文心一言在五個(gè)使用場(chǎng)景的表現,包括文學(xué)創(chuàng )作、商業(yè)文案創(chuàng )作、數理推算、中文理解以及多模態(tài)生成。
不過(guò)由于現場(chǎng)采用錄播的形式進(jìn)行演示,因此不少觀(guān)眾對評論中紛紛表達出失望。
而資本市場(chǎng)更是直接用股價(jià)“表達”不滿(mǎn),在李彥宏臺上講話(huà)的同時(shí),百度股價(jià)在港股市場(chǎng)上直接跳水,一度暴跌10%。
那么文心一言真的如網(wǎng)友所評價(jià)的一樣“不堪”嗎?
中國版ChatGPT,能力如何?
“十月懷胎,一朝分娩”。
每個(gè)人都在期待這個(gè)預熱多時(shí)的AI大模型文心一言長(cháng)什么樣?
在進(jìn)行簡(jiǎn)單的開(kāi)場(chǎng)白后,李彥宏直接展示了文心一言的五大能力:
· 文學(xué)創(chuàng )作
在這一環(huán)節,李彥宏拿出了知名科幻小說(shuō)《三體》和文心一言進(jìn)行了六輪對話(huà),主要體現文心一言所具有的總結能力、推理能力等等。
作為大模型的最基本能力,文心一言采用了5500億知識圖譜的事實(shí)的訓練數據,來(lái)保證事實(shí)性問(wèn)題回答準確。
從回答來(lái)看,文心一言的準確性相當不錯。
· 商業(yè)文案創(chuàng )作
李彥宏以一家科技服務(wù)創(chuàng )業(yè)公司為例,要求文心一言從取名、Slogan等方面提出建議。
文心一言表現出的能力也符合預期,還為生成的5個(gè)公司名稱(chēng)進(jìn)行了解釋。
· 數理邏輯推算
用大模型做題,是ChatGPT的亮點(diǎn)之一,文心一言也具備這一能力。
這一環(huán)節,李彥宏提出了“雞兔同籠”這一中國古代典型數學(xué)題。
一開(kāi)始,題目中給出一個(gè)錯誤的數據,文心一言及時(shí)給出了提示。
在修改數據后,文心一言不僅給出了正確答案,同時(shí)也給出了解題步驟。
· 中文理解
毫無(wú)疑問(wèn),這是國產(chǎn)大模型與英文大模型最大的區別之一。
據李彥宏表示,文心一言使用了大量中文數據集來(lái)進(jìn)行訓練。
在現場(chǎng)展示的有關(guān)“洛陽(yáng)紙貴”的一系列問(wèn)題時(shí),文心一言合理解釋了這個(gè)帶有內涵的成語(yǔ),同時(shí)秀了一首藏頭詩(shī)。
不過(guò)李彥宏也坦言,文心一言在處理英文問(wèn)題時(shí)還存在差距,部分原因是因為在訓練數據樣本還不夠大。
由此可見(jiàn),文心一言還是更貼近中文語(yǔ)境。
· 多模態(tài)生成
對比上一代產(chǎn)品,GPT-4最大的特點(diǎn)是支持多模態(tài)生成。而這一次,文心一言也展示了自身多模態(tài)生成能力。
在現場(chǎng),文心一言現場(chǎng)秀了一段四川話(huà),還展示了一段文字轉視頻的能力。
有趣的是,李彥宏在展示這一環(huán)節時(shí),百度的股價(jià)一度有回升的態(tài)勢,但李彥宏隨后表示視頻暫時(shí)還沒(méi)有對外開(kāi)放后,上漲的勢頭突然就被“撲滅”……
從上述五大能力來(lái)看,文心一言已經(jīng)具備了ChatGPT擁有的能力,甚至在“雞兔同籠”、“洛陽(yáng)紙貴”等表現上更勝一籌。
但奈何GPT-4直接降維打擊,沖擊感更大,能力也更強。
當文心一言?huà)伋鲞@些“新功能”時(shí),很難再稱(chēng)得上是一種驚喜。
“不完美”的文心一言,沒(méi)有退路
在發(fā)布會(huì )上,李彥宏提出一個(gè)問(wèn)題,百度是不是真的Ready了?
這一問(wèn)題上,李彥宏并沒(méi)有給出直接答復,而是從側面指出,百度是全球大廠(chǎng)中第一個(gè)發(fā)布對標ChatGPT的產(chǎn)品,甚至超過(guò)了微軟和谷歌(注:李彥宏指出,微軟是直接調用GPT)。
同時(shí)他指出,選擇于此時(shí)發(fā)布,主要是基于市場(chǎng)需求。
眾所周知,隨著(zhù)GPT-4的震撼發(fā)布,OpenAI在產(chǎn)品力上又向前邁進(jìn)一步,這對于國內廠(chǎng)商來(lái)說(shuō)并不是什么好消息。
目前國內追趕OpenAI的陣營(yíng)中,百度在大模型上的研發(fā)投入屬于第一梯隊,從發(fā)布會(huì )上的演示來(lái)看,文心一言的表現其實(shí)表現的非常出色,在多個(gè)環(huán)節表示完全不輸ChatGPT。
但眾所周知,發(fā)布多時(shí)的ChatGPT是基于GPT-3.5架構開(kāi)發(fā),而GPT-4已經(jīng)是新一代的升級版本。
隨著(zhù)GPT-4以狂飆之勢涌入主流視野,百度的進(jìn)度一瞬間就被甩開(kāi)了一大截。
作為百度的帶路人,李彥宏自然深知行業(yè)的一舉一動(dòng),如果此時(shí)再不上馬“文心一言”,后面的壓力可想而言。
因此在進(jìn)退兩難面前,李彥宏還是選擇迎頭直面OpenAI。
或許文心一言的demo演示或多或少讓人感到失望,但當下目前最重要的任務(wù)還是搶占市場(chǎng)還是。
值得一提的是,在百度 CTO 王海峰上臺分享了背后的技術(shù)與百度多年的技術(shù)積累后,百度的股價(jià)再次“抬頭”。
多年沉淀,文心一言仍有機會(huì )顛覆
不可否認的是,文心一言在一些細節上仍顯得不足,李彥宏也正視了文心一言與頂尖模型GPT-4的差距。
不過(guò),中文大模型與英文大模型從背后邏輯來(lái)看存在差異。多數業(yè)內人士指出,中文與英文的互聯(lián)網(wǎng)環(huán)境互相不同,訓練的難度也有所不同。
即便是ChatGPT,在一些中文問(wèn)題上也會(huì )有水土不服的現象,例如“藏頭詩(shī)”,GPT-4就很難理解。
而這一點(diǎn),在中文環(huán)境中沉淀多時(shí)的文心一言就表現的更好。
事實(shí)上,文心一言并不是一個(gè)新事物,該大模型從2019年誕生的預訓練模型ERNIE1.0開(kāi)始,歷經(jīng)多年的迭代,最終構成了如今的文心大模型。
而在發(fā)布會(huì )上,王海峰也介紹道,文心一言是新一代知識增強大語(yǔ)言模型,是在ERNIE及PLATO系列模型的基礎上研發(fā)的。它的關(guān)鍵技術(shù)包括有監督精調、人類(lèi)反饋的強化學(xué)習、提示、知識增強、檢索增強和對話(huà)增強。
換句話(huà)說(shuō),文心一言更像是百度多年以來(lái)AI能力的大合集。
除了AI對話(huà)以外,文心大模型涉及的應用非常多,包括搜索、智能云、自動(dòng)駕駛、繪畫(huà)等多個(gè)領(lǐng)域。涉及的行業(yè)也涵蓋了金融、能源、媒體、政務(wù)等千行百業(yè)。另外在會(huì )上,百度表示已有超過(guò)650家企業(yè)宣布接入文心一言生態(tài)。
因此,在實(shí)際應用面前,文心一言的商業(yè)能力還是遠超其他公司。這也驗證了李彥宏所說(shuō)的:“此時(shí)發(fā)布,主要是基于市場(chǎng)需求。”
隨著(zhù)后期越來(lái)越多的用戶(hù)接入文心一言,該大模型的能力也會(huì )不斷提升。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
