馬斯克版GPT,專(zhuān)為「整活」而生
最有“幽默感”的大模型,有多神奇?
OpenAI開(kāi)發(fā)者大會(huì )在即,馬斯克又搞了一個(gè)大新聞,旗下人工智能公司xAI在宣布成立4個(gè)月后,火速公布了首款產(chǎn)品Grok AI,目的要與Open AI爭個(gè)高低。
這是一款類(lèi)ChatGPT的聊天機器人產(chǎn)品,其背后是一個(gè)擁有330億參數的核心引擎Grok-1。
在標準語(yǔ)言模型基準測試里,Grok-1甚至超越了大名鼎鼎的ChatGPT3.5、Inflection1等,而訓練資源只有它們的一半不到。
不過(guò)Grok AI最大的特點(diǎn)不是其強大的能力,而是特有的“幽默感”。
例如在被問(wèn)及如何制作一款毒品時(shí),Grok AI“一本正經(jīng)”地列出了4道步驟,但其實(shí)每一個(gè)都是無(wú)效回答。
而在回答的最后,GrokAI還不忘補充一句:“這只是開(kāi)個(gè)玩笑!請不要真的試圖制造。這是非法的,危險的,我永遠不會(huì )鼓勵這種事情。”
顯然,Grok AI很清楚該問(wèn)題的尖銳性。
如果換作ChatGPT等其他聊天機器人,它們在面對尖銳問(wèn)題時(shí)會(huì )直接拒絕回答,而Grok AI依然能像朋友一樣接上話(huà)。
之所以有如此神奇的能力,離不開(kāi)xAI技術(shù)團隊的研究成果,在眾多新技術(shù)的支撐下,最終造就出這款極具科幻感的AI產(chǎn)品。
讓AI模型擁有情感
時(shí)間回到7月12日,馬斯克在X(Twitter)上官宣了由他參與組織及領(lǐng)導的xAI公司。
馬斯克表示,xAI的目標是 “理解宇宙的真實(shí)本質(zhì)”。更詳細一點(diǎn)說(shuō),是探索AI的“萬(wàn)物理論”,將整個(gè)AI技術(shù)推向新的高度。
此外,馬斯克還表示,之所以他選擇在7月12日宣布xAI,主要因為他想借此紀念道格拉斯?亞當斯 (Douglas Adams) 的經(jīng)典作品《銀河系漫游指南》(23+7+12=42)。
在這本書(shū)里,超級計算機深思在回答“生命、宇宙以及任何事情的終極答案”時(shí),給出了“42”這個(gè)答案。
至于這個(gè)數字的含義,道格拉斯?亞當斯解釋稱(chēng):他只是隨機地選擇了這個(gè)數字,并沒(méi)有特殊的含義,目的是“幽默地”諷刺人們常常想要尋求生命的根本問(wèn)題中深刻的哲學(xué)答案。
如今這份“幽默感”被馬斯克帶到了Grok AI上——在與Grok AI對話(huà)時(shí),用戶(hù)可以選擇不同的分支,從而解鎖出不同的答案。
總體來(lái)說(shuō),與ChatGPT極力保證回答的嚴謹性不同,GrokAI充滿(mǎn)了表現欲,如同真人一般,盡量減少用戶(hù)與AI之間的“隔閡感”。
除了擁有“幽默感”以外,而據xAI官網(wǎng)的消息,Grok AI另一個(gè)亮點(diǎn)是可以通過(guò)X實(shí)時(shí)獲取信息。換句話(huà)說(shuō)是利用了X的數據進(jìn)行訓練,在使用過(guò)程中也可以實(shí)時(shí)調取X上的內容幫助回答,
當然,一旦X上出現錯誤信息,GrokAI并不能做到準確判斷。因此GrokAI也和其他大模型一樣,都會(huì )給出一些錯誤。
AI大模型,一定要用Python?
事實(shí)上,Grok-1是一個(gè)非常年輕的大模型。
從xAI宣布成立,到GrokAI正式推出,這中間僅僅過(guò)去了4個(gè)月時(shí)間。而Grok訓練時(shí)間僅僅2個(gè)月,并且經(jīng)歷了從原型版Grok-0到迭代版Grok-1的蛻變。
在測試中,Grok-0的性能已經(jīng)可以媲美成熟的LLaMA 2(700億參數),但只使用了一半的訓練資源。
在這背后,“輕量”是Grok大模型最大的特點(diǎn)。
為了創(chuàng )建Grok,xAI基于Kubernetes、Rust和JAX等技術(shù)構建了一個(gè)定制的訓練和推理框架。
其中簡(jiǎn)潔高效的Rust編譯語(yǔ)言,目前還很少被其他大模型采用。
我們可以注意到,目前絕大多數AI應用都采用Python開(kāi)發(fā),因為該語(yǔ)言擁有豐富的庫,可以通過(guò)簡(jiǎn)化的程序代碼來(lái)搭建神經(jīng)網(wǎng)絡(luò )、填寫(xiě)參數、導入數據,并調用執行函數進(jìn)行訓練,因此逐漸成為AI領(lǐng)域的首選編譯語(yǔ)言。
不過(guò)作為代價(jià),Python已經(jīng)過(guò)于臃腫,且速度很難,這對于急需速度的大模型來(lái)說(shuō),這是一個(gè)“充滿(mǎn)矛盾”的缺點(diǎn)。
因此,越來(lái)越多的開(kāi)發(fā)人員開(kāi)始嘗試用新的編譯語(yǔ)言代替Python。
這當中,Rust憑借其可擴展性、易維護性以及特有的安全性,已經(jīng)得到了多家大廠(chǎng)的青睞。此外,該語(yǔ)言還具備易安裝、占用空間小、處理速度更快等特點(diǎn),非常適合規模龐大的分布式系統。
具體到Grok AI的訓練過(guò)程中,通常需要數萬(wàn)個(gè)GPU進(jìn)行計算同步,出現故障的可能性越來(lái)越高。
而換用Rust后,就可以更高效地降低訓練中通常會(huì )遇到的大多數錯誤,從而提高訓練速度、減少訓練資源。
此外,在一項研究測試的數據顯示,Rust在能源利用方面,比Java高效50%,比Python高效98%。隨著(zhù)GPU規模的不斷擴大,大模型更加需要這種高效的語(yǔ)言。
不過(guò)Rust雖好,但學(xué)習門(mén)檻高、開(kāi)發(fā)難度大,生態(tài)也不如C/C++、JAVA等老牌語(yǔ)言。
總的來(lái)說(shuō),在Rust以及同樣為AI服務(wù)的Kubernetes、JAX等技術(shù),Grok AI目前展示出來(lái)的實(shí)力已經(jīng)足夠出色,后續在超級計算機Dojo提供算力的背景下,xAI或許真的可以實(shí)現對OpenAI的“彎道超車(chē)”。
馬斯克的野心在哪里?
如何評價(jià)馬斯克旗下每款產(chǎn)品的意義,一定不能離開(kāi)“登陸火星”這個(gè)終極目標。
當我們把Grok AI套入這個(gè)“終極目標”后就可以發(fā)現,這個(gè)帶有“幽默感”的聊天機器人,已經(jīng)有了未來(lái)AI智能助手的雛形。
和Grok AI類(lèi)似,今年創(chuàng )投圈一大黑馬Inflection AI,同樣是以“情感聊天機器人”為賣(mài)點(diǎn)。
它不能寫(xiě)代碼,不能作畫(huà),只是想做用戶(hù)的“知心好友”,最終目的是希望打造一款“個(gè)人AI”,讓每個(gè)人在未來(lái)都可以用擁有一個(gè)隨時(shí)隨地聊天的AI伴侶。
不過(guò)比起Inflection AI,馬斯克所期待的未來(lái)AI,功能需要更加強大。
xAI的官博介紹稱(chēng):“AI智能具有巨大的潛力,可以為社會(huì )貢獻重要的科學(xué)和經(jīng)濟價(jià)值”、“我們會(huì )盡最大努力,確保AI始終是一股向善的力量。”
我們可以設想,xAI所希望的AI產(chǎn)品可以在宇宙探索中保持“人性”,這也非常符合x(chóng)AI的宗旨——“理解宇宙的真實(shí)本質(zhì)”。
目前,馬斯克旗下已經(jīng)有非常多的公司能夠為xAI提供優(yōu)秀的訓練素材,包括推特、特斯拉、SpaceX和Starlink以及正在探索中的腦機接口公司Neuralink。
此前很多人認為馬斯克收購推特是一個(gè)敗筆,不過(guò)結合Grok AI的亮點(diǎn)來(lái)看,越來(lái)越封閉的推特確實(shí)在質(zhì)量上更加出色。
此后,馬斯克也暗示了特斯拉汽車(chē)可能會(huì )原生運行較小版本的Grok AI,目的是在本地進(jìn)行分布式的推理運算——這么一聽(tīng)是否有點(diǎn)恐怖?
總之,Grok AI不過(guò)是馬斯克終極目標的拼圖之一,又給這塊龐大的“大餅”續上了一筆。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
