當智能手機用上“AI系統”,AI Pin拿什么贏(yíng)?
如何做AI手機,現在有了一條新思路。
去年11月,一款名叫“AI Pin”的AI硬件刷屏了科技圈。
它沒(méi)有屏幕,全靠聲音與投影進(jìn)行交互,用戶(hù)只需簡(jiǎn)單幾句,這個(gè)“小方塊”就可以作出回應。
除了官方描述得無(wú)比科幻以外,行業(yè)也是對這款硬件無(wú)比看好。
首先該產(chǎn)品被《時(shí)代》評選為“2023 年年度發(fā)明”,一度被視作顛覆iPhone的革命性產(chǎn)品。其次作為研發(fā)公司,Humane拿到了OpenAI、微軟、高通等科技巨頭數億元的注資。
但隨著(zhù)近期A(yíng)I Pin開(kāi)始發(fā)貨,媒體評測隨之解禁,網(wǎng)友們這才發(fā)現,實(shí)機展現的效果可謂令人大跌眼鏡。
除了AI Pin以外,Rabbit R1等AI硬件也在CES大會(huì )上賺足了眼神。但這些AI硬件想法很好,可短時(shí)間內很難擺脫不了“智商稅”的標簽。
“iPhone殺手”口碑翻車(chē),哪里出了錯?
AI Pin的體驗究竟有多糟糕:系統操作復雜、三分鐘過(guò)熱關(guān)機、在陽(yáng)光下幾乎無(wú)法使用投影……
除了這些最直觀(guān)的負面體驗感以外,AI功能響應慢且回復內容質(zhì)量低、系統功能需額外付費、佩戴方式對衣服材質(zhì)有要求等等,這些問(wèn)題放在任何一個(gè)成熟的硬件上都是槽點(diǎn)。
更糟糕的是,AIPin有超過(guò)450萬(wàn)臺的預定量,而價(jià)格又不便宜(699美元,約合人民幣5000元)。
這就意味著(zhù)這一批用戶(hù)都成了高價(jià)購買(mǎi)智商稅的“怨種”,也難怪網(wǎng)絡(luò )上一邊倒的負面評價(jià)。
對此,Humane高管急忙回應外媒The Verge稱(chēng),公司會(huì )在下個(gè)軟件版本中提高不間斷運行時(shí)間,并提高整體熱性能。
但從目前已有的信息來(lái)看,AIPin這些問(wèn)題其實(shí)基本來(lái)自硬件條件。
在去掉了實(shí)體屏幕后,AI Pin的體積并不大,但官方還是在這款硬件里塞入了攝像頭、全息投影、可以支持AI功能的處理芯片以及滿(mǎn)足續航的電池。
不過(guò)過(guò)小的體積,也意味著(zhù)這款硬件的硬件性能并不會(huì )太高,更不要說(shuō)與智能手機芯片相提并論。
既然如此,又想讓AIPin跑得動(dòng)ChatGPT,又要兼顧續航、拍照像素、相應速度等各個(gè)方面,自然是不可能。
有媒體評價(jià)說(shuō),以目前的回應效率來(lái)看,用戶(hù)使用智能手機獲得準確答案的速度,要遠快于A(yíng)IPin。而智能手機還只是使用傳統的搜索引擎。
如此來(lái)看,AI硬件雖然宣稱(chēng)利用AI Agent的能力挑戰智能手機的霸權,但自身的硬件能力還是限制了發(fā)揮。
當智能手機玩起了交互
就在硅谷推動(dòng)AI硬件的同時(shí),手機制造商、芯片廠(chǎng)商們都在思考如何讓手機用上AI。
有些廠(chǎng)商選擇把大模型塞進(jìn)手機里,主打“端側大模型”,通過(guò)直接讀取手機上的數據的方式,運行AI功能或app。
而有些廠(chǎng)商選擇從云端調用AI能力,減小本地存儲的壓力。
無(wú)論選擇本地還是云端,這些所謂的“AI手機”,本質(zhì)上仍是“用上了語(yǔ)言大模型Large language model(LLM)”的手機,手機的硬件只是一種載體,完全依賴(lài)API 接口。
一旦背后使用的LLM大模型不給力,那么用戶(hù)也很難體會(huì )到AI的真正實(shí)力。
而AIPin和Rabbit R1這樣的AI硬件,它們主打的是用戶(hù)與AI的交互能力,后者團隊更是提出了一個(gè)大型動(dòng)作模型(Large Action Model,LAM)的概念,通過(guò)理解人類(lèi)如何使用應用和服務(wù),從而完成模仿操作。
這就意味著(zhù),即使界面有所不同或稍有變化,LAM也能適應并準確地執行任務(wù),最終用戶(hù)可以?xún)H靠一個(gè)界面,代替所有的App。
想法雖好,但Rabbit R1犯了一個(gè)和AIPin同樣的錯誤——硬件配置水平實(shí)在是過(guò)于入門(mén)(2.3GHz聯(lián)發(fā)科P35芯片、4GB內存、128GB存儲空間),用戶(hù)本意上沖著(zhù)更智能的GPT而來(lái),結果往口袋里多塞一個(gè)硬件。
相比之下,智能手機不僅配置吊打這些AI硬件,而且能實(shí)現。接下來(lái),就是看手機廠(chǎng)商們何時(shí)能搞出這種類(lèi)似于LAM的“自適應系統”。
也就是在上周,蘋(píng)果發(fā)布了一篇最新的論文,推出了一個(gè)叫Ferret UI的新模型。該模型的核心正是通過(guò)讀取屏幕信息的方式,為用戶(hù)提供高質(zhì)量的UI理解和交互。
據報道稱(chēng),FerretUI的前身是一個(gè)名為Ferret的多模態(tài)模型,用于改善與語(yǔ)音助手交互邏輯。
在去年十月剛剛發(fā)布時(shí),Ferret的業(yè)界對其反響并不熱烈,主要原因還是它的區域識別與主流大模型卷的方向不同,因此大部分人都認為Ferret并沒(méi)太強的能力。
到了Ferret UI上,蘋(píng)果弱化了對話(huà)、推斷等大模型常見(jiàn)的能力,而是將重點(diǎn)放在了處理復雜的UI交互以及理解并響應用戶(hù)的指令。
那么停留交互層面上的Ferret UI,或許能力是有限的,但若是配上網(wǎng)傳的谷歌Gemini模型,那將達到“1+1>2”的效果。
從這一點(diǎn)看來(lái),Ferret UI和Rabbit R1的思路非常相似,但顯然iPhone的玩法更多、性能更強。
如果一部手機能解決AI交互,那還要AI硬件什么事呢?
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
