蘋(píng)果AI,走歪了

jh 2年前 (2023-06-05)

Siri完敗ChatGPT?

WWDC大會(huì )還沒(méi)開(kāi)始,投資人先潑了盆冷水。

就在剛剛過(guò)去的周末,知名分析師郭明錤在他的最新博文里指出——投資人更關(guān)注蘋(píng)果在A(yíng)I領(lǐng)域的相關(guān)業(yè)務(wù)。長(cháng)期來(lái)看,MR頭顯成功的關(guān)鍵因素在于能否與AIGC高度整合。

自從ChatGPT火爆之后,包括微軟、谷歌在內的各家科技大廠(chǎng)都使出渾身解數推出AIGC產(chǎn)品。

而同為科技巨頭的蘋(píng)果卻顯得十分平靜,甚至有人宣稱(chēng)蘋(píng)果已經(jīng)輸掉了這場(chǎng)AI大戰。

跟不上時(shí)代的Siri,蘋(píng)果大失???

行業(yè)對于蘋(píng)果AI的批評,主要集中在語(yǔ)音助手Siri上。

在一些簡(jiǎn)單問(wèn)題上,Siri回復的答案如機器般死板。一旦加大難度,Siri就開(kāi)始答非所問(wèn),甚至只是“單純”地給出一個(gè)網(wǎng)頁(yè)鏈接,絲毫看不出AI機器人一般智能。

作為一款具有劃時(shí)代意義的語(yǔ)音助手,Siri堪稱(chēng)蘋(píng)果在A(yíng)I領(lǐng)域的最好應用。

自從2010年開(kāi)始與iPhone深度綁定之后,蘋(píng)果圍繞著(zhù)完善Siri功能,陸續收購了一系列AI初創(chuàng )企業(yè)。

但十多年過(guò)去,Siri依然保持了當初那般“純粹”,只能做一些簡(jiǎn)單的工作。

相比之下,ChatGPT、Bard等AI聊天機器人已經(jīng)可以做到有問(wèn)必答,甚至可以理解人類(lèi)語(yǔ)言的細微差別,并做出相應的反應。

不少研究機構認為,蘋(píng)果過(guò)于封閉的系統,是限制AI模型發(fā)展的重要因素。

目前,以ChatGPT為代表的新一代聊天機器人由大型語(yǔ)言模型(LLM)提供動(dòng)力,這些模型是經(jīng)過(guò)訓練的系統,能夠根據從網(wǎng)絡(luò )上抓取的大量數據集識別和生成文本。

而蘋(píng)果由于采用極其嚴苛的隱私模式,其主要功能都基于本地的命令和控制系統。

由于工程師們無(wú)法獲得實(shí)時(shí)的用戶(hù)反饋和數據,拿到的過(guò)時(shí)數據又難以利用,最終導致Siri的更新周期拉長(cháng)到6個(gè)月甚至1年。

在接受《紐約時(shí)報》采訪(fǎng)時(shí),曾在蘋(píng)果負責Siri項目的工程師John Burkey表示,由于設計的繁瑣,很難為Siri添加新功能。

他將Siri形容為一個(gè)“大雪球”,如果想要在這個(gè)數據庫中加一個(gè)單詞,它會(huì )被塞在一大堆內容之中。

為了防止Siri“胡言亂語(yǔ)”,蘋(píng)果傾向的路線(xiàn)是先讓人工團隊預先寫(xiě)出Siri的回復,而不是用AI生成——因此在遇到Siri不知道的答案時(shí),自然只能回復給用戶(hù)網(wǎng)頁(yè)鏈接。

由此可見(jiàn),Siri在當下確實(shí)是顯得過(guò)時(shí)了。

以人為本,蘋(píng)果獨特的AI路線(xiàn)

不可否認,Siri在功能上已經(jīng)完全落后ChatGPT,但由此認定蘋(píng)果的AI技術(shù)已經(jīng)完全落伍,也顯得過(guò)于絕對。

從產(chǎn)品與服務(wù)角度來(lái)看,蘋(píng)果AI其實(shí)早已滲透進(jìn)許多應用和整個(gè)操作系統里,潛移默化地改善用戶(hù)體驗。

例如,iPhone會(huì )在按下快門(mén)后一連拍下多張照片,最后根據模型算法,最終呈現出一張效果最好的照片。

又例如,FaceID的“口罩模式”在兼顧安全性和實(shí)用性的前提下可以準確識別不會(huì )機主信息,而不是因為眼鏡、口罩等遮擋而影響識別效率。

最近,蘋(píng)果宣布將在下一代iOS上推出全新無(wú)障礙功能Personal Voice,用戶(hù)能免費備份自己的聲音,iPhone、iPad和Mac用戶(hù)只需要根據提示錄制15分鐘的音頻,蘋(píng)果就會(huì )基于設備端的機器學(xué)習技術(shù)來(lái)生成和用戶(hù)一樣的聲音——這便是蘋(píng)果在生成式AI上的例子之一。

此外,此前傳言的Siri的喚醒詞由“Hey Siri”簡(jiǎn)化為“Siri”,也將于近期正式上線(xiàn),其背后同樣是蘋(píng)果在keyword spotting(語(yǔ)音喚醒)識別能力上的進(jìn)步。

……

這些實(shí)用性的小功能,我們或多或少都在蘋(píng)果的新品發(fā)布會(huì )上聽(tīng)到主持人提到,但我們很少會(huì )與AI聯(lián)想起來(lái)。

這其實(shí)是蘋(píng)果宣稱(chēng)的“Apple Brain戰略”,早已經(jīng)內置于每部iPhone中。

蘋(píng)果在A(yíng)I的另一個(gè)底氣是收購公司的數量,甚至比微軟、谷歌都要多。

據統計,從2010年收購S(chǎng)iri開(kāi)始,蘋(píng)果在10年時(shí)間里收購多達30多起AI初創(chuàng )公司,包括Shazam、primeSense、Turi、Lattice Data、Xnor.ai等五家公司的收購額都超2億元。

雖然從2021年開(kāi)始,蘋(píng)果放緩了收購AI公司的節奏,但仍然低調地拿下了AI Music、WaveOne等初創(chuàng )AI公司。

從數據上看,這些企業(yè)的收購金額都非常低,且近半數集中在語(yǔ)音識別技術(shù)、語(yǔ)音會(huì )話(huà)等方向,剩下的則與面部識別、圖像識別相關(guān),落地應用方向涵蓋Siri、FaceID、圖片、音樂(lè )、天氣等等。

至于A(yíng)R/VR、自動(dòng)駕駛等燒錢(qián)方向,蘋(píng)果雖有也涉及,但數量遠遠不及前面提到的這些方向。

從這里我們就可以看到蘋(píng)果在A(yíng)I發(fā)展領(lǐng)域的一些特點(diǎn)。

首先,蘋(píng)果幾乎不會(huì )進(jìn)行大手筆的收購,相對微軟等巨頭來(lái)說(shuō),顯得非常“小氣”。其次,收購方向都與目前的服務(wù)與產(chǎn)品十分貼合,很難看到超前布局。

這種“花小錢(qián)辦大事”的方式,其實(shí)是蘋(píng)果一貫堅持的收購理念——用初創(chuàng )公司的技術(shù)實(shí)現自身布局,完成生態(tài)建設,從而給用戶(hù)最好的體驗。

在2023年第一季度的財報電話(huà)會(huì )議上,庫克對于A(yíng)I也表示了自己的看法:“AI是一種水平技術(shù),而不是垂直技術(shù)。因此,它將影響我們擁有的每一種產(chǎn)品和每一種服務(wù)。”

據了解,蘋(píng)果將在健康、無(wú)障礙等方面推出相應的AI功能。

因此,蘋(píng)果其實(shí)一直都在關(guān)注著(zhù)AI的發(fā)展,并不能完全說(shuō)是“啞火”,只是選擇了另一條道路。

蘋(píng)果仍需生成式AI

蘋(píng)果并不是一個(gè)AI公司,因此所推出的AI產(chǎn)品為公司服務(wù)也無(wú)可否非。

靠著(zhù)多年以來(lái)對初創(chuàng )AI企業(yè)的收購,蘋(píng)果在A(yíng)I技術(shù)上其實(shí)有相當豐富的技術(shù)積累,這將幫助蘋(píng)果在A(yíng)I競賽中保持競爭力。

從用戶(hù)的角度上看,蘋(píng)果對于“個(gè)人實(shí)用主義”的行為的確值得尊敬,但由于過(guò)于強調隱私的特性,對于未來(lái)吸引頂尖AI人才來(lái)說(shuō)其實(shí)并無(wú)幫助。

一方面,生成式AI已經(jīng)是當下的潮流,背道而馳并不是一個(gè)很好的選擇。另一方面,蘋(píng)果未來(lái)的業(yè)務(wù)同樣需要大模型的支持,包括MR頭顯,也包括未來(lái)可能推出的Siri 2.0。

隨著(zhù)庫克離開(kāi)蘋(píng)果的日子越來(lái)越近,蘋(píng)果在A(yíng)I方向的選擇或許會(huì )發(fā)生改變。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到