唱跳全能的「擎天柱」,背后其實(shí)是真人遙控?

jh 8個(gè)月前 (10-13)

跌麻了!特斯拉“We, Robot”發(fā)布會(huì )完第二天,投資者們集體用腳投票,最終股價(jià)大跌8.78%,創(chuàng )下兩個(gè)月來(lái)的最大跌幅...

跌麻了!特斯拉“We, Robot”發(fā)布會(huì )完第二天,投資者們集體用腳投票,最終股價(jià)大跌8.78%,創(chuàng )下兩個(gè)月來(lái)的最大跌幅。

有分析師表示,這次發(fā)布會(huì )雖有驚喜,但馬斯克并沒(méi)有給出細節,再結合此前多次承諾都無(wú)法實(shí)現,投資者的失望情緒可以理解。

當然,大多數人的關(guān)注點(diǎn)都放在無(wú)人駕駛車(chē)上面,其實(shí)這次推出的新款Optimus在靈活性上的進(jìn)步其實(shí)值得拿出來(lái)講一講。

從多家媒體現場(chǎng)拍攝的視頻可以看出來(lái),這次的Optimus不僅可以調酒跳舞,甚至可以聊天互動(dòng),甚至可以現場(chǎng)指揮大家給當天生日的觀(guān)眾唱生日歌,無(wú)論是語(yǔ)氣還是邏輯都非常像

事實(shí)上,昨天展示的Optimus就是由真人遠程遙控而不是自主AI,這是一種類(lèi)似VR眼鏡的設備,人類(lèi)訓練員可以進(jìn)行遠程實(shí)時(shí)操控。

VR遙控機器人,已成主流

這種利用VR技術(shù)訓練的路徑其實(shí)已經(jīng)在多家機器人平臺上被應用,比較成熟的包括Optimus以及英偉達Project GR00T,國內一些具身智能企業(yè)也開(kāi)始選擇使用真人動(dòng)捕提高機器人的靈活性。

如果單就人形機器人這一形態(tài)來(lái)說(shuō),該路徑已經(jīng)成為仿人機器人AI訓練的主流方法。

作為VR訓練機器人的帶頭人,特斯拉在今年5月的一段公開(kāi)的視頻里揭露了訓練的大致流程。

從視頻里可以看到,Optimus的訓練數據都是來(lái)自穿戴VR頭顯的人類(lèi)訓練員,這套完整的系統集成了 VR 頭顯、傳感器、手套、動(dòng)捕服和相關(guān)軟件。

通過(guò)VR頭顯,Optimus可以1: 1地復刻映射人類(lèi)操作員的動(dòng)作,而軟件可以以實(shí)現第一人稱(chēng)視頻的實(shí)時(shí)傳輸和精確控制輸出,并保持極低的延遲。

在最近,特斯拉進(jìn)一步加大了數據采集操作員(Data Collection Operator)的招募力度,這些操作員通過(guò)佩戴 VR 頭顯和使用高精度傳感器及動(dòng)作捕捉服,為機器人提供高質(zhì)量的訓練數據。

據招聘公告內容,這些操作員需要長(cháng)時(shí)間佩戴 VR 頭顯,每天步行超過(guò) 7 小時(shí),攜帶重達 30 磅(約 13.61千克)的設備,根據要求執行站立、行走等特定動(dòng)作。雖然累,但特斯拉的待遇給得是真的多,薪酬大約每小時(shí) 25.25-48 美元,另外還有股票獎勵以及福利。

當然,如此誘人的報酬,硬性要求非常高,首先就是身高、體力以及操作經(jīng)驗的三重考驗,其次長(cháng)時(shí)間操作VR設備并不是一件簡(jiǎn)單的事情。最后,從這次發(fā)布會(huì )的視頻可以看出來(lái),機器人背后的操作人員需要極快的反應能力,這一點(diǎn)能力也很難替代。當然從效果來(lái)看,由真人訓練的Optimus確實(shí)效果明顯。     

不僅是特斯拉,英偉達也將Vision Pro 納入其人形機器人平臺的訓練體系中,研究員將仿真訓練框架整合到英偉達 Omniverse 平臺和 Isaac 機器人開(kāi)發(fā)平臺,同時(shí)開(kāi)發(fā)人員能夠使蘋(píng)果 Vision Pro 來(lái)遠程操控人形機器人來(lái)執行任務(wù)。

不只是人形機器人,四足機器人也可以使用此方法。騰訊 Robotics X此前發(fā)布了基于真狗的動(dòng)捕思路,可以看到四足機器人明顯的運動(dòng)能力提升。

AI難堪大任?做好硬件更重要

你以為的Optimus代表了最先進(jìn)的AI,實(shí)際上的Optimus其實(shí)是真人遙控,而不是AI自驅的行為(autonomous)

而這也不是什么秘密,現場(chǎng)的科技媒體和機器人行業(yè)從業(yè)者都認可這一行為,也難怪投資者不感興趣。

除此以外,對比仿真、模仿等訓練方式,VR訓練在數據采集成本上非常高,并且不見(jiàn)得可以完全離開(kāi)人類(lèi)操作員。

因此,目前各家具身智能項目真正比較的其實(shí)是硬件。

以此次發(fā)布的新版Optimus為例,目前特斯拉已經(jīng)做到了22個(gè)自由度,操作上可以像真人一樣彈鋼琴,這個(gè)程度目前可以說(shuō)是領(lǐng)先全球絕大多數非實(shí)驗室企業(yè)。而特斯拉的目標是將執行器從手部完全移至前臂,最終實(shí)現像人類(lèi)那樣的工作方式。

當然,提高自由度的同時(shí),研發(fā)的成本也隨之提高。

據大摩人形機器人報告對上一代Optimus 的拆解,一雙機器手接近1萬(wàn)美元,整體BOM更是高達50-60k美元,距離馬斯克計劃的 1 萬(wàn)美元還有很長(cháng)的路,而這次的22自由度的新款機器人成本只會(huì )更高,那么所謂2-3萬(wàn)美元的成本又是在畫(huà)餅?

當然作為控制成本狂魔,馬斯克在降成本的實(shí)力有目共睹。

可以猜測一下,未來(lái)Optimus還是以硬件優(yōu)勢+人工控制為主,自主AI大概率不要指望了。

值得一提的,特斯拉的訓練算力很大一部分都放在FSD以及自家AI公司Grok,能留給Optimus的,還剩多少呢?

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到