AI+機器人!當機器人碰上大模型,將帶來(lái)哪些變革? | 研報推薦
疊加AI大模型(特別是多模態(tài)AI大模型)的賦能,移動(dòng)機器人的能力有望大幅提升。
進(jìn)入2024年,機器人領(lǐng)域迎來(lái)了一場(chǎng)大爆發(fā),科技巨頭們紛紛帶來(lái)驚艷的演示視頻,展示出令人瞠目結舌的產(chǎn)品。
這其中,大部分視頻展示的是外表酷似人形的“具身智能體”,它們可以完成各類(lèi)復雜任務(wù)。
然而,這些演示視頻也引發(fā)了不少的爭議,有人懷疑這些機器人是否真的在自主執行任務(wù)。
例如斯坦福大學(xué)推出的Mobile ALOHA系統機器人,就被曝出是真人遠程操作,在自主模式下曾多次“翻車(chē)”,可見(jiàn)AI機器人離落地應用還有很大差距。
不過(guò)在工業(yè)制造、倉儲物流等場(chǎng)景里,工業(yè)機器人已經(jīng)在大模型(LLM)的加持下展現出一定的智能性與自主性。
在近期國投證券發(fā)布的報告《人工智能行業(yè)專(zhuān)題:大模型帶來(lái)機器人變革》一文里,分析師以“AMR機器人”為例,介紹了大模型給工業(yè)機器人帶來(lái)的影響與變革。
以下內容為報告重點(diǎn)內容精選:
AMR行業(yè)快速增長(cháng),軟件和算法是核心
(鎂客網(wǎng)注:在此部分,分析師介紹了AMR機器人的定義、技術(shù)路徑、技術(shù)核心等內容,并介紹了英偉達等海外大廠(chǎng)的AMR機器人方案。)
移動(dòng)機器人,指在復雜環(huán)境下工作,具有自行組織、自主運行、自主規劃的智能機器人,主要可以分為自主移動(dòng)機器人(AMR)、關(guān)節型機器人、人機協(xié)作機器人等。
根據GGII數據,從全球維度來(lái)看,22年全球移動(dòng)機器人市場(chǎng)規模約292億,預計27年增長(cháng)至1874億元,對應22-27年CAGR為45.07%;
從國內維度來(lái)看,22年中國移動(dòng)機器人市場(chǎng)規模約97億元,預計27年增長(cháng)至462億元,對應22-27年CAGR為36.74%,市場(chǎng)規??焖僭鲩L(cháng)。
其中,自主移動(dòng)機器人(AMR)是一種能夠獨立理解環(huán)境并在環(huán)境中移動(dòng)的機器人。
AMR與其前身自動(dòng)導引車(chē) (AGV) 不同,后者依賴(lài)于軌道或預定義路徑,并且通常需要操作員監督。而AMR使用一組復雜的傳感器、人工智能、機器學(xué)習和計算來(lái)進(jìn)行路徑規劃,以解釋和導航其環(huán)境,不受有線(xiàn)電源的束縛。
AMR的背后有兩大關(guān)鍵技術(shù)路徑:
1、容器化的SDK工具集——包含感知、導航軟件堆棧;好用的開(kāi)發(fā)環(huán)境,模擬工具;后續優(yōu)化升級Containers;
2、邊緣微服務(wù)器支撐——包括無(wú)線(xiàn)通信,安全設備,協(xié)作SLAM Fleet管理。
AMR技術(shù)核心:
1、架構
(1)AMR本體能力:具備傳感和智能路徑規劃,運動(dòng)控制、安全和人機交互HMI,機器視覺(jué)和智能導航等能力, 賦能制造業(yè)向柔性化、智能化發(fā)展。
(2)云端交互任務(wù)處理:AMR本體通過(guò)網(wǎng)絡(luò )(WIFI/以太)與云端計算中心交互,在云端完成數據分析,推理,模擬等工作,需要云端AI芯片支持(例如英偉達H100等)。
(3)架構組成:目前主要由控制系統、導航傳感系統、驅動(dòng)模塊、安全監測模塊、交互模塊、通訊模塊、動(dòng)力模塊(電池等)、執行機構(機械裝置)組成,不同場(chǎng)景品類(lèi)的機器人對配置要求不同。
2、硬件
硬件部分主要包括TMT零部件(控制系統相關(guān)硬件、導航傳感器、驅動(dòng)模塊、通訊模塊等)、電池(動(dòng)力模塊)、機械裝置(執行機構等),隨著(zhù)定位導航、機器視覺(jué)、規劃執行等環(huán)節對芯片需求的增長(cháng),以及激光雷達等新型傳感器的應用,機器人中TMT零部件的價(jià)值量持續提升。
未來(lái),AI將走出計算機,進(jìn)而影響外部世界(物理世界),而機器人是AI最佳載體之一;隨著(zhù)智能機器人的發(fā)展,機器人傳感器、執行器將同AI相結合,具備模擬(用于仿真的虛擬空間)、映射(實(shí)時(shí)地圖創(chuàng )建能力)、自主(獨立運行)等能力,需要強大的端側算力支撐,移動(dòng)GPU嵌入AMR本體是發(fā)展趨勢。
3、軟件、算法
在實(shí)際應用中,移動(dòng)機器人通常以集群的方式系統完成特定任務(wù);
未來(lái),成百上千臺機器人規劃化集群作業(yè)是發(fā)展的必然趨勢,即逐步從單體智能向群體智能演進(jìn),軟件和算法成為構筑核心競爭力的壁壘,例如統一環(huán)境下完成作業(yè)調度、找到全局最優(yōu)方案提升集群機器人工作總效率等。
因此分析師認為,隨著(zhù)行業(yè)應用場(chǎng)景的豐富和技術(shù)的發(fā)展,產(chǎn)品模塊化、軟件模塊化將成為AMR發(fā)展的必然趨勢。
目前,端側(即機器人本體)軟件、算法主要有ROS 2、地圖規劃算法、AI算法、樣點(diǎn)算法等,支撐路徑規劃、障礙躲避、運動(dòng)控制等功能;
而云側(及邊緣)軟件、算法主要有集群管理算法、訓練、遠端推理、遠端SLAM、數據分析算法等,支撐算力調度、機器人集群協(xié)作、數據分析等功能。
目前,各頭部廠(chǎng)商擁有自己的解決方案,技術(shù)路徑隨大模型的發(fā)展,快速迭代。
以Intel為例,其提供相應的開(kāi)發(fā)工具和平臺,使開(kāi)發(fā)者可以快速、低成本地搭建、管理AMR機器人。
除此以外,英偉達旗下的ISAAC集成式端到端解決方案、Jetson系列產(chǎn)品以及特斯拉的FSD+Dojo都是目前業(yè)內比較領(lǐng)先的解決方案。
值得一提的是,當前機器人價(jià)值鏈劃分里面沒(méi)有智能系統。
分析師認為,機器人是典型的機電軟一體化產(chǎn)品,軟件與硬件是相互限制又相互促進(jìn)的矛盾體;邊緣算力硬件將會(huì )制約機器人相關(guān)應用的發(fā)展,邊緣算力硬件的突破使得機器人可以承載更強大的AI,同時(shí)機器人應用的發(fā)展會(huì )倒逼邊緣算力硬件的提升。
當下的機器人智能停留在視覺(jué)(vision)階段,機器人缺乏智能系統(即機器人的大腦);在未來(lái),在A(yíng)I對機器人賦能的大背景下,機器人可以逐步理解物理世界,未來(lái)有可能向具身智能方向發(fā)展,智能系統對機器人的重要性愈發(fā)凸顯。
巨變:多模態(tài)大模型賦能機器人
(鎂客網(wǎng)注:在此部分,分析師介紹了多模態(tài)大模型如何賦能機器人。)
多模態(tài)大模型賦能機器人,主要體現為多模態(tài)感知和多模態(tài)交互。
• 多模態(tài)感知:通過(guò)多類(lèi)型傳感器的配合,機器人處理多個(gè)模態(tài)接收的信息,從而實(shí)現對文本、圖像、視頻、音頻等模態(tài)信息的學(xué)習和理解。
• 多模態(tài)交互:用戶(hù)可以同時(shí)使用語(yǔ)音、手勢、文本等與機器人交互,同單模態(tài)交互相比,多模態(tài)交互具有減輕用戶(hù)認知負擔(交互更自然)、消除任 務(wù)歧義(交互更準確)、降低環(huán)境干擾(交互更加魯棒)等優(yōu)勢,使交互更加靈活和高效。
此外,大語(yǔ)言模型(LLM)賦能機器人語(yǔ)義理解,從傳統的關(guān)鍵詞語(yǔ)義識別,進(jìn)化到可以理解人類(lèi)復雜的語(yǔ)音命令;同時(shí),通過(guò)預訓練大模型將“記憶”移植到智能機器人終端,機器人具備理解任務(wù)的能力。
由于機器人本體計算能力有限,需要通過(guò)強大的云端計算能力給機器人賦能。由此構成了“云-網(wǎng)-端”架構
“端”:是機器人本體及本體自身的控制系統,嵌入式AI芯片逐步替代傳統嵌入式芯片,機器人本體的智能性快速提升;
“網(wǎng)”:主要指通過(guò)Wifi、5G及其他無(wú)線(xiàn)通信網(wǎng)絡(luò )將機器人連接起來(lái),實(shí)現機器人本體和云端大腦的連接;
“云”:通過(guò)機器學(xué)習,不斷進(jìn)化,進(jìn)而使前端機器人本體的智能隨之提升。
未來(lái),隨著(zhù)模型植入機器人本體。云端大模型泛化出基本能力,并把這部分“記憶”植入機器人邊緣端(通過(guò)蒸餾等方式壓縮模型大?。?,進(jìn) 而機器人本體可以將識別到的視覺(jué)、雷達、語(yǔ)音交互數據進(jìn)行處理,并規劃動(dòng)作,完成反饋。
在該部分,分析師以Google RT2 為例,介紹了新模型如何賦能機器人執行各項任務(wù)。這是一個(gè)視覺(jué)-語(yǔ)言-動(dòng)作(VLA)模型,符號理解、推理、人類(lèi)識別等領(lǐng)域能力大幅提升,且泛化能力大幅提升。
國內機器人產(chǎn)業(yè)蓬勃發(fā)展
(鎂客網(wǎng)注:在此部分,分析師介紹了國內機器人產(chǎn)業(yè)的最新情況。)
國內機器人產(chǎn)業(yè):機器人產(chǎn)業(yè)鏈上游包括核心零部件、配套零部件和軟件系統開(kāi)發(fā),中游為機器人本體的生產(chǎn)及系統集成,目前主要集 中在工業(yè)機器人和服務(wù)機器人領(lǐng)域,下游主要包括工業(yè)應用(汽車(chē)制造、家電制造、航空航天等)和服務(wù)應用(餐飲服務(wù)、酒店服務(wù)、
醫療服務(wù)、物流服務(wù)等);近兩年一些做算法的軟件公司借助海外大模型的風(fēng),開(kāi)始自研垂直小模型,并供給下游終端廠(chǎng)。
創(chuàng )業(yè)公司情況:根據中國機器人網(wǎng)統計數據,2023年中國機器人行業(yè)共發(fā)生134起融資事件,其中近億/過(guò)億元級融資事件52起,2023年融資金額總計為200億元左右;2023年融資事件主要發(fā)生在工業(yè)機器人相關(guān)(37起左右)、醫療機器人(29起左右)、服務(wù)機器人(24起左右)、人形機器人(12起左右)等領(lǐng)域。
上市公司情況:目前上市公司以提供終端硬件為主,并逐步優(yōu)化機器人軟件(模型、算法等),提升機器人性能表現。
在此部分,研報列舉了??禉C器人等國內多家優(yōu)秀機器人企業(yè),這里就不詳細展開(kāi)介紹。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
