「產(chǎn)、學(xué)、用」如何推動(dòng)機器人新突破、強落地?——「機器人智能論壇」圓滿(mǎn)落幕
共聚云端,共話(huà)智能機器人。
8月27日下午,“機器人智能論壇”以線(xiàn)上分享的形式圓滿(mǎn)舉行。
該活動(dòng)由中國人工智能學(xué)會(huì )主辦,中國人工智能學(xué)會(huì )認知系統與信息處理專(zhuān)委會(huì )、南京清湛人工智能研究院承辦,北京容天匯??萍加邢薰?、鎂客網(wǎng)協(xié)辦。
在歷時(shí)4個(gè)半鐘頭的分享環(huán)節,來(lái)自產(chǎn)業(yè)、學(xué)術(shù)和應用三個(gè)方向的嘉賓,構成了一個(gè)產(chǎn)學(xué)用全方位的“三方對話(huà)”,圍繞智能機器人相關(guān)主題帶來(lái)了各自的精彩分享。
陳學(xué)超 北京理工大學(xué)機電學(xué)院教授、博士生導師
——仿人機器人高動(dòng)態(tài)跳躍運動(dòng)關(guān)鍵
在陳學(xué)超看來(lái),仿人機器人是智能機器人的一種高級形態(tài),具有兩手、兩腿、頭部和軀干等人類(lèi)外形顏色特征,整機有30至60個(gè)自由度,有著(zhù)復雜的多體動(dòng)力學(xué)系統,在公共安全、國防、社會(huì )服務(wù)等領(lǐng)域應用前景廣泛。
回顧仿人機器人發(fā)展歷程大事記,自1973年日本早稻田大學(xué)研發(fā)出首臺可行走仿人機器人之后,包括日本本田公司的ASIMO、波士頓動(dòng)力公司的Altas等都是里程碑式的產(chǎn)品。
而從自身研究項目出發(fā),陳學(xué)超表示跳躍能力對仿人機器人增長(cháng)運動(dòng)敏捷性和環(huán)境適應性有著(zhù)重大意義,意味著(zhù)機器人能夠在室內外、野外環(huán)境中做到跑得快、跳得高,同時(shí)能夠執行多種靈巧作業(yè)任務(wù)。其中所涉及的核心部件和多模態(tài)運動(dòng)技術(shù),也是其匯童仿人機器人項目當下的研究重點(diǎn)。
陳學(xué)超闡述道,經(jīng)過(guò)對跳躍運動(dòng)階段劃分并進(jìn)行特點(diǎn)分析后得到總結,機器人:
起跳階段——要求硬件本體需要做到大力矩、高轉速,規劃、控制方面做到協(xié)全身、精跟隨;
落地階段——要求硬件本體需要做到強回驅?zhuān)巹?、控制方面做到柔?zhù)地。
這一前提下,陳學(xué)超也指出,傳統仿人機器人關(guān)節(電機+諧波)力矩達到,但轉速低、回驅性弱,無(wú)法滿(mǎn)足需求,一般四足機器人關(guān)(電機+行星)也因為力矩小而難以適用。針對這一點(diǎn),他也提出了一些解決方案,包括采用高磁能密度硬磁材料打造高扭矩密度電機,并基于多物理場(chǎng)綜合優(yōu)化技術(shù)提升轉矩,以及模擬人體肌肉布局作仿生跨關(guān)節耦合驅動(dòng),同時(shí)優(yōu)化變速結構比等等。
此外,針對特斯拉、小米等企業(yè)對仿人機器人的布局,陳學(xué)超表示這類(lèi)企業(yè)的入局將推動(dòng)人工智能技術(shù)在仿人機器人產(chǎn)品上的落地,進(jìn)而推動(dòng)仿人機器人整體產(chǎn)業(yè)的發(fā)展。與此同時(shí)他也指出,小米能夠在幾個(gè)月內打造一臺仿人機器人,并完成一些基本操作,也是從另一個(gè)角度告訴大家,仿人機器人研發(fā)的行業(yè)門(mén)檻較之前已經(jīng)有所降低。
葛榮駿 東南大學(xué)計算機科學(xué)與工程學(xué)院副教授
——用算法彌補國產(chǎn)成像設備硬件不足
圍繞人工智能與機器人產(chǎn)業(yè),醫學(xué)是一個(gè)繞不過(guò)去的細分市場(chǎng),其中關(guān)于影像設備成像,更是一個(gè)重點(diǎn)研究方向。
葛榮駿表示,眼下國內醫學(xué)影像設備正被國外企業(yè)壟斷,國產(chǎn)設備則存在成像質(zhì)量不足的問(wèn)題。他以CT為例,常規CT存在輻射劑量較大、軟組織分辨率較低等問(wèn)題,既會(huì )給孕婦、新生兒等高敏感人群帶來(lái)較大安全風(fēng)險,也會(huì )對其臨床應用范圍造成諸多約束,同時(shí)不同診療場(chǎng)景的CT成像也受制于采集數據信噪比低或數據稀疏不全等問(wèn)題。市場(chǎng)側,85%以上相關(guān)設備市場(chǎng)則是被國外公司GPS壟斷。
針對國產(chǎn)設備成像不足的問(wèn)題,葛榮駿表示可以通過(guò)成像算法來(lái)進(jìn)行彌補——基于不同臨床診療需求場(chǎng)景,非理想采樣條件的下優(yōu)質(zhì)CT成像算法。
圍繞這一研究,葛榮駿也指出傳統成影方法“解析重建”需要高質(zhì)量且完整的投影數據,無(wú)法應對低劑量和不完備數據重建,且特征提取能力弱,容易引起二次偽影,同時(shí)迭代速度慢,科學(xué)挖掘點(diǎn)少。
在這一基礎上,基于特征學(xué)習的CT成像算法受到關(guān)注,包括基于單層特征學(xué)習的字典學(xué)習算法、基于深度特征學(xué)習的重建算法。其中,深度特征學(xué)習能快速、充分地利用單層特征和各級深度特征,在最終效果上優(yōu)于單層特征學(xué)習。
李雨倩 NVIDIA自主機器技術(shù)專(zhuān)家
——基于Isaac Sim平臺為機器人訓練“提速”
不管是算法開(kāi)發(fā),還是智能機器人研究,過(guò)程中總是需要大量的數據處理與模型測試、驗證。而如果這些工作全部交由單個(gè)項目或企業(yè)來(lái)進(jìn)行,將面臨時(shí)間長(cháng)、挑戰大、成本高,以及相關(guān)場(chǎng)景中結構化環(huán)境缺失等問(wèn)題。
針對這一點(diǎn),李雨倩提出的解決方案是NVIDIA Isaac Sim,這是一個(gè)建立在數字孿生Omniverse平臺上的機器人模擬應用與合成數據生成工具,能夠提供真實(shí)準確的自然世界虛擬表示,允許導入各種對象類(lèi)型,包括CAD文件,以生成在邏輯上與現實(shí)世界無(wú)法區分的模擬環(huán)境。
李雨倩表示,在Isaac平臺,僅需要4個(gè)步驟就可以完成一個(gè)閉環(huán)應用的開(kāi)發(fā):
模型訓練——通過(guò)Isaac Replicator(形成虛擬合成數據集)、Tao Toolkit(訓練預訓練的模型)工具對機器人進(jìn)行訓練;
仿真——在整個(gè)Omniverse環(huán)境下,基于Isaac Sim對整機進(jìn)行仿真和測試,模型訓練好,整機算法測試完成之后就到第三步搭建;
搭建——在機器人本體嵌入式計算平臺Jetson上,利用Iassc ROS GEMs、RIVA、Nova Orin等來(lái)做一個(gè)整個(gè)機器人的搭建;
部署&管理——利用Triton做多個(gè)資源的調動(dòng)管理,利用CuOpt做大場(chǎng)景下機器人最優(yōu)路徑的規劃……
“實(shí)際環(huán)境測試之后會(huì )暴露出機器人本身的一些問(wèn)題和模型的不足,就可以回到第一步再完成一個(gè)訓練。”
此外,李雨倩也總結稱(chēng),該平臺有測試場(chǎng)景和樣本,可以直觀(guān)體驗Isaac Sim的一些功能;可以跟ROS生態(tài)進(jìn)行互動(dòng);增加了AI的屬性,包括強化學(xué)習等都集成在里面,基于這些優(yōu)勢,將能夠幫助大家快速搭建自己的應用,開(kāi)發(fā)一個(gè)更智能的、具有AI屬性的機器人。
王亮 NVIDIA高級解決方案架構師
——硬件加速機器人仿真與訓練
面向海量數據處理與模型測試與驗證,除了平臺層面各類(lèi)軟件工具的協(xié)助,背后的算力支撐也是不可或缺的。針對這一點(diǎn),王亮主要從NVIDIA A40和A100兩款產(chǎn)品進(jìn)行講解。
其中,提及A40就不得不提到“NVIDIA OVX”,這是為了在Omniverse中運行數字孿生模擬而創(chuàng )建的數據中心級計算系統,由8塊NvidiaA40 GPU、3塊Nvidia ConnectX-6 Dx200 Gbps網(wǎng)卡、雙Intel Ice Lake 8362 CPU、1TB系統內存和16TB NVMe存儲組成,啟用RDMA以實(shí)現最低延遲,支持精確計時(shí) (PTP),可擴展以滿(mǎn)足工作負載需求。
并且,當使用Spectrum-3交換機連接時(shí),OVX計算系統可以從包含8臺OVX服務(wù)器的單個(gè)Pod擴展到32臺OVX服務(wù)器的超級Pod。多個(gè)超級POD可以用于部署更大的仿真需求。
至于A(yíng)100,王亮表示“A100 80GB PCIE”是世界上性能最高的AI超級計算GPU,也是主流EGX服務(wù)器的靈活部署選項。性能方面,相較于上一代產(chǎn)品,面對仿真、AI訓練等應用均得到了數倍的提升。
同時(shí),王亮也提到了基于A(yíng)100打造(20臺起步)的DGX SuperPOD系統,串聯(lián)后將形成一站式AI超級計算機,基于并行計算實(shí)現大規模AI模型的構建、訓練和部署。
孫玉潔 中國兵器工業(yè)集團高級工程師
——未來(lái)機器人作戰樣式
就分類(lèi)來(lái)看,智能機器人可以分為多種類(lèi)型,工業(yè)機器人體量最大,消費級商用機器人更為貼近日常生活,特種機器人則較為少見(jiàn),其歸屬下的軍用機器人,更是“神秘”。
對此孫玉潔講到,軍用機器人依據作戰環(huán)境的不同分為地面軍用機器人、空中軍用機器人、其他軍用機器人(如無(wú)人艇、無(wú)人船等)。
提及需求,軍用機器人部隊則是需要做到三點(diǎn),分別是能夠聚焦全維感知、街區突貫、要點(diǎn)奪控、樓宇清繳等城市作戰環(huán)境,實(shí)現信息主導、火力主戰、智能主控、體系致勝,做到多域精確跨域協(xié)同。
只是就目前來(lái)看,軍用機器人部隊在構建上還存在一些短板,這也對當前業(yè)界提出了幾點(diǎn)建議:
第一,發(fā)展機器人彈性算力和可拓展的硬件平臺,設計相關(guān)接口和標準協(xié)議,基于“軟硬解難”思路,提升硬件能力;
第二,完成地面軍用機器人、空中軍用機器人及其他機器人部隊體系要素的需求論證;
第三,統籌推進(jìn)相關(guān)科技競賽,以及優(yōu)質(zhì)智能技術(shù)成果的轉化應用。
屆時(shí),比如空中機器人,將能夠做到集偵查、監視、軟干擾和硬打擊于一體,以及長(cháng)時(shí)滯空、空中戰場(chǎng)遮斷、空中格斗等等。地面機器人則將呈現“無(wú)人軍團”模式,就像電影中的機械戰士。
黃洪波 墨影科技聯(lián)合創(chuàng )始人、VP
——機器人產(chǎn)業(yè)“非標+長(cháng)尾”現象如何破局?
黃洪波以冰山作比,浮出水面的一小塊冰山是如今簡(jiǎn)單容易的項目或值得投入的大客戶(hù),但另外沉在水面下、體積占比約80%的冰山則代表著(zhù)那些無(wú)法被觸達和滿(mǎn)足的大量潛在需求機器人和自動(dòng)化改造的行業(yè)和項目。
這也導致雖然機器人市場(chǎng)各垂直場(chǎng)景的價(jià)值達到了千億級、萬(wàn)億級,大量機器人公司和集成商也僅僅是在“冰山一角”中進(jìn)行競爭。
為什么會(huì )這樣?黃洪波解釋道,機器人企業(yè)開(kāi)拓產(chǎn)品、集成商部署項目少則一兩年,多則三五年,投入資源重、周期長(cháng)、成本高迫使他們提高報價(jià)、延長(cháng)實(shí)施周期,繼而導致機器人和自動(dòng)化改造價(jià)格高、周期長(cháng)。但對于客戶(hù)來(lái)說(shuō),他們的需求是快速完成機器人和自動(dòng)化改造,降低產(chǎn)險停產(chǎn)時(shí)間,實(shí)現降本增效目的,也因此,低價(jià)格、短周期的壓力自然而然就給到了企業(yè)和集成商,最終造成機器人企業(yè)、集成商普遍存在低價(jià)競爭、虧本賺吆喝現象。“這就是一個(gè)惡性循環(huán)。”
當然,目前存在的“非標+長(cháng)尾”現象只是機器人產(chǎn)業(yè)發(fā)展過(guò)程中階段性的必然結果,“需求種類(lèi)和數量進(jìn)一步增加,單一廠(chǎng)商的能力和開(kāi)發(fā)速度逐漸無(wú)法滿(mǎn)足所有需求, 跨廠(chǎng)商系統集成又異常復雜,與此同時(shí)很多客戶(hù)想用機器人和自動(dòng)化,但需求和場(chǎng)景各不相同,導致非標+長(cháng)尾。”
至于如何破局,響應“更快滿(mǎn)足急速增長(cháng)的客戶(hù)需求、更快更簡(jiǎn)單地開(kāi)發(fā)新產(chǎn)品新功能”的趨勢,黃洪波則是提出“平臺型系統”。在其看來(lái),平臺型系統將能夠提供行業(yè)基礎共性功能,簡(jiǎn)化開(kāi)發(fā)流程, 整合上下游,進(jìn)而共同促進(jìn)行業(yè)爆發(fā)。
楊磊 南京清湛人工智能研究院執行副院長(cháng)
——“云+邊+端”架構賦能機器人視頻感知
在楊磊看來(lái),產(chǎn)業(yè)內諸多公司為機器人的感知和計算基礎都提供了杰出的支撐,但就目前來(lái)說(shuō),“感知”依舊是機器人技術(shù)發(fā)展的一個(gè)重要瓶頸。
其中,視頻感知不同于以往更多討論的機器視覺(jué),所處理的數據基本上是實(shí)時(shí)連續幀圖片序列,需要處理的數據量更大,且多數數據都沒(méi)有經(jīng)過(guò)加工處理器,落地之后更具實(shí)用性,是眼下計算機視覺(jué)與人工智能領(lǐng)域發(fā)展比較活躍的研究方向。
“相較于視頻監控,視頻感知除了要獲取數據、分析數據,還要理解視頻內容以及目標前后關(guān)系。”
而就落地來(lái)看,隨著(zhù)工業(yè)場(chǎng)景新需求的出現,傳統視頻監控已經(jīng)不足以完成安全保障等方面的新挑戰,視頻感知逐漸在工業(yè)場(chǎng)景獲得極大應用。
與此同時(shí),就機器人整個(gè)發(fā)展來(lái)看,“原先機器人平臺算力較小,存在巨大的算力障礙,而現在提出的新架構——‘云-邊-端感知架構’,依據不同場(chǎng)景需求通過(guò)云端或邊端的算力去解決算力不足的問(wèn)題,幫助進(jìn)行視頻運算和解析,這是未來(lái)發(fā)展的一個(gè)重要方向。”
針對這一點(diǎn)楊磊也說(shuō)到,清湛人工智能研究院采用“云+邊+端”架構打造了一套基于視頻行為分析的智能監造系統,在前端網(wǎng)絡(luò )中增加邊緣分析設備,基于計算機視覺(jué)深度學(xué)習技術(shù),構建專(zhuān)有的安全生產(chǎn)預警模型,是面向大型企業(yè)用戶(hù),提供簡(jiǎn)單、易用、優(yōu)質(zhì)視覺(jué)算法的開(kāi)放平臺。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
