AIIA人工智能開(kāi)發(fā)者大會(huì )即將開(kāi)幕,熱議AI計算架構和芯片

溫暖 7年前 (2018-10-09)

面向自主智能體的計算架構還有很長(cháng)的路要走。

中興事件的爆發(fā),讓公眾意識到芯片行業(yè)亟待發(fā)展。近年來(lái),AI芯片成為了各大科技巨頭和創(chuàng )業(yè)公司的布局重點(diǎn)。前有百度推出了名為“昆侖”的AI芯片,后有阿里巴巴在云棲大會(huì )宣布成立的半導體獨立新公司“平頭哥”。無(wú)論是芯片或者AI芯片,今年專(zhuān)屬它們的“戲”可謂你方唱罷我登場(chǎng),熱鬧非凡的同時(shí),在技術(shù)研發(fā)上也帶給了從業(yè)者更多的思考。

即將于10月15日在蘇州舉行的2018 AIIA人工智能開(kāi)發(fā)者大會(huì ),就將圍繞人工智能當前的技術(shù)、產(chǎn)品研發(fā)、商業(yè)落地、產(chǎn)業(yè)發(fā)展等多方面、多維度展開(kāi)交流與討論。大會(huì )拉開(kāi)帷幕前夕,鎂客網(wǎng)特地邀請到了本次大會(huì )嘉賓、即將在大會(huì )論壇進(jìn)行演講的西安交通大學(xué)副教授任鵬舉,分享他關(guān)于面向自主智能體的計算架構新的思考。

AIIA人工智能開(kāi)發(fā)者大會(huì )即將開(kāi)幕,熱議AI計算架構和芯片

圖 | 西安交通大學(xué)副教授任鵬舉

解決非完整觀(guān)測、復雜場(chǎng)景、開(kāi)放環(huán)境下的智能體交互難題

任鵬舉表示:“當前面向完整觀(guān)測、簡(jiǎn)單場(chǎng)景應用的AI計算架構發(fā)展迅速,相對成熟。比如,人臉解鎖、語(yǔ)音控制芯片等。這類(lèi)AI芯片往往面向的是完整信息和簡(jiǎn)單場(chǎng)景的應用。但面向復雜場(chǎng)景、非完整觀(guān)測、以及更加開(kāi)放的環(huán)境時(shí),智能體的大腦——芯片處理架構的發(fā)展還遠遠無(wú)法滿(mǎn)足應用的需求。必須要有一些新的探索和開(kāi)拓性的工作,才有可能讓智能體在開(kāi)放的環(huán)境中,更好的完成任務(wù)以及與人進(jìn)行交互。”

“面向自主智能體的計算架構思考”這一論壇報告,正是圍繞這一挑戰,將課題組在這方面的探索和思考與觀(guān)眾分享。

眾所周知,當前的AI芯片的商業(yè)化落地應用,如人臉識別、智能音箱等,都是基于完整觀(guān)測、簡(jiǎn)單場(chǎng)景的應用。而任鵬舉帶領(lǐng)的研究團隊專(zhuān)注于面向自主智能體的計算架構和芯片設計,這類(lèi)應用的主要特點(diǎn)是Agent需要與環(huán)境不斷的發(fā)生交互行為。Agent具體的形態(tài)可以是無(wú)人機、無(wú)人小車(chē),人形機器人等,本質(zhì)在于需要跟環(huán)境不斷進(jìn)行交互,其面向的環(huán)境更加開(kāi)放且具有一定的特殊需求。

AIIA人工智能開(kāi)發(fā)者大會(huì )即將開(kāi)幕,熱議AI計算架構和芯片

“具體來(lái)講,這一類(lèi)應用,Agents的觀(guān)測是非完整的。對比來(lái)講:iphone的人臉解鎖就需要把臉部完全顯示在屏幕中才能夠進(jìn)行識別,發(fā)生遮擋時(shí),解鎖功能就無(wú)法正常工作。而開(kāi)放環(huán)境下的交互Agent,由于傳感器安裝在智能體上,受空間的限制,很難將所有的環(huán)境信息完整的一次性觀(guān)測到。尤其是環(huán)境中多個(gè)智能體交互的時(shí)候,如何做到高效、低延遲的通訊和協(xié)作,這樣的工作模式和交互方式是一個(gè)比較大的挑戰。我們認為它是AI智能芯片的另一個(gè)重要應用。”

2017年,在科技部頒發(fā)的“新一代人工智能”中,鄭南寧院士提出:“混合增強智能”是指將人的作用或人的認知模型引入人工智能系統,形成“混合增強智能”的形態(tài)。這種形態(tài)是人工智能可行的、重要的成長(cháng)模式。“混合增強智能”有兩個(gè)核心:一是人在回路,即整個(gè)人工智能系統的方案設計、服務(wù)對象、評判對象都是人類(lèi),需要人的參與;另一種則是將人的認知模型借鑒到計算系統中。

“我們的思考正是基于此,在面向無(wú)人自主系統中提出一個(gè)創(chuàng )新點(diǎn)叫做‘認知計算引擎’。具體來(lái)講,它包括兩個(gè)關(guān)鍵技術(shù),一、形成認知地圖用于情境理解以及多智能體交互;二、事件處理和選擇性注意機制。”

認知地圖用于情境理解和多智能體交互

如何理解認知地圖呢?舉例來(lái)說(shuō),有朋友來(lái)找我,我會(huì )告訴他“從西安交大南門(mén)進(jìn)來(lái),會(huì )看到思源活動(dòng)中心,沿著(zhù)活動(dòng)中心左邊的路往前走,會(huì )看到一個(gè)丁字路口,在西北角有一個(gè)5層的灰色建筑叫科學(xué)館,我的辦公室在211。”相比于常見(jiàn)的百度地圖而言,我剛剛描述的就是一個(gè)高度概括的語(yǔ)義地圖,我的朋友可以很好的理解這個(gè)地圖并且可以找到我的辦公室。我們課題組想做的就是將自然場(chǎng)景高效表達為這樣一類(lèi)的認知地圖,然后通過(guò)緊湊的數據結構進(jìn)行表達,進(jìn)而進(jìn)行計算、存儲以及通訊。

事件處理驅動(dòng)和選擇性注意機制

他特意以駕駛行為為例,介紹事件處理驅動(dòng)和選擇性注意機制:當司機在駕駛汽車(chē)的時(shí)候,需要向右拐,那么,他需要觀(guān)看右側后視鏡,因為擔心右后方有來(lái)車(chē),其向右拐的時(shí)候可能會(huì )影響到他人。這一類(lèi)信息處理的注意力過(guò)程是和任務(wù)相關(guān)的,是由任務(wù)決定的下意識執行的選擇性操作,我們稱(chēng)之為自頂向下的選擇性注意;另一類(lèi)選擇注意機制則是,司機在駕駛的過(guò)程中,路上突然竄出來(lái)一臺車(chē),司機的注意力會(huì )被突然出現的目標所吸引。這時(shí),司機會(huì )估計突然竄出的車(chē)是否會(huì )闖入在自己的行駛路徑當中。從而做出相應的判斷和行為,這類(lèi)信息處理的注意力過(guò)程是應對突發(fā)事件和場(chǎng)景變化的,我們稱(chēng)為自底向上的選擇性注意。選擇性注意機制從本質(zhì)上講,就是大腦面對復雜任務(wù)時(shí)的資源調配和調度,大腦總會(huì )用最經(jīng)濟、最高效的方式管理腦神經(jīng)的處理能力、記憶以及相關(guān)的功能信息通訊。

“我們認為選擇性注意機制和語(yǔ)義地圖都可以更好的調配、調度現有的計算、存儲和通訊資源。所以,我們希望可以把這種認知計算引擎引入到面向智能體的計算架構設計上來(lái),這將是我們未來(lái)主要的工作內容。”

當下,AI芯片在進(jìn)行發(fā)布時(shí)往往強調算力數據。在任鵬舉看來(lái),這種計算過(guò)度強調算力而缺乏效率為引導,其希望在認知計算模型方面探索相應的AI計算架構和芯片設計方法期待擁有同樣算力的情況下,可以處理更多、更復雜的任務(wù)。

最后,當提到關(guān)注智能體的相關(guān)技術(shù)與商業(yè)應用落地的融合性時(shí),他表示,目前融合的狀態(tài)并不是非常理想。因為AI有兩個(gè)公認的挑戰,一個(gè)是條件問(wèn)題,即很難列舉出一個(gè)行為的所有先決條件,在確定的、相對靜態(tài)的環(huán)境中能夠很好給定先決條件。而面對開(kāi)放的、動(dòng)態(tài)的、交互的環(huán)境時(shí),做到這一點(diǎn)非常困難;另外一個(gè)則是分支問(wèn)題,即難以列舉出一個(gè)行為產(chǎn)生的所有影響,特別是間接影響。目前,無(wú)論是人形機器人、康復機器人還是醫療機器人,這類(lèi)機器人大多是由工程師提前編程好的固定執行軌跡和策略,因此,在產(chǎn)量巨大和應用場(chǎng)景相對固定的情況下,如:汽車(chē)加工車(chē)間的機械臂可以很好的完成任務(wù)和分攤成本。但面對產(chǎn)量不是很大的定制場(chǎng)景、靈活性和自主性要求比較高的情況下,融合狀態(tài)還不是很理想,主要原因就是相關(guān)的技術(shù)還不成熟。因此,當前的智能體還有很長(cháng)的路要走。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到