硬紀元AI峰會(huì )實(shí)錄|華捷艾米沈瑄:端加云才是AI和AR的未來(lái)

韓璐 8年前 (2017-07-18)

關(guān)于人機交互,關(guān)于A(yíng)I和AR的未來(lái),我們應該如何看待?

2017年7月9日,由鎂客網(wǎng)、振威集團聯(lián)合主辦的“3E‘硬紀元’AI+產(chǎn)業(yè)應用創(chuàng )新峰會(huì )”在北京國家會(huì )議中心盛大開(kāi)幕?,F場(chǎng)200位來(lái)自全球AI行業(yè)的頂級專(zhuān)家、知名創(chuàng )投機構、創(chuàng )業(yè)公司團隊和知名媒體齊聚一堂,共謀AI+行業(yè)的創(chuàng )新應用,探討AI的當下與未來(lái)。

硬紀元AI峰會(huì )實(shí)錄|華捷艾米沈瑄:端加云才是AI和AR的未來(lái)

現場(chǎng),華捷艾米聯(lián)合創(chuàng )始人沈瑄給我們帶來(lái)了主題為“3D視覺(jué)系統——打造AR&AI生態(tài)”的內容分享。沈瑄表示,未來(lái)的人機交互一定是回歸到人與人之間交流的本質(zhì),即視覺(jué)+語(yǔ)音的交互,如此才能相互理解,繼而進(jìn)行充分的交流。此外,關(guān)于未來(lái)數據應用的方式,在沈瑄看來(lái),無(wú)論是AI還是AR,端加云才是真正的未來(lái)。

以下為演講實(shí)錄(為方便閱讀,有所刪減):

大家下午好,我是南京華捷艾米的沈瑄,剛才前幾位嘉賓已經(jīng)給大家分享了非常多的干貨,其實(shí)人工智能的概念非常的廣闊,而我們只是參與了其中的一部分:機器視覺(jué)。對于機器視覺(jué)這個(gè)概念我們也覺(jué)得非常的大,從這個(gè)車(chē)牌的識別到人臉的識別,這都是屬于機器視覺(jué),而我們做的是一個(gè)3D的一個(gè)視覺(jué)。

未來(lái)的人機交互是視覺(jué)+語(yǔ)音

我們說(shuō)一下人機交互,尤其是人與機器人的交互。包括成人和小孩在內,其實(shí)我們大家都有一個(gè)機器人夢(mèng),從星球大戰到鋼鐵俠,從變形金剛到阿童木,到大白,到哆啦A夢(mèng),我們都希望身邊有一個(gè)機器人可以在生活、學(xué)習或者工作中去幫我們解決各種各樣的問(wèn)題。這就需要說(shuō)到人與機器是怎么交互的。

這就是人與機器交互的一個(gè)歷史。在50年代,我們通過(guò)鍵盤(pán)產(chǎn)生人與人、人與機器的交互,在下一階段有了windows,我們通過(guò)鼠標人與機器去交互,而在2000年左右的時(shí)候,蘋(píng)果的iPhone出來(lái)了,我們通過(guò)touch、通過(guò)觸摸即可實(shí)現人與機器的交互。

我們說(shuō)現在再下一代人與機器是怎樣去交互?是視覺(jué)加語(yǔ)音,回到人與人之間溝通的本質(zhì)。比如說(shuō)我現在跟大家在交流,通過(guò)我的臉部、手勢,通過(guò)我的肢體語(yǔ)言,大家能互相理解,去充分的交流。人機以“自然語(yǔ)言”的方式交互,包括語(yǔ)音交互、語(yǔ)音溝通作為基礎,還包括人臉、圖像、手勢、虹膜、體感等等。

無(wú)論是AI還是AR,端加云才是未來(lái)真正的解決方案

然后我介紹一下我們公司在3D、AR上面的一些工作。我們公司認為,AR是人工智能在下一階段能夠應用的一個(gè)比較好的行業(yè)。蘋(píng)果CEO庫克也說(shuō)過(guò),AR具有無(wú)限的想象空間,它打破了虛擬世界與真實(shí)世界的一個(gè)界限,是下一代人與機器交互的一個(gè)新的模式。

我們認為AR的體系應該分成三個(gè)步驟去實(shí)現:第一是基礎技術(shù),包括3D的實(shí)時(shí)測量、V-slam、人體動(dòng)作識別和手勢識別等等,這些基本的一些活動(dòng)的元素;到了第二代會(huì )具備一些娛樂(lè )性的要素,包括換臉、3D美顏等;最后一步則是會(huì )實(shí)現真正智能化的AR的系統,那可以通過(guò)身高、體型、年齡、性別甚至情緒的識別、通過(guò)深度學(xué)習以及物聯(lián)網(wǎng)等各種新的技術(shù)來(lái)達到最終的一個(gè)智能化AR系統。

我們現在的芯片是把所有的數據放在里面,主要是在端這邊來(lái)識別跟計算,而在未來(lái),我們會(huì )把云端去打通,也是基于思科在2015年提出的霧計算或者是邊緣化計算的這種理想?,F在的移動(dòng)化設備人人都有,全球可能有20億部手機,到了一定階段,這個(gè)數量會(huì )乘以至少7到8倍,也就意味著(zhù)有140億到150億的終端要連接到云端,而其中所需的傳輸能力跟計算能力是現在的基礎架構所實(shí)現不了的。思科在15年的時(shí)候提出了這個(gè)霧計算,就是在IOT的智能終端上把更多的計算,尤其是前端的一些計算放在端的芯片里,然后實(shí)時(shí)去上傳一些預處理以后的數據,而從云端下載下來(lái)的是更新過(guò)的通過(guò)深度計算更新過(guò)的一些算法的模型。

所以我們認為,無(wú)論是人工智能還是AR,端加云才是未來(lái)真正的解決方案,通過(guò)終端上傳數據到云下載數據,這種簡(jiǎn)單的模式肯定是遠遠不夠的。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到