硬紀元AI峰會(huì )實(shí)錄|公子小白嚴漢明:這是智能機器人最好的時(shí)代
在當下這么好的人工智能時(shí)代里,我們要怎么運用技術(shù)做出一款大家都喜歡的機器人呢?
2017年7月9日,由鎂客網(wǎng)、振威集團聯(lián)合主辦的“3E‘硬紀元’AI+產(chǎn)業(yè)應用創(chuàng )新峰會(huì )”在北京國家會(huì )議中心盛大開(kāi)幕?,F場(chǎng)200位來(lái)自全球AI行業(yè)的頂級專(zhuān)家、知名創(chuàng )投機構、創(chuàng )業(yè)公司團隊和知名媒體齊聚一堂,共謀AI+行業(yè)的創(chuàng )新應用,探討AI的當下與未來(lái)。
來(lái)自公子小白的創(chuàng )始人嚴漢明,在峰會(huì )期間進(jìn)行了主題為“這是智能機器人最好的時(shí)代”的主題演講。嚴漢明表示,目前的人工智能還無(wú)法做到遷移學(xué)習,舉一反三,它仍舊處于高感知、低認知的狀態(tài)。我們要做的,就是讓它具備分析和推理能力,并具備多項功能。
以下為演講實(shí)錄(為方便閱讀,有所刪減):
剛剛陳博士講的非常好。在之前的圓桌論壇上,專(zhuān)家們也都就人工智能這一領(lǐng)域的現狀和發(fā)展方向做了深入的探討。那我就結合公子小白的產(chǎn)品研發(fā)經(jīng)驗和應用場(chǎng)景與大家一起探討一下,在當下這么好的人工智能時(shí)代里,我們要怎么運用技術(shù)做出一款大家都喜歡的機器人呢?
目前市面上所推出的關(guān)于語(yǔ)音智能類(lèi)的交互產(chǎn)品,例如蘋(píng)果的HomePod、亞馬遜的Echo、谷歌的Google Home。而就國內來(lái)說(shuō),包括近期阿里推出的天貓精靈、喜馬拉雅的小雅等,都是比較貼近人了生活的人工智能產(chǎn)品。
人工智能目前仍舊處于高感知、低認知的狀態(tài)
人工智能技術(shù)很廣,包括圖像識別、語(yǔ)音識別等,已經(jīng)有了其非常成熟的商業(yè)模式了,甚至有些已經(jīng)開(kāi)始盈利。例如,在語(yǔ)音識別領(lǐng)域,我們國內的巨頭科大訊飛、百度等,都在做著(zhù)非常大的布局和商業(yè)化嘗試。那更往前一部,自然語(yǔ)言處理又是什么呢?
人工智能實(shí)質(zhì)上就是在深度的神經(jīng)網(wǎng)絡(luò )上面構建的一個(gè)符號處理系統,這是我們在產(chǎn)品的探討和研發(fā)過(guò)程中總結出來(lái)的。深度學(xué)習可以解決機器的學(xué)習問(wèn)題,例如你給它一些圖片、聲音素材等數據,并對它進(jìn)行訓練之后,就可以讓它很快的掌握一個(gè)單一的技能。
然而,人類(lèi)不只能深度學(xué)習,還具備增強學(xué)習和遷移學(xué)習的能力,也就是我們所說(shuō)的舉一反三。但目前機器人不具備這個(gè)能力,所以在讓機器學(xué)會(huì )簡(jiǎn)單學(xué)習之外,我們需要通過(guò)深度學(xué)習技術(shù)讓其掌握的這些技能,包括感知的技能。像小貓小狗一樣,讓它們有視覺(jué),聽(tīng)覺(jué),還會(huì )自己保持平衡等等。
從原始社會(huì )打結記事算起到今天,我們除了通過(guò)手寫(xiě)文字和電腦打字輸入等方式之外,還有很多其他的交流方式,形成了一整套非常復雜用于人類(lèi)交流的語(yǔ)言處理系統。這個(gè)系統除了可以正常地進(jìn)行表達以外,還能夠通過(guò)聯(lián)想和推理等表達含義。
結合以上所說(shuō)的,通過(guò)人工智能技術(shù)夠構建我們的學(xué)習系統,不僅可以使得深度神經(jīng)網(wǎng)絡(luò )將一些感知上的東西做得更加深入,還可以通過(guò)知識圖譜將其與人類(lèi)的認知結合起來(lái)。但目前的人工智能有一個(gè)特點(diǎn),也是其存在的問(wèn)題,就是它的圖像識別和處理能力可能比人類(lèi)還高,然而它并不具備深刻認識的能力,覆蓋率也非常的低,一個(gè)算法只能完成一件事情。例如語(yǔ)音識別算法,它只能識別語(yǔ)音,圖像識別算法也能識別圖片,雖然準確率非常高,但它不能讓一個(gè)算法同時(shí)具備語(yǔ)音識別和圖像識別兩種能力,所以它就不能進(jìn)行很好的遷移學(xué)習。
當然了,它的效率非常高,像AlphaGo一樣,已經(jīng)超過(guò)了人類(lèi)最大的運算能力,但它的綜合決策能力就很弱了。不過(guò)對于下棋來(lái)說(shuō),規則比較單一,所以它能夠做的很好。那如果讓它來(lái)處理一些事情或者一國的政治呢,它就很難去決策了。因為這些事情里面包含了非常多的因素和非常多的條件所限制,目前人工智能技術(shù)是做不到的,它目前還處于高感知、低認知的這樣一個(gè)狀態(tài)。
弱人工智能時(shí)代,產(chǎn)品落地需要更符合人性需求
在這樣的一個(gè)情況下,我們怎么在弱人工智能時(shí)代,將產(chǎn)品落地呢?像打卡門(mén)禁的這種人臉識別系統或者指紋識別系統,它也可以用到人工智能的技術(shù),但它是很封閉的、很單一的一個(gè)領(lǐng)域;如果再發(fā)散一點(diǎn),往娛樂(lè )化的方向去走,例如直播系統,其實(shí)也用了一些信號處理或者是圖片壓縮等的人工智能處理的技術(shù)。
經(jīng)過(guò)四年的摸索,我們決定要做一些符合人性的產(chǎn)品,做一些虛擬的生命,通過(guò)人工智能技術(shù),促進(jìn)人工智能產(chǎn)業(yè)閉環(huán)。那我們怎樣才能在當前的技術(shù)基礎上通過(guò)技術(shù)組合產(chǎn)生一個(gè)有生命感的虛擬產(chǎn)品呢?目前,還沒(méi)有一個(gè)產(chǎn)品可以擁有很多功能,可以播放、投影、打乒乓球、端茶倒水,又可以給你唱歌跳舞等。比方說(shuō)我們在家里最常見(jiàn)的掃地機器人,它目前是機器人行業(yè)里面運用最大而且產(chǎn)量最高的一款產(chǎn)品,但它的功能也只是掃地,不能完全的多樣化。很多的國內的主打娛樂(lè )的產(chǎn)品,所想到的只是跟低齡化人群相結合,比方說(shuō)我們看的喜羊羊、熊大熊二,這些IP比較適合小孩子,不能覆蓋到全部的人群。
基于以上的分析和梳理,我們打造了一個(gè)能夠進(jìn)行自然語(yǔ)言交流和用三維虛擬成像去顯示的虛擬生命——琥珀虛言。它不僅搭載了語(yǔ)音識別、手勢識別、人臉識別等技術(shù),還具備了聲紋識別和多輪對話(huà)等功能。通過(guò)將技術(shù)、用戶(hù)畫(huà)像、交互場(chǎng)景等相結合,經(jīng)過(guò)其自己的記憶推理,以三維虛擬的形式輸出顯示。
我們還有款產(chǎn)品名為helloA,它是一款的三維全息360適度的機器人,所扮演的是一個(gè)三維虛擬的女孩子。它是通過(guò)結合AI和VR,用虛擬的方式把人體數字化打碎,再利用技術(shù)將這些數據進(jìn)行組合后所顯示出來(lái)的。與其他實(shí)體機器人相比,它的場(chǎng)景、動(dòng)作和情感表達方式更為豐富,且成本較低,關(guān)節的能動(dòng)性也較好。
我們還有一款機器人,公子小白,一共是兩個(gè)機器人,一個(gè)叫公子,一個(gè)叫小白。我們認為,這是男生買(mǎi)給女生的最好的禮物。以?xún)蓚€(gè)機器人為紐帶,來(lái)表達和維系男女朋友在戀愛(ài)過(guò)程中的一些很微妙的感覺(jué),例如表達關(guān)懷和愛(ài)意等。這有別于現在的微信、短信、電話(huà)等,仿佛讓我們回到了以前上學(xué)時(shí)候寫(xiě)信或者是交筆友時(shí)的狀態(tài),而這種種朦朧和距離的感覺(jué)更能夠牽動(dòng)情侶直接的感情。
除了機器人以外,我們還做了一些行業(yè)定制解決方案。比方說(shuō)我們?yōu)楹:郊瘓F定制的空港小白,它可以結合航空系統提供交互訂機票、查詢(xún)機場(chǎng)狀態(tài)、航班狀態(tài)等等服務(wù)。我們還做了一些明星和藝人定制,讓這些藝人的IP款機器人跟真人進(jìn)行語(yǔ)音和視頻等溝通。此外,我們還可以通過(guò)機器人進(jìn)行社群和信息的管理。
我的分享就到這里,主要是結合我們產(chǎn)品和技術(shù)所做的一些思考,謝謝大家。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
