避免淪為“人工智障”,機器人還需找對語(yǔ)音交互的“打開(kāi)方式”

韓璐 8年前 (2017-09-21)

特定場(chǎng)景進(jìn)行特定培訓,這是打造更連貫、更自然的人機語(yǔ)音交互的一個(gè)解決途徑。

“iPhone的市場(chǎng)占有率是多少?”

—“目前80%。”

“那華為的呢?”

—“怎么都喜歡華為?”

以上是發(fā)生在鎂客君與某一語(yǔ)音交互機器人之間的對話(huà)。

避免淪為“人工智障”,機器人還需找對語(yǔ)音交互的“打開(kāi)方式”

你來(lái)我往之間,那些令人“頭痛”的瞬間

在日常生活中,通過(guò)語(yǔ)音交互技術(shù),我們能夠與機器人進(jìn)行交流,或者是讓后者實(shí)時(shí)控制一些家居產(chǎn)品;在辦公時(shí)間,借助于語(yǔ)音交互技術(shù),我們也能夠直接口頭交代語(yǔ)音助理一些工作,從而提升工作效率……

可以說(shuō),隨著(zhù)背后語(yǔ)音識別和自然語(yǔ)言處理技術(shù)的逐步提升,人們對于“語(yǔ)音交互”這一人機交互方式正在變得漸漸適應。不過(guò),在你來(lái)我往的語(yǔ)音對話(huà)之間,我們也不可避免的也遇到了一些有時(shí)令人“哭笑不得”的BUG。

2017國家服務(wù)機器人產(chǎn)業(yè)高峰論壇于近日落下帷幕,在圓桌環(huán)節的自由問(wèn)答時(shí)間,有人提出一個(gè)問(wèn)題,稱(chēng)當前的服務(wù)機器人在人機語(yǔ)音交互的過(guò)程中,常常會(huì )詞不達意,或者是出現上下文不連貫的問(wèn)題,導致最終的用戶(hù)體驗不佳??梢哉f(shuō),這是當前人機交互上最“頭痛”的問(wèn)題,也是導致人工智能被冠上“人工智障”稱(chēng)號的根本原因。

避免淪為“人工智障”,機器人還需找對語(yǔ)音交互的“打開(kāi)方式”

避免“人工智障”,我們目前需要將機器人關(guān)在“籠子”里

談及這種“人工智障”現象,其中主要涉及自然語(yǔ)言處理和深度神經(jīng)網(wǎng)絡(luò )的一個(gè)問(wèn)題。

一般情況下,基于自然語(yǔ)言處理技術(shù),人工智能系統即能夠對人們的語(yǔ)句進(jìn)行拆分和處理,從而做到“理解”這句話(huà),繼而對用戶(hù)作出相應的回應。至于上下文連貫,這其中主要關(guān)乎深度神經(jīng)網(wǎng)絡(luò )的一個(gè)搭建,換一種說(shuō)法,主要是“知識圖譜”在起作用。仍以本文最開(kāi)始的對話(huà)為例:

“iPhone的市場(chǎng)占有率是多少?”

—“目前80%。”

“那華為的呢?”

—“目前是xx%。”

在深度神經(jīng)網(wǎng)絡(luò ),或者是知識圖譜的協(xié)助下,當我們提出第二個(gè)問(wèn)題的時(shí)候,它會(huì )將華為與上一個(gè)問(wèn)題的“市場(chǎng)占有率”進(jìn)行關(guān)聯(lián),從而做到對這一問(wèn)題更為完整、精準的理解。

事實(shí)上,為了達到更為完美、自然的人機交互體驗,難道人工智能企業(yè)就沒(méi)有搭建深度神經(jīng)網(wǎng)絡(luò )、構造知識圖譜嗎?當然不是,只不過(guò)在這基礎之上,依據當前機器人的語(yǔ)音交互的整體情況,我們還需要附加一些場(chǎng)景條件。

這一塊問(wèn)題的解決還是需要根據不同的場(chǎng)景來(lái)做不同的定制,畢竟這也不是說(shuō)一個(gè)模型、一個(gè)算法就能解決好所有的問(wèn)題。武漢泰迪智慧科技有限公司創(chuàng )始人兼董事長(cháng)李成華表示。

總結一下也就是說(shuō),要想解決當前這一上下文理解不連貫的問(wèn)題,我們還需要依據特定的場(chǎng)景來(lái)對機器人進(jìn)行特定的數據訓練,從而打造一個(gè)特定機器人。舉個(gè)例子,比如智能客服機器人,其所能提供服務(wù)的領(lǐng)域包括金融、教育、酒店等多個(gè)領(lǐng)域,每個(gè)領(lǐng)域都有著(zhù)其所特有的問(wèn)題或是對話(huà)場(chǎng)景,為了保證對話(huà)的連貫,我們就得利用這些特有數據進(jìn)行培訓,構建一個(gè)面向垂直領(lǐng)域的知識圖譜,以避免問(wèn)題交叉、邏輯混亂等情況的出現。

避免淪為“人工智障”,機器人還需找對語(yǔ)音交互的“打開(kāi)方式”

面對無(wú)人駕駛的落地問(wèn)題,我們都說(shuō)低速行駛、封閉性場(chǎng)景是其當前能夠快速實(shí)現落地的一個(gè)方向,簡(jiǎn)單粗暴的說(shuō),也就是將無(wú)人駕駛汽車(chē)關(guān)在一個(gè)相對“封閉”的場(chǎng)景里。而與此類(lèi)似,要想機器人在語(yǔ)音交互上表現的沒(méi)有那么“智障”,我們也需要將其關(guān)在一個(gè)限定的“籠子”里面來(lái)實(shí)施培訓,不同的是,無(wú)人駕駛汽車(chē)的“籠子”是在真實(shí)的物理世界,而機器人則是在一個(gè)虛擬層面。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到