為了理解自然語(yǔ)言,聊天機器人還要走很多“歪路”

韓璐 9年前 (2016-08-13)

為理解自然語(yǔ)言,唯有慢慢的填坑。

上周,以先進(jìn)的機器學(xué)習和自然語(yǔ)言處理技術(shù)見(jiàn)長(cháng)的聊天機器人初創(chuàng )公司Talla推出了一款HR機器人。而就在近日,其首席執行官ROB MAY在某科技網(wǎng)站撰文,指出了一些聊天機器人在自然語(yǔ)言處理上面臨的問(wèn)題,并表示,雖然自然語(yǔ)言處理技術(shù)能夠改善用戶(hù)體驗,但依舊面臨著(zhù)各種技術(shù)挑戰。

為了理解自然語(yǔ)言,聊天機器人還要走很多“歪路”

以下是正文:

目前諸如Slack以及HipChat等聊天機器人的應用逐步增多,企業(yè)都在使用聊天機器人發(fā)揮更多功能。不少應用程序開(kāi)發(fā)商都在試圖搶占這個(gè)新的風(fēng)口,特別是不斷加強對自然語(yǔ)言處理技術(shù)的研究,從而寄希望于通過(guò)該技術(shù)提升用戶(hù)體驗。

對于自然語(yǔ)言處理技術(shù),我們已經(jīng)投入很多精力來(lái)改進(jìn)、來(lái)提升相關(guān)的用戶(hù)體驗。自然語(yǔ)言處理技術(shù)是一個(gè)新興的研究領(lǐng)域,盡管我們擁有一個(gè)強大的數據科學(xué)研究團隊,但對于該技術(shù)的研發(fā)還處于初始階段。目前來(lái)看,自然語(yǔ)言處理技術(shù)依舊不夠成熟,也不夠完善,相關(guān)的工程實(shí)例根本談不上良好的用戶(hù)體驗。

不久前,我們推出了具備自然語(yǔ)言處理功能的聊天機器人Task Assistant,超過(guò)700家公司使用了該產(chǎn)品,產(chǎn)生了不少相關(guān)教訓:

1、人類(lèi)語(yǔ)言極為不同

即便是關(guān)于簡(jiǎn)單任務(wù),人類(lèi)與聊天機器人之間的交互也各有不同。在用戶(hù)語(yǔ)言中,充斥著(zhù)各式各樣的夸張、隱喻、文字拼寫(xiě)錯誤以及俚語(yǔ),這些語(yǔ)言組織方式的存在使得聊天機器人需要大量的訓練。

Facebook語(yǔ)言技術(shù)開(kāi)發(fā)團隊工程總監艾倫·帕克(Alan Packer)曾就如何構建機器翻譯技術(shù)進(jìn)行過(guò)深入探討。雖然工作語(yǔ)言并不像用戶(hù)的日常用語(yǔ)一樣多樣化,我們可以通過(guò)所提供聊天機器人的類(lèi)型對不同工作進(jìn)行區分,從而對機器所能理解的語(yǔ)言加以限制。雖然自然語(yǔ)言處理技術(shù)仍非易事,但是通過(guò)針對不同工作用戶(hù)進(jìn)行相應調整,能夠有效減少機器理解歧義引發(fā)的相關(guān)問(wèn)題。

2、聊天機器人不能將所有不理解轉嫁給背后的人類(lèi)客服

很多聊天機器人的背后都有人類(lèi)干預,當機器無(wú)法理解用戶(hù)語(yǔ)言時(shí),它們將相關(guān)問(wèn)題轉給人類(lèi)處理。這種處理問(wèn)題的想法是通過(guò)這種方式訓練聊天機器人,直至其存儲了足夠多的數據以應對各種問(wèn)題。但當用戶(hù)期望獲得更好的用戶(hù)體驗,并期望機器能夠完全理解其意思時(shí),這并不是一個(gè)可持續性的解決方法。因為當用戶(hù)提出一個(gè)獨一無(wú)二的問(wèn)題時(shí),機器無(wú)法進(jìn)行擴展。據統計,目前15%的谷歌搜索都是獨一無(wú)二的,這意味著(zhù)每天都有上億次的獨特查詢(xún)。對于聊天機器人來(lái)說(shuō),要回答所有的人類(lèi)問(wèn)題時(shí)相當困難的,因此單單依靠背后的人類(lèi)客服并不是長(cháng)久之計。

為了理解自然語(yǔ)言,聊天機器人還要走很多“歪路”

第一點(diǎn)已經(jīng)不用多說(shuō)了,畢竟在這一點(diǎn)上,多數人都已有了自己的認識,而關(guān)鍵的第二點(diǎn)卻一針見(jiàn)血的說(shuō)出了當前的一個(gè)盲點(diǎn)所在。的確,按照當前的方法,聊天機器人也只是一個(gè)會(huì )模仿的提線(xiàn)木偶而已,并不能真正的理解自然語(yǔ)言,而這樣就代表著(zhù)一切努力終將是白費力氣。

不過(guò),在當前針對自然理解語(yǔ)言面臨的問(wèn)題上,ROB還能夠提出這與眾不同的一點(diǎn),如此新穎奇特,也難怪他的公司在機器學(xué)習與自然語(yǔ)言處理上能達到如此成就。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到