語(yǔ)音識別:市場(chǎng)前景可觀(guān),但核心技術(shù)仍需突破
在CES 2017之后,語(yǔ)音識別成為了眾人的關(guān)注焦點(diǎn),而在市場(chǎng)規模擴大的背后,語(yǔ)音識別還不能完全滿(mǎn)足人類(lèi)的需求。
隨著(zhù)人工智能產(chǎn)品在生活中的滲透率越來(lái)越高,其中技術(shù)的發(fā)展也成為了眾人關(guān)心的重點(diǎn)所在。作為人機自然交互的基本途徑之一,近期以來(lái),語(yǔ)音識別的發(fā)展不可謂不快速。
當下,諸如科大訊飛、百度等多家企業(yè)聲稱(chēng),其研發(fā)的語(yǔ)音識別技術(shù)已經(jīng)達到了97%的準確率。而在日前,谷歌研究員公開(kāi)表示其語(yǔ)音識別的錯誤率(將一個(gè)詞語(yǔ)從語(yǔ)音轉錄成為文字時(shí)的錯誤率)自2012年以來(lái)已經(jīng)降低了30%以上……縱觀(guān)過(guò)去的2016年,谷歌、蘋(píng)果和微軟等多家科技巨頭都公布了自己在語(yǔ)音識別上的進(jìn)展和突破,而在接下來(lái)的時(shí)間里,語(yǔ)音識別也將是2017年的發(fā)展重點(diǎn)之一。
新興產(chǎn)業(yè)市場(chǎng)廣闊,推動(dòng)語(yǔ)音識別技術(shù)發(fā)展
在剛剛過(guò)去不久的CES 2017展會(huì )上,我們見(jiàn)到了許多人工智能產(chǎn)品,要是來(lái)一場(chǎng)評比大賽,自動(dòng)駕駛和智能家居絕對是主角。不過(guò),再往深究,語(yǔ)音識別技術(shù)才是此次展會(huì )人工智能部分的“亮點(diǎn)”。
智能家居
在智能家居,不管是智能家電還是機器人,語(yǔ)音識別技術(shù)都是必備的基本功能之一。據知名市場(chǎng)調研公司《Markets And Markets》發(fā)布的調查報告稱(chēng),全球智能家居市場(chǎng)規模將在2022年達到1220億美元,2016-2022年年均增長(cháng)率預測為14%。而在機器人方面,研究機構IDC預測,至2020年,全球機器人與相關(guān)服務(wù)市場(chǎng)規模將由2016年的915億美元增至1880億美元。從這兩點(diǎn)數據來(lái)看,可想而知未來(lái)智能家居的市場(chǎng)之大。
在控制方式上,除了部分智能家電之外,語(yǔ)音控制已經(jīng)成為了市場(chǎng)的主流,而這就是語(yǔ)音識別市場(chǎng)的商機。未來(lái),作為人機自然交互的前提之一,語(yǔ)音識別必然是智能家居的發(fā)展趨勢,只有語(yǔ)音識別的準確率接近完美,人機的自然交互才能繼續開(kāi)展。在智能家居市場(chǎng)的推動(dòng)下,語(yǔ)音識別技術(shù)必將成為重點(diǎn)發(fā)展對象。
智能汽車(chē)
在CES 2017展會(huì )上,各大傳統汽車(chē)制造商都帶來(lái)了自己在自動(dòng)駕駛汽車(chē)的最新成果。與此同時(shí),在展會(huì )上,除了展示成果,不少廠(chǎng)商也宣布了自己的一系列計劃,其中就包括在汽車(chē)中加入虛擬助手平臺,以促進(jìn)人車(chē)交互,進(jìn)一步提升用戶(hù)體驗,比如日產(chǎn)、寶馬與Cortana的合作,還有福特與Alexa的聯(lián)手。
根據美國市場(chǎng)研究機構勒克斯的研究報告顯示,自動(dòng)駕駛汽車(chē)將在2030年創(chuàng )造價(jià)值870億美元的市場(chǎng)。此外,另有研究顯示,2030年全球范圍將售出約1.2億輛自動(dòng)駕駛汽車(chē)。從數據來(lái)看,自動(dòng)駕駛汽車(chē)的市場(chǎng)十分具有看頭。
自動(dòng)駕駛市場(chǎng)的推動(dòng)下,人車(chē)交互也成了自動(dòng)駕駛玩家的一個(gè)關(guān)注點(diǎn),是汽車(chē)智能化的一部分。此外,相對于自動(dòng)駕駛輔助技術(shù),語(yǔ)音識別等交互技術(shù)的實(shí)現則容易得多,目前也已有不少車(chē)型搭載了語(yǔ)音識別技術(shù)。在智能汽車(chē)中,語(yǔ)音識別已經(jīng)成為了一項基礎的服務(wù),而隨著(zhù)智能化時(shí)代的來(lái)臨,人們對語(yǔ)音識別的要求也會(huì )進(jìn)一步提升。
未來(lái)市場(chǎng)可觀(guān),而語(yǔ)音識別仍需“做事”
在新興產(chǎn)業(yè)市場(chǎng)需求的推動(dòng)下,語(yǔ)音識別的市場(chǎng)也是十分具有看頭的,有研究機構指出,預計到2020年,全球語(yǔ)音識別的市場(chǎng)規模將從2015年的61.9億美元增長(cháng)到200億美元。然而,在市場(chǎng)規模壯大這一美好的預測面前,我們也不能忽視一些需要面對的問(wèn)題,只有解決了它們,語(yǔ)音識別才能得到完善,給用戶(hù)帶來(lái)極致服務(wù)。
首先就是對象識別的準確性。現在,在應用上,我們看見(jiàn)語(yǔ)音識別多是在智能家居領(lǐng)域,包括智能家電和服務(wù)機器人。此時(shí),我們就要考慮一個(gè)問(wèn)題了,當多個(gè)家庭成員同時(shí)講話(huà)時(shí),智能家電和服務(wù)機器人該執行誰(shuí)的命令呢?它們又如何能在眾聲音中找出自己主人的命令?這些都是當前語(yǔ)音識別所需要解決的問(wèn)題,畢竟我們通常所說(shuō)的語(yǔ)音識別不僅僅只是單純的對語(yǔ)音內容進(jìn)行識別。
在這個(gè)問(wèn)題上,人們也找到了一個(gè)解決方案——聲紋識別。一般來(lái)講,聲紋具有唯一性,對說(shuō)話(huà)人身份的確認有著(zhù)極大的幫助。借助于聲紋識別,語(yǔ)音識別能夠準確對說(shuō)話(huà)人的位置和身份進(jìn)行定位,從而準確識別語(yǔ)音內容,執行其中下達的指令。不過(guò),鑒于數據的極大空缺等問(wèn)題,聲紋識別技術(shù)還需完善。
其次是降低周邊環(huán)境的干擾。對于人類(lèi)來(lái)講,在嘈雜環(huán)境中聽(tīng)別人說(shuō)話(huà)或是從眾多聲音中找出自己想聽(tīng)的內容還是一件較為簡(jiǎn)單的事,而與此相反,這件事在機器這里并沒(méi)有那么容易。
為了降低周邊環(huán)境對語(yǔ)音識別的干擾,亞馬遜和谷歌都在智能音箱中使用了麥克風(fēng)陣列技術(shù),從而起到一定的“降噪”作用,增加語(yǔ)音識別的準確率。不過(guò),到目前為止,環(huán)境的干擾依然沒(méi)有得到更好的解決,仍然是語(yǔ)音識別前進(jìn)道路中的一只“攔路虎”,尤其是在多段語(yǔ)音中準確找出指定說(shuō)話(huà)人的情境中。
在一次采訪(fǎng)中,人工智能和機器學(xué)習權威學(xué)者、百度首席科學(xué)家吳恩達表示,2017年是“對話(huà)式電腦”快速發(fā)展的一年。對話(huà)式電腦,諸如聊天機器人、人工智能虛擬助手之類(lèi),作為展開(kāi)對話(huà)的第一步,語(yǔ)音識別也屬于這快速發(fā)展的一部分。
在智能家居、智能汽車(chē)等多種產(chǎn)業(yè)以及聊天機器人、虛擬助手這些產(chǎn)品市場(chǎng)的推動(dòng)下,語(yǔ)音識別的市場(chǎng)正在不斷擴大,同時(shí)也是對它準確性的一個(gè)挑戰。
2016年,在語(yǔ)音識別內容的準確率上,各科技企業(yè)和團隊都有了相應的突破,而在接下來(lái)的一年里,如何降低周邊環(huán)境的干擾以及如何提高對聲音的識別準確率將是語(yǔ)音識別所要解決的問(wèn)題。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
