布局人工智能,搜狗“知音”扮演著(zhù)什么角色?
看語(yǔ)音交互引擎“知音”如何玩轉搜狗的人工智能!
就在昨日下午,搜狗舉行了一場(chǎng)發(fā)布會(huì ),正式推出自家的最新產(chǎn)品——語(yǔ)音交互引擎“知音”,這是一款基于深度學(xué)習算法的智能語(yǔ)音引擎,具有理解與思考能力。此外,在發(fā)布會(huì )上,其CTO楊洪濤也首次披露了公司未來(lái)8年主要的發(fā)展方向。
“知音”到底有多強?
在現場(chǎng)介紹環(huán)節,搜狗語(yǔ)音交互中心負責人王硯峰向我們展示了一項關(guān)于“知音”準確率的測試。在今年3月份,搜狗將知音與百度及科大訊飛的語(yǔ)音輸入法放在一起,由北京郵電大學(xué)、北大深圳研究生院擔任評測機構,得出評測結論:搜狗訊飛能力基本持平,整體領(lǐng)先百度。姑且先不論這項測評的相關(guān)細節,單從表面的結果來(lái)看,搜狗知音的語(yǔ)音識別能力不容小覷。
除此之外,知音還有著(zhù)其他3個(gè)優(yōu)勢。首先就是語(yǔ)音識別解決了因語(yǔ)速過(guò)快導致吞音問(wèn)題,降低了30%的識別錯誤率,并將語(yǔ)音識別的速度提升了3倍;其次就是支持用戶(hù)對錯誤的語(yǔ)音識別進(jìn)行修正,比如說(shuō)把“一生”的“一”改為醫院的“醫”,以便系統給出最準確的反饋;最后是支持多輪對話(huà),處理更復雜的用戶(hù)交互邏輯,比如說(shuō)去首都機場(chǎng),機器會(huì )問(wèn)你“去T1還是T2”,在確定航站樓后,它還會(huì )繼續詢(xún)問(wèn)“是出發(fā)還是接人”。
“知音”的大用處
擴大國內語(yǔ)音輸入應用版圖。隨著(zhù)時(shí)代的進(jìn)步與技術(shù)的發(fā)展,在信息檢索、文字輸入的時(shí)候,越來(lái)越多的人拋棄了繁瑣的鍵盤(pán)操作,投入語(yǔ)音輸入的懷抱。就比如說(shuō)目前穩居國內第一大語(yǔ)音輸入法應用的搜狗輸入法,其語(yǔ)音輸入頻次達到每天1.4億次,比一年前增長(cháng)了55%,并且它的語(yǔ)音識別準確率也已然超過(guò)了97%。
除了輸入法,在搜索引擎、社交軟件、物聯(lián)網(wǎng)等等方面,也越來(lái)越多的運用到了語(yǔ)音識別技術(shù),在此基礎上,搜狗此時(shí)推出性能在國內來(lái)說(shuō)較為領(lǐng)先的語(yǔ)音交互引擎知音,如果只是自家內部消化的話(huà),在輸入法、搜索引擎等市場(chǎng)上,搜狗或將會(huì )進(jìn)行再一次的市場(chǎng)擴張,若能夠實(shí)現開(kāi)源的話(huà),除了能夠對知音進(jìn)行更多的完善,搜狗亦將打造另一種商業(yè)模式。
打入車(chē)聯(lián)網(wǎng)。此前,在一場(chǎng)針對王硯峰的專(zhuān)訪(fǎng)中,當提及語(yǔ)音識別技術(shù)的重要應用方向,他表示:“從當前的產(chǎn)品發(fā)展結合技術(shù)對于產(chǎn)品體驗的增值方面來(lái)看,車(chē)內的語(yǔ)音目前是我們覺(jué)得最具有價(jià)值的。”
在2013年,權威電子行業(yè)研究機構IMS Research指出,預估至2019年,全球約有55%的新車(chē)將具備語(yǔ)音識別功能,而整體車(chē)用語(yǔ)音識別市場(chǎng)營(yíng)收也將由2011年的8,100萬(wàn)美元,劇增至2019年的1億7,000萬(wàn)美元。而根據王硯峰的說(shuō)法,汽車(chē)語(yǔ)音識別市場(chǎng)已經(jīng)開(kāi)始進(jìn)入爆發(fā)期。雖然市場(chǎng)還尚不成熟,但知音的加入無(wú)疑是他們進(jìn)入車(chē)聯(lián)網(wǎng)的一大助力,比如說(shuō)將知音加入旗下應用“搜狗地圖”車(chē)載版。
“知音”背后的人工智能布局
早從2013年開(kāi)始,搜狗就開(kāi)始了人工智能方面的研究。根據今年Q2財報來(lái)看,非美國通用會(huì )計準則下,搜狗的凈利潤達到2.2億元人民幣,而此前在4月,搜狗宣布捐贈清華大學(xué)1.8億元人民幣,聯(lián)合成立“清華大學(xué)天工智能計算研究院”,深入開(kāi)發(fā)包含人工智能在內的前沿技術(shù)。單單從這兩個(gè)數據來(lái)看,在人工智能的資金投入上,搜狗可謂是毫不手軟,足可見(jiàn)其對于人工智能的野心之大。
而在發(fā)布會(huì )上,楊洪濤也首次透露搜狗未來(lái)8年的發(fā)展方向“自然交互+知識計算”,這其中就深藏了搜狗未來(lái)人工智能布局的縮影。那這其中,“知音”又擔任著(zhù)怎樣的地位呢?
人機自然交互研究的是人與機器的對話(huà),以及非生命機器對于高級生命人類(lèi)的理解,賦予機器以智能,使機器成為高級的智能工具。從這其中,我們就可以知道,在對人機自然交互的研究中,“語(yǔ)言”作為社會(huì )中最基本的交流媒介,它的重要性不言而喻。另外,對于人們來(lái)說(shuō),口頭交流才是最舒服、最方便的方式。因而,“知音”在很大程度上就代表了搜夠在自然交互上領(lǐng)域的成就,而在未來(lái),它只會(huì )表現的更加智能,能夠更為理解人類(lèi)。
知識計算多用于搜索引擎,究其本質(zhì)就是將人類(lèi)知識盡可能變成可計算的,使每個(gè)普通人在針對某個(gè)特定問(wèn)題時(shí)都能獲得相應專(zhuān)家水平的答案,而不是一些只是包含了關(guān)鍵詞的網(wǎng)頁(yè)。此前,谷歌曾對美國青少年及成年人進(jìn)行一項調查,調查顯示約有55.5%的人會(huì )使用語(yǔ)音搜索,這意味著(zhù)未來(lái)將有更多的人會(huì )在使用搜索引擎的時(shí)候選擇語(yǔ)音輸入。而我們在語(yǔ)音輸入的時(shí)候,只有語(yǔ)音的識別足夠準確,繼而才能讓系統反饋準確的答案,才能發(fā)揮知識計算最大的效用。因此,在搜狗知識計算的研究中,語(yǔ)音交互引擎“知音”或許不是最重要的,但對其在實(shí)際應用中的輔助作用不可忽視!
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
