【OFweek 年終盤(pán)點(diǎn)】NLP、NLU 2017又有哪些新動(dòng)作?

鎂客 8年前 (2017-12-26)

AI的應用技術(shù)層主要圍繞計算機視覺(jué)和語(yǔ)音、自然語(yǔ)言處理 理解。

具體來(lái)說(shuō),自然語(yǔ)言處理任務(wù)又可以分為問(wèn)答系統(如Siri、小娜等)、情感分析、圖片題注、機器翻譯、詞性標注、命名等幾個(gè)部分。

上一期我們盤(pán)點(diǎn)了計算機視覺(jué)2017年所發(fā)生的大事件,這一期的主要內容為計算機視覺(jué)和語(yǔ)音、自然語(yǔ)言處理/理解(NLP/NLU)。

國際

Maluuba:被微軟收購 推出可視化數據集FigureQA

1月,微軟宣布,公司已經(jīng)收購以使用針對自然語(yǔ)言處理的深度學(xué)習技術(shù)為重點(diǎn),位于多倫多的人工智能初創(chuàng )企業(yè)Maluuba。通過(guò)這次收購,微軟旨在進(jìn)一步強化機器閱讀和編寫(xiě)能力。據了解,Maluuba的人工智能系統能夠以接近自然人的能力閱讀和理解文本內容。

10月,aluuba推出了一個(gè)用于推理的可視化數據集FigureQA,并將研究相關(guān)論文《FigureQA: An Annotated Figure Dataset for Visual Reasoning》發(fā)布在A(yíng)rXiv上。據了解,通過(guò)對結構化視覺(jué)信息的理解能幫助人們從大量文獻中提取信息。

亞馬遜&微軟:聯(lián)手語(yǔ)音助手 能否成功“狙擊”Google?

8月,隨著(zhù)亞馬遜CEO貝索斯發(fā)了一條推文表示:“Alexa剛剛交了個(gè)新朋友”,亞馬遜與微軟走到了一起,這讓原本競爭激烈的語(yǔ)音助手Alexa和Cortana成了一家人,而這一合作也被外界解讀為“狙擊”Siri和Google Assistant的最好方法。

兩者選擇合作最重要的原因是軟硬結合。微軟與亞馬遜的主攻方向有所不同,Cortana更加偏向專(zhuān)業(yè)領(lǐng)域,直接打通了Office 365與Cortana,Alexa則擅長(cháng)勸用戶(hù)在亞馬遜上購物。如今,微軟Cortana的月活躍用戶(hù)已達1.45億,而搭載Alexa的亞馬遜Echo音箱則是智能音箱市場(chǎng)當之無(wú)愧的統治者。

三星:Bixby2.0和Bixby中文版先后推出 智能語(yǔ)音領(lǐng)域再添巨頭

10月,在三星開(kāi)發(fā)者峰會(huì )上,語(yǔ)音助手Bixby2.0正式推出。據了解,Bixby2.0采用了應用深度集成的方式,支持自然語(yǔ)言處理功能,如自然語(yǔ)言命令和復雜語(yǔ)音處理,可以真正了解用戶(hù)和家庭成員。通過(guò)不斷深度學(xué)習用戶(hù)習慣及行為模式,可以成為個(gè)人化的人工智能秘書(shū)。據了解,三星將向第三方完全公開(kāi)開(kāi)發(fā)者工具,打造對抗亞馬遜Alexa和谷歌Assistant的人工智能助手開(kāi)發(fā)平臺。

11月,在北京亦創(chuàng )國際會(huì )展中心,Bixby中文版正式發(fā)布,并11月30日在國內正式上線(xiàn),國行版三星 Galaxy S8、S8+ 和 Note 8 將率先支持。

Yandex:俄羅斯最大搜索引擎推出語(yǔ)音助手Alice

Yandex是俄羅斯最大的搜索引擎,占領(lǐng)俄羅斯約65%的搜索市場(chǎng)份額,其在俄羅斯的地位相當于世界的Google和中國的百度。10月,根據俄羅斯媒體的消息,Yandex公布了Alice語(yǔ)音助手,該產(chǎn)品類(lèi)似亞馬遜的Alexa。

據了解,Alice語(yǔ)音助手能夠展示接近人類(lèi)水平的語(yǔ)言識別準確度,可以響應更隨意的查詢(xún)和基于上下文線(xiàn)索獲取信息。此外,相較于其它語(yǔ)音助手,Alice還有一個(gè)更加優(yōu)越的功能是“Chit-Chat”,這款功能讓語(yǔ)音助手更加擅長(cháng)于對話(huà)。

SoundHound:與ModiFace達成合作 AI工具嵌入到AR鏡像

5月,推出了“美妝直播”的ModiFace和“搜歌利器”SoundHound宣布達成合作,共同推出“美妝魔鏡”。

據了解,SoundHound的語(yǔ)音AI工具將被嵌入到ModiFace的AR鏡像軟件中,用戶(hù)因此可以通過(guò)語(yǔ)音控制軟件,借助 AI 語(yǔ)音,這些需求可以被即時(shí)識別,系統會(huì )為用戶(hù)匹配相應的產(chǎn)品類(lèi)型和色號,幫助用戶(hù)進(jìn)行實(shí)時(shí)試妝。

國內

科大訊飛:語(yǔ)音語(yǔ)義三大領(lǐng)域實(shí)現突破

語(yǔ)音合成:在今年的Blizzard Challenge國際權威語(yǔ)音合成比賽上,科大訊飛以率先超過(guò)4.0分的成績(jì)連續12年蟬聯(lián)全球第一名,且依然是全世界唯一能讓語(yǔ)音合成技術(shù)能夠達到真人說(shuō)話(huà)水平的應用。

語(yǔ)音識別:今年,科大訊飛將其語(yǔ)音識別準確率提升至98%。此外,在方言的識別方面,相對指標比2016年提升了50%以上,方言識別準確率超過(guò)90%的已經(jīng)接近十種,包括粵語(yǔ)、四川話(huà)、東北話(huà)、河南話(huà)、天津話(huà)、山東話(huà)、貴州話(huà)、寧夏話(huà)等。

語(yǔ)言文字識別:2017年,科大訊飛英文手寫(xiě)識別準確率由去年的92%達到97%,全世界排名第一。對數學(xué)題目中的圖形識別,準確率達到92%以上。

搜狗:推出唇語(yǔ)識別新技術(shù) 準確率超谷歌達60%以上

12月,搜狗在北京舉行的媒體溝通會(huì )上公開(kāi)演示了唇語(yǔ)識別新技術(shù)。據了解,搜狗通過(guò)攝像頭從圖像中連續識別出人的唇形,提取說(shuō)話(huà)人連續的口型變化特征,然后將這些唇語(yǔ)特征放入唇語(yǔ)識別模型進(jìn)行解碼,從唇語(yǔ)文本數據到唇語(yǔ)語(yǔ)言模型進(jìn)一步獲取發(fā)音單元,最終輸出文字。

據了解,搜狗在非特定人開(kāi)放口語(yǔ)測試集上,即搜狗唇語(yǔ)識別系統的通用識別的準確率在60%以上,超過(guò)google發(fā)布的英文唇語(yǔ)系統50%以上的準確率;而在垂直場(chǎng)景下,如車(chē)載、智能家居等場(chǎng)景下已經(jīng)達到90%的準確率。

出門(mén)問(wèn)問(wèn):推出全球首款無(wú)線(xiàn)智能音箱Tichome Mini

11月,出門(mén)問(wèn)問(wèn)正式面向國內市場(chǎng)發(fā)布全球首款便攜防水的無(wú)線(xiàn)智能音箱——小問(wèn)音Tichome Mini。

據了解,Tichome Mini可以滿(mǎn)足用戶(hù)的多場(chǎng)景移動(dòng)需求,已實(shí)現語(yǔ)音控制40多個(gè)品類(lèi),上千款智能家電設備,具備兒童內容、音樂(lè )電臺、智能家居、時(shí)間管理、新聞資訊、運動(dòng)助理、生活服務(wù)、實(shí)用工具等多種功能,可以隨時(shí)隨地跟它智能語(yǔ)音交互。

云知聲:推出“Pandora”語(yǔ)音中控方案

6月,云知聲發(fā)布了最新產(chǎn)品“Pandora”語(yǔ)音中控方案。據了解,打造這款類(lèi)似Amazon Echo的智能中控和音箱類(lèi)產(chǎn)品是復雜的過(guò)程,中間涉及語(yǔ)音識別、語(yǔ)音喚醒、語(yǔ)義理解、用戶(hù)畫(huà)像、聲學(xué)等綜合技術(shù),同時(shí),聲學(xué)、結構、麥克風(fēng)陣列等因素又互相關(guān)聯(lián)互相影響。復雜的AI技術(shù)元素和環(huán)節讓大部分智能中控的產(chǎn)品化之路止步不前。

而“Pandora”將遠場(chǎng)語(yǔ)音識別、語(yǔ)義理解等復雜的AI技術(shù)元素整合為一個(gè)整體方案??蓭椭蛻?hù)實(shí)現6個(gè)月快速集成,量產(chǎn)出貨,為產(chǎn)品智能化落地加速。

小米:“小愛(ài)同學(xué)”成史上被點(diǎn)名最多的同學(xué)

12月,小米AI音箱“小愛(ài)同學(xué)”最新使用次數達到102946421次,音頻播放總次數158673818次,這個(gè)數據在同行大幅領(lǐng)先,成為史上被點(diǎn)名最多的同學(xué)。

據了解,“小愛(ài)同學(xué)”能播放音樂(lè )、電臺點(diǎn)播、相聲、小說(shuō)、脫口秀、教育學(xué)習等多種有聲讀物。除此之外,還能提供新聞、天氣、鬧鐘、倒計時(shí)、備忘、提醒、時(shí)間、匯率、股票、限行、算數、百科/問(wèn)答、閑聊、笑話(huà)、菜譜、翻譯等各類(lèi)交互功能。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到