最新讀唇術(shù)機器來(lái)了:主要依靠新的讀唇算法

周彤 9年前 (2016-03-26)

計算機科學(xué)家 Bear 帶來(lái)最新讀唇技術(shù),可以利用讀唇算法識別唇形讀出內容并轉換成文字。

近日,相關(guān)消息透露,東英吉利大學(xué)計算機科學(xué)家 Helen Bear 和她的同事 Harvey 共同研發(fā)出一套新的讀唇算法,這套算法可以幫助計算機提高識別自然語(yǔ)言的能力,可以根據發(fā)音的唇形來(lái)讀出內容并且轉換成文字。

不過(guò)這聽(tīng)起來(lái)怎么那么充滿(mǎn)科幻的色彩呢?

其實(shí)所謂的讀唇術(shù)就是傳統意義上的語(yǔ)音識別,而要想真正挑戰這項技術(shù)還是很不容易的,因為唇形的發(fā)音很容易受到一些微妙的變化而改變,當我們的口型微張、微閉,或者舌面高低發(fā)生變化,這些都會(huì )導致嘴型發(fā)生變化,很難準確識別。

而 Bear 科學(xué)家和她的同事研發(fā)出來(lái)的算法現在已經(jīng)可以精確的識別一個(gè)嘴型所對應的特定音素,它主要是通過(guò)對發(fā)音嘴型的重復訓練從而形成一定的概念。而且現在這個(gè)算法的識別的精準度已經(jīng)越來(lái)越高了。

哈哈~這是不是意味著(zhù)大家以后都不能在一些特定場(chǎng)所說(shuō)著(zhù)悄悄話(huà)了呢?

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到