左手握技術(shù),右手握需求,但聲紋識別依舊當不了“獨行俠”
作為生物識別技術(shù)的一種,聲紋識別是“低調”的,也是經(jīng)受磨難較多的。
前段時(shí)間,OPPO意外上了熱搜。
因為智能AI語(yǔ)音助手“小歐”的語(yǔ)音喚醒、解鎖功能,用戶(hù)花了5000元買(mǎi)了一部OPPO的手機。這事沒(méi)讓用戶(hù)感到興奮,反而有點(diǎn)恐慌。
根據指示,在錄入聲音后,應該只有聲音的主人能夠語(yǔ)音喚醒、解鎖,而現在,在用戶(hù)已經(jīng)提前錄入聲音的前提下,他的朋友竟然也通過(guò)語(yǔ)音成功喚醒小歐,并解鎖手機。
這其中究竟是哪一步出了問(wèn)題?
答案是,語(yǔ)音識別。
說(shuō)得更準確一點(diǎn),是手機系統的聲紋識別不夠準確。
聲紋識別很“低調”,但掩蓋不住市場(chǎng)利好
就像這個(gè)世界上沒(méi)有任何兩片樹(shù)葉的紋理是一樣的,即使是雙胞胎,他們的舌、牙齒、喉頭、肺、鼻腔在尺寸和形態(tài)等方面多多少少都會(huì )有些差異,即便是聲音聽(tīng)起來(lái)相似,但聲紋圖譜總歸是不同的。
具體說(shuō)來(lái),聲紋識別是生物識別手段的其中一種,跟它屬于同一家族的還有指紋識別、人臉識別、虹膜識別等等。在現實(shí)生活中,識別技術(shù)通常都被用來(lái)作為交互或是安全認證的一種手段,聲紋識別亦不能免俗。
目前,聲紋識別技術(shù)最大的市場(chǎng)在于安防和金融。其中,最為經(jīng)典、刺激的當屬刑偵。最佳例子來(lái)自2017年的熱播劇《人民的名義》,針對陳海發(fā)生車(chē)禍一事,反貪局局長(cháng)侯亮平與京州公安局局長(cháng)趙東來(lái)在全場(chǎng)進(jìn)行探討分析,提到陳海在車(chē)禍前共接到兩個(gè)舉報電話(huà),京州公安局將兩個(gè)電話(huà)交由不同技術(shù)部門(mén)進(jìn)行了兩次鑒定,最終得出結論,兩通電話(huà)舉報人的聲音并非蔡成功一人。
如何知道聲音不是同一個(gè)人的?這其中所使用的技術(shù)就是聲紋識別。更進(jìn)一步講,這是1對1的聲紋識別技術(shù),通過(guò)將電話(huà)中的聲紋與數據庫中蔡成功的聲紋特征進(jìn)行1對1比對。
而在金融領(lǐng)域,聲紋識別技術(shù)也被用于用戶(hù)身份確認等方面,譬如銀行系統會(huì )要求用戶(hù)登錄時(shí)先行說(shuō)出一段指定文字,從而進(jìn)行聲紋數據的比對,以確認用戶(hù)是否為本人??梢哉f(shuō),在安防/金融等領(lǐng)域,聲紋識別有著(zhù)先天的落地場(chǎng)景和利好前景。
安防/金融等應用場(chǎng)景之外,聲紋識別也逐步地在智能硬件、智能家居等產(chǎn)品或場(chǎng)景內實(shí)現落地。
以智能家居場(chǎng)景內的智能音箱為例。最初智能音箱并不具備聲紋識別的功能,這也就意味著(zhù)任何人都可以喚醒它并對其下指令。而當有多人同時(shí)發(fā)聲時(shí),智能音箱就會(huì )發(fā)生“指令混亂”的問(wèn)題。如果任何人都可以通過(guò)智能音箱進(jìn)行全場(chǎng)景控制,那么無(wú)疑為不法分子提供了作案便利。因此,出于安全性、指令接收準確性、個(gè)性化等因素,聲紋識別技術(shù)也漸漸在智能家居、智能硬件等場(chǎng)景中實(shí)現滲透。
目前,在聲紋識別技術(shù)的應用方面,除了接入安防、金融等行業(yè),諸如長(cháng)虹等硬件廠(chǎng)商也研發(fā)并推出了具備聲紋識別功能的智能電視、智能手機等等。
從近幾年的情形可以看出,相比于指紋識別、人臉識別等生物識別技術(shù),聲紋識別是“低調”的,但市場(chǎng)需求是的確存在的,且市場(chǎng)熱度也有上升趨勢。
相比其他家族成員,聲紋識別的成長(cháng)過(guò)程有著(zhù)許多“攔路虎”
此前,智研咨詢(xún)發(fā)布《2018-2024年中國聲紋識別技術(shù)行業(yè)市場(chǎng)運營(yíng)態(tài)勢及發(fā)展前景預測報告》,內容中指出,2017年聲紋識別技術(shù)的全球收入為1.32億美元,而這一數值在幾年將增至1.59,增速達到20.5%,預計到2021年,聲紋識別技術(shù)的全球收入將達到2.64億美元。僅從這一數值來(lái)看,聲紋識別的市場(chǎng)預期還是不小的。
但另一方面,這一市場(chǎng)預期又著(zhù)實(shí)有點(diǎn)不夠看頭。國際權威調研機構Gen Market Insights發(fā)布了《全球人臉識別設備市場(chǎng)研究報告2018》,報告稱(chēng),2017年全球人臉識別設備市場(chǎng)價(jià)值為10.7億美元,到2025年底將達到71.7億美元,在2018年至2025年期間將以26.8%的速度增長(cháng)。
一邊是個(gè)位數,一邊是十位數,這中間的差距之大十分明顯。
此外,我們再看另外一組對比:
從易用性、準確率、成本、用戶(hù)接受度等角度出發(fā),對各項生物識別技術(shù)做對比。我們可以直觀(guān)看到,綜合評判上,相比于指紋識別、掌型識別、人臉識別、虹膜識別等生物識別技術(shù),聲紋識別在各方面都占據優(yōu)勢。
那么,我們就疑惑了:市場(chǎng)存在需求,易用性、準確率、成本、用戶(hù)接受度等方面又比其他生物識別技術(shù)更有優(yōu)勢,緣何聲紋識別技術(shù)的市場(chǎng)占有率遠遠落后于人臉識別等技術(shù)?
問(wèn)題就出在數據的采集和覆蓋范圍上。
在本文開(kāi)始,我們就提到縱然是雙胞胎,他們的聲紋特征也是有所差異的,不過(guò)更為準確地講,聲紋是一種“相對唯一”的生物特征。
在實(shí)際應用中,聲紋識別受影響的因素比較多,首先注冊模型上,受限于環(huán)境、身體狀態(tài)等因素,一個(gè)人的聲音會(huì )發(fā)生不用的變化;其次在應用中,也會(huì )受注冊環(huán)境跟驗證環(huán)境不一致造成的失配問(wèn)題,致使聲紋不能匹配;最后,聲紋也會(huì )隨著(zhù)年齡的變化而變化。另外,雖然聲紋可以實(shí)現非接觸的,但是在入侵方面也增加了更多的風(fēng)險,比如錄音、合成器合成等。
其中針對某些問(wèn)題,人工智能技術(shù)能夠給予一定的幫助,比如環(huán)境對聲紋收集和比對的影響。一般情況下,在語(yǔ)料覆蓋率足夠完整的前提下,將之用于模型的搭建和訓練,在最終實(shí)際應用場(chǎng)景中,即使面對嘈雜的環(huán)境,系統在提取聲紋特征時(shí)便會(huì )將這些因素“去掉”,從而確保聲紋特征的精準。
什么是語(yǔ)料?是指一個(gè)人的聲紋數據。
不過(guò),用極限元創(chuàng )始人兼CEO溫正棋的話(huà)來(lái)說(shuō),面對環(huán)境失配問(wèn)題,現在更多的是通過(guò)語(yǔ)料的覆蓋率來(lái)解決。在其看來(lái),技術(shù)的成熟度極大程度上也是依賴(lài)語(yǔ)料的積累度。
語(yǔ)料積累的全面與完整,這涉及到背后的聲紋數據庫是否全面覆蓋了不用環(huán)境、不同狀態(tài)等場(chǎng)景下的聲紋特征。對于一般企業(yè)而言,這是一個(gè)極具難度的工作。
語(yǔ)料的完整與否影響了模型訓練的精確度,也影響了聲紋識別技術(shù)在實(shí)驗室之外的商業(yè)化落地,尤其是面對1對N的“說(shuō)話(huà)人辨認”的情況,相對于1對1的“說(shuō)話(huà)人確認”,“說(shuō)話(huà)人辨認”會(huì )要求系統通過(guò)聲紋識別技術(shù)在多個(gè)人中找出一個(gè)人,這對系統的語(yǔ)料完整度、聲紋特征提取的準確度等多個(gè)方面提出了要求。
未來(lái),聲紋識別當不了“獨行俠”
現如今,以智能手機為例,各大手機生產(chǎn)商、應用開(kāi)發(fā)商更樂(lè )意采用人臉識別技術(shù)來(lái)用于認證解鎖、認證支付。而在機場(chǎng)、高鐵等場(chǎng)地,人臉識別檢票等設備也應較為常見(jiàn)。
在這些場(chǎng)景中,人臉識別技術(shù)被作為安全認證技術(shù)獨立使用。那么,同樣是安全認證技術(shù),聲紋識別有沒(méi)有機會(huì )來(lái)當一回“獨行俠”?
嚴格說(shuō)來(lái),聲紋識別當“獨行俠”的機會(huì )很少,微乎其微。只有在相對局限的場(chǎng)景中,譬如相對外來(lái)因素影響較小的家居環(huán)境等等,用戶(hù)只需要提前錄入自己多種狀態(tài)的聲紋并實(shí)時(shí)更新,系統將能夠獨立提供服務(wù)。
至于其他較為復雜的環(huán)境,現在的聲紋識別很多都是與語(yǔ)音識別和人臉識別等結合,譬如用戶(hù)讀出一段指定文字,以登錄銀行賬戶(hù)等,安全指數更高。也因此,從大趨勢來(lái)講,聲紋識別當不了“獨行俠”。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
