語(yǔ)音識別技術(shù)受追捧,無(wú)法獨立工作的“速記神器”何時(shí)才能成為新亮點(diǎn)?

伶軒 8年前 (2017-08-09)

從當前來(lái)看,速記神器確實(shí)為特定人群所需。

近日,搜狗召開(kāi)發(fā)布會(huì ),正式推出其自研的速記神器——搜狗聽(tīng)寫(xiě)。這是一款能夠將語(yǔ)音實(shí)時(shí)轉變成文字的速記工具,擁有轉寫(xiě)和聽(tīng)寫(xiě)兩種模式,主要面向記者、編輯、作家等文字工作者。

語(yǔ)音識別技術(shù)受追捧,無(wú)法獨立工作的“速記神器”能否成為行業(yè)新亮點(diǎn)?

由搜索而知名的搜狗,在人工智能領(lǐng)域似乎也玩的風(fēng)生水起

眾所周知,搜狗以搜索業(yè)務(wù)起家。除搜索業(yè)務(wù)外,其在近年還因搜狗輸入法、搜狗高速瀏覽器等在行業(yè)內頗具名氣。

如果僅從以上這些來(lái)看,搜狗此次推出“搜狗聽(tīng)寫(xiě)”似乎顯得有些無(wú)厘頭。然而,搜狗CEO王小川曾表示,搜索本身也是一種AI。

語(yǔ)音識別技術(shù)受追捧,無(wú)法獨立工作的“速記神器”能否成為行業(yè)新亮點(diǎn)?

回顧搜狗的發(fā)展史,除去初期產(chǎn)品,搜狗在其產(chǎn)品迭代或新品中都或多或少的運用到了人工智能技術(shù),例如搜狗云輸入法、加入了云計算技術(shù)的搜狗輸入法5.0版本、兒童智能手表“糖貓”等。

很顯然,這一次搜狗將目光瞄準了語(yǔ)音識別領(lǐng)域,也似乎做出了點(diǎn)成績(jì)。搜狗語(yǔ)音交互技術(shù)中心總經(jīng)理王硯峰表示,搜狗聽(tīng)寫(xiě)中涉及到了大量前沿技術(shù),例如大規模的優(yōu)質(zhì)語(yǔ)音數據訓練和深度學(xué)習的技術(shù)能力積累等,不僅可應用于多個(gè)場(chǎng)景,其語(yǔ)音識別準確率也高達97%以上。

產(chǎn)品并無(wú)明顯差異化競爭優(yōu)勢,搜狗聽(tīng)寫(xiě)要拿什么去競爭?

從搜狗方面的介紹看,搜狗聽(tīng)寫(xiě)可提供兩種服務(wù),語(yǔ)音轉寫(xiě)和語(yǔ)音聽(tīng)寫(xiě)。此外,它還同時(shí)具備了邊聽(tīng)邊改、無(wú)線(xiàn)標重點(diǎn)、多端同步、信息分享等多個(gè)功能。而這樣的語(yǔ)音轉寫(xiě)工具,似乎在行業(yè)內并沒(méi)有什么明顯的差異化競爭優(yōu)勢。

語(yǔ)音識別技術(shù)受追捧,無(wú)法獨立工作的“速記神器”能否成為行業(yè)新亮點(diǎn)?

除新鮮出爐的搜狗聽(tīng)寫(xiě)之外,科大訊飛的云犀、思必馳的語(yǔ)音輸入板等,都是能夠將語(yǔ)音轉換成文字的工具。此外,僅在中國,除去普通話(huà),大方言就有八種,各小地區方言更是多不勝數。這其中所涉及到的語(yǔ)音識別、語(yǔ)義識別、深度學(xué)習、算法訓練等多個(gè)人工智能尖端技術(shù),難度不可謂不大。

很顯然,與一直致力于語(yǔ)音識別領(lǐng)域技術(shù)開(kāi)發(fā)的企業(yè)相比,搜狗在專(zhuān)業(yè)程度及行業(yè)經(jīng)驗方面都有不做。而除去這些專(zhuān)業(yè)性企業(yè)和產(chǎn)品之外,當下很多輸入法及搜索工具也有類(lèi)似的功能,搜狗并沒(méi)有賦予搜狗聽(tīng)寫(xiě)具有差異化競爭力的功能。在市場(chǎng)逐漸開(kāi)拓的當下,搜狗想要憑借搜狗聽(tīng)寫(xiě)搏得一方市場(chǎng),顯然不容易。

技術(shù)+人工,AI至今未能真正做到全智能

在語(yǔ)音轉化文字方面,除去偏C端的工具外,專(zhuān)業(yè)性系統或軟件也有很多,例如科大訊飛的聽(tīng)見(jiàn)智能會(huì )議系統。在大多數的專(zhuān)業(yè)性會(huì )議,主辦方都會(huì )聘請的專(zhuān)業(yè)速記人員。而與前幾年相比,現今的速記工作已經(jīng)有了更多人工智能的參與。

只是這其中存在著(zhù)一個(gè)的現象,當前的語(yǔ)音轉寫(xiě)技術(shù)并不能一力承擔整場(chǎng)專(zhuān)業(yè)性會(huì )議,還需要有專(zhuān)業(yè)速記員全程盯著(zhù),實(shí)時(shí)進(jìn)行糾錯沒(méi)有識別出的內容、標點(diǎn)等。

語(yǔ)音識別技術(shù)受追捧,無(wú)法獨立工作的“速記神器”能否成為行業(yè)新亮點(diǎn)?

科大訊飛負責會(huì )議現場(chǎng)速記的一位專(zhuān)業(yè)速記員表示,在以科大訊飛聽(tīng)見(jiàn)智能會(huì )議系統為主導、沒(méi)有純正方言的情況下,正常會(huì )議速記工作的人工參與率是5%—10%。

不過(guò),在人工智能相關(guān)技術(shù)不夠成熟的當下,這樣的人工參與率已經(jīng)是很低的了。雖然目前我們并不能做到完全智能,但僅就速記AI領(lǐng)域來(lái)說(shuō),有了專(zhuān)業(yè)速記員的配合,不僅能夠保證速記內容的精準,還能為開(kāi)發(fā)者提供更為直觀(guān)的現場(chǎng)反饋,為技術(shù)的進(jìn)一步發(fā)展助力。

總結

隨著(zhù)人工智能相關(guān)技術(shù)的發(fā)展與前景的逐漸明朗,似乎所有行業(yè)都想在這一領(lǐng)域插上一腳,大公司更是不例外。當然,企業(yè)發(fā)展需要新鮮元素的加入,但如果只是為了與“AI”沾親帶故以獲得“宣傳”的理由,對于行業(yè)來(lái)說(shuō),這樣的企業(yè)或從業(yè)者也許就是毒瘤。

從當前來(lái)看,速記神器確實(shí)為特定人群所需,但想要讓這類(lèi)產(chǎn)品成為剛需,還需行業(yè)者切實(shí)考慮用戶(hù)需求,盡快讓AI成為真正的全智能技術(shù)。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到