智能降噪、獨立4G聯(lián)網(wǎng)、63個(gè)語(yǔ)種隨意切換,搜狗AI錄音筆“玩花招”
功能方面,搜狗S1幾乎考慮到了用戶(hù)的所有需求。
近幾年來(lái)人們手中的錄音設備經(jīng)歷了質(zhì)的變革,在傳統錄音筆的多模態(tài)錄音、播放以及編輯的基礎上,越來(lái)越多的廠(chǎng)商也賦予了設備“AI”能力,并基于此能力為錄音筆開(kāi)發(fā)多樣化功能。
就在前不久,國內AI錄音筆賽道重度玩家之一的搜狗在線(xiàn)上發(fā)布了最新兩款產(chǎn)品,分別是S1和E1。發(fā)布會(huì )后,鎂客網(wǎng)也拿到了一部“S1”,并進(jìn)行了數天的深度測評:
3.5寸大屏+納米注塑工藝,風(fēng)格硬朗、便于攜帶
拿到產(chǎn)品包裝盒,S1的機身造型赫然映入眼簾,而在包裝盒背面,則以文字和圖片的形式簡(jiǎn)單囊括了S1的四大特色功能,包括麥克風(fēng)陣列超強拾音、錄音準確轉文字、根據語(yǔ)義智能提取重點(diǎn)以及語(yǔ)音翻譯。
S1整體包裝以黑色為主,除了S1機身之外,另外還有充電器、Type-C接口充電(數據)線(xiàn)、保護套、防風(fēng)罩等配件,以及一份說(shuō)明書(shū)。
S1整機重146g,拿在手上較為輕巧,一只手便能實(shí)現全部機身操作,可以如同手機一般揣到兜里,做到隨用隨拿。機身內存為64G,電池容量2450mAh,從0%充電至100%僅需2個(gè)半小時(shí),能夠持續錄音10個(gè)小時(shí)以上,對于多數用戶(hù)而言已經(jīng)綽綽有余。
機身主色調為黑、灰,機身正面配有一個(gè)3.5寸觸摸顯示屏,便于部分功能調用、實(shí)時(shí)查看語(yǔ)音實(shí)時(shí)轉錄和翻譯的進(jìn)度和內容;背面由樹(shù)膠打造,經(jīng)磨砂打磨處理,上面印有搜狗的logo,也貼上了防滑膠墊;邊框采用納米注塑工藝和6系鋁材質(zhì)。S1整體看起來(lái),帶給人一種干練、硬朗的商務(wù)感。
機身頂部設計為鏤空樣式,配備2顆哈曼駐極體指向麥克風(fēng),大屏左右兩側對稱(chēng)分布了6個(gè)小細孔,內置6顆全向麥克風(fēng),形成8麥陣列,實(shí)現360°拾音。機身底部為T(mén)ype-C端口和揚聲器。
其他方面,機身左側排列有電源建、音量調節鍵、3.5mm耳機插孔和SIM卡槽。卡槽的加入讓S1也能夠實(shí)現4G聯(lián)網(wǎng),讓用戶(hù)在沒(méi)有WiFi的場(chǎng)景中也能夠實(shí)現錄音的上傳、轉寫(xiě)、翻譯等等。
而在機身右側,除了錄音開(kāi)始/暫停鍵,S1還擁有了一個(gè)全新功能鍵“M鍵”,通過(guò)短按、長(cháng)按,用戶(hù)可啟用重點(diǎn)標記、語(yǔ)音助手等功能。
智能降噪、遠程拾音,多場(chǎng)景針對性進(jìn)行錄音
作為一款錄音筆,S1最為基本的功能就是“錄音”,但這件事并不是那么簡(jiǎn)單就能做好。
1對1采訪(fǎng)時(shí),聲源方向是相對單一的,人們一般會(huì )將錄音設備的麥克風(fēng)指向聲源,但周遭的雜音會(huì )往往帶來(lái)一定的干擾;會(huì )議過(guò)程中的聲源則是多方向的,最終錄音文件中的人聲有的清楚有的模糊,音質(zhì)不一……
在“錄音”方面,傳統錄音筆在過(guò)程中會(huì )將所有的聲音都收錄進(jìn)去,其中聲源的距離、方向以及周遭的雜音均會(huì )帶來(lái)影響,為后期整理增加難度。這方面,S1針對性的提供了4種錄音模式,覆蓋場(chǎng)景包括會(huì )議、采訪(fǎng)、聽(tīng)課、音樂(lè )。
基于clairVoice8麥克風(fēng)陣列算法,S1能夠針對不同場(chǎng)景的錄音需求進(jìn)行智能調整,以實(shí)現360°拾音或定向拾音,打造一個(gè)好的收音效果。經(jīng)實(shí)際測試,10米范圍內,S1在安靜或雜聲較小的環(huán)境內的錄音還是清晰的,轉寫(xiě)準確率也處于高水平。
與此同時(shí),S1還運用了pureVoice AI降噪算法,提供三種降噪模式:真實(shí)音質(zhì)(保留真實(shí)人聲和環(huán)境音)、人聲增強(過(guò)濾環(huán)境音,顯著(zhù)增強人聲)、純凈人聲(深度刪除環(huán)境音,僅保留人聲),讓用戶(hù)在使用過(guò)程中能夠依據自身需求進(jìn)行選擇。
選定錄音模式和降噪方式之后,用戶(hù)短按REC鍵即可一鍵開(kāi)始錄音,過(guò)程中可隨時(shí)更換語(yǔ)種,以及暫定或繼續錄音。當錄音結束并保存本地之后,用戶(hù)可點(diǎn)擊機身屏幕主頁(yè)面的“錄音文件”查看錄音情況,若先前忘記選擇降噪方式,用戶(hù)也可點(diǎn)擊錄音詳情頁(yè)下方的“降噪方式”,打開(kāi)“純凈人聲降噪”以聽(tīng)取降噪處理之后的錄音。
為了測試降噪效果,筆者一手拿正在運作的吹風(fēng)機(與S1距離60-70公分),一手拿S1進(jìn)行錄音(會(huì )議模式,機身距離嘴部約50-60公分)。依據測試成果,在80-101分貝干擾聲的環(huán)境中,S1經(jīng)降噪處理后的錄音依舊存在少許雜音,不過(guò)人聲部分聽(tīng)起來(lái)相當清楚,最終的轉寫(xiě)效果即使受到了一點(diǎn)干擾,但已能夠滿(mǎn)足基本需求。
實(shí)時(shí)轉寫(xiě)、翻譯,告別難懂方言和外語(yǔ)小白
相比于傳統錄音筆,AI錄音筆最大的特色在于語(yǔ)音識別與轉寫(xiě)、中外文互譯。
在實(shí)時(shí)轉寫(xiě)方面,目前S1除普通話(huà)外還支持10種方言和9種外語(yǔ),覆蓋粵語(yǔ)、東北話(huà)、南京話(huà)、英語(yǔ)、日語(yǔ)、法語(yǔ)等。
需要注意的是,過(guò)程中每當息屏或是連續轉寫(xiě)10分鐘后,系統會(huì )判定用戶(hù)未關(guān)注轉寫(xiě)內容而暫停轉寫(xiě)。若用戶(hù)還需繼續使用該功能,記得手動(dòng)在錄音界面發(fā)起繼續轉寫(xiě)。
針對實(shí)時(shí)轉寫(xiě)功能,鎂客網(wǎng)以一段24分鐘時(shí)長(cháng)的采訪(fǎng)錄音進(jìn)行測試,原始錄音文件以中文為主,間雜少量英文詞匯的全拼及縮寫(xiě),測試結果顯示實(shí)時(shí)轉寫(xiě)的速度延遲小,但在識別準確度上還存在些許誤差。
在錄音結束后,用戶(hù)也可以選擇在錄音詳情頁(yè)將該文件全部轉寫(xiě)成文字。本次測試用的24分鐘錄音轉寫(xiě)共用時(shí)3分30秒,轉寫(xiě)準確度較實(shí)時(shí)轉寫(xiě)有所提升。
S1官方介紹稱(chēng)可準確識別財經(jīng)貿易、醫療、IT 科技、政法、文化體育這5大領(lǐng)域的專(zhuān)業(yè)術(shù)語(yǔ),實(shí)際測試中,不管是實(shí)時(shí)轉寫(xiě),還是錄音完成后進(jìn)行的轉寫(xiě),涉及專(zhuān)業(yè)詞匯的轉寫(xiě)都比較準確。值得注意的是,基于新增的M鍵,搜狗為S1增添了一些人性化功能,包括一鍵標記重點(diǎn),便于系統基于NLP等技術(shù)提煉重點(diǎn),用于后期查閱和快速定點(diǎn)回聽(tīng)。
若用戶(hù)急需在眾多保存的錄音中找到某一段,也可長(cháng)按M鍵喚醒智能語(yǔ)音助手,經(jīng)由語(yǔ)音交互找出自己想要的錄音記錄。
鎂客網(wǎng)在使用過(guò)程中也發(fā)現,只要該錄音在結束后進(jìn)行了轉寫(xiě),系統便會(huì )自動(dòng)提煉摘要。與重點(diǎn)標記一樣,系統智能提煉摘要的目的也是方便用戶(hù)后期查閱和快速定點(diǎn)回聽(tīng),只不過(guò)精準度還需多加提升。
另外基于聲紋識別等技術(shù),用戶(hù)在錄音完成轉寫(xiě)之后,可以點(diǎn)擊錄音詳情頁(yè)面左下角的“智能整理”功能,隨即S1將對錄音中的說(shuō)話(huà)者進(jìn)行區分,讓用戶(hù)能夠以一種更為直觀(guān)的方式看到錄音內容,也方便了之后的整理等工作。
翻譯方面,S1提供兩種模式,分別是對話(huà)翻譯和同聲傳譯,前者能夠提供63種語(yǔ)言交傳互譯服務(wù)(包括63個(gè)語(yǔ)種、13種外語(yǔ)口音、9種離線(xiàn)語(yǔ)言),覆蓋全球200多個(gè)國家和地區,后者目前僅支持中英互譯。
在對話(huà)翻譯模式中,REC鍵和M鍵將各自承擔一種語(yǔ)言的錄入工作,屆時(shí)用戶(hù)需長(cháng)按以錄入對應語(yǔ)音,繼而系統會(huì )自動(dòng)讀出對應內容的翻譯結果。對于兩個(gè)語(yǔ)言不通的交流者而言,利用錄音筆進(jìn)行逐個(gè)轉寫(xiě)或許會(huì )耗費些時(shí)間,但能有效避免交談過(guò)程中因語(yǔ)音來(lái)回交叉而帶來(lái)的錯亂問(wèn)題,保證內容的準確性。
相比于對話(huà)翻譯,同聲傳譯不需要用戶(hù)在過(guò)程中長(cháng)按某個(gè)鍵,點(diǎn)擊屏幕頂端即可調換翻譯方向。若中途需要暫停/繼續,只需短按一下REC鍵即可。
從測試結果來(lái)看,在發(fā)音正常的情況下,S1的識別和翻譯準確度接近完美,些微差錯也在可接受范圍內。
此外所有的錄音文件和轉寫(xiě)內容,用戶(hù)可以通過(guò)微信小程序掃碼、藍牙連接手機APP后實(shí)現云端上傳下載,以及多人共享。
總結
眾所周知,錄音筆市場(chǎng)一直都是相對小眾的,主要受眾群體集中在新聞媒體、政府、事業(yè)單位等。依據中國報告網(wǎng)數據,國內錄音筆市場(chǎng)呈現行業(yè)發(fā)展緩慢、替代風(fēng)險大等特點(diǎn),一句話(huà)概括,因為手機等數碼產(chǎn)品的沖擊等因素,國內錄音筆市場(chǎng)長(cháng)時(shí)間處于“供過(guò)于求”的境遇,年度產(chǎn)量基本維持在400多萬(wàn)臺左右,一度出現小幅下滑現象。長(cháng)年以來(lái),這一硬件品類(lèi)的市場(chǎng)由索尼、愛(ài)國者等廠(chǎng)商所霸占。
就在近幾年,隨著(zhù)語(yǔ)音識別、自然語(yǔ)言處理等AI語(yǔ)音技術(shù)的逐步發(fā)展,錄音筆的AI化趨勢也是不可逆的。數據顯示,經(jīng)過(guò)近幾年的產(chǎn)品研發(fā)和推廣,AI錄音筆已經(jīng)占據整個(gè)市場(chǎng)份額的35%,這其中,搜狗是其中的重度玩家之一。
基于搜狗AI錄音筆S1的深度體驗來(lái)看,自最初的單一語(yǔ)音轉寫(xiě)服務(wù),AI錄音筆的功能發(fā)展至今已經(jīng)較為多元化,傾向于人性化等,覆蓋了轉寫(xiě)、翻譯等多個(gè)方面,而這些功能也挑動(dòng)了用戶(hù)心中那根敏感的神經(jīng),滿(mǎn)足了多種需求。
如果套用主播風(fēng)格來(lái)為這款搜狗AI錄音筆下定義的話(huà),那就是:買(mǎi)它、買(mǎi)它、買(mǎi)它!
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
