《三體》進(jìn)入現實(shí)!《Nature》子刊發(fā)文,將腦電波翻譯成句子,錯誤率低于3%,實(shí)現專(zhuān)業(yè)級轉錄
你還要“張口”說(shuō)話(huà)嗎?
《三體》中的橋段正在成為現實(shí)。
在腦機接口賽道上,此前國內清華大學(xué)腦機接口實(shí)驗室曾經(jīng)讓人們成功通過(guò)外接設備實(shí)現“腦電波打字”,浙大團隊也借助顱內腦機接口設備讓中風(fēng)患者控制機械臂做到喝可樂(lè )等。
而現在,最新《自然·神經(jīng)科學(xué)》的一篇論文顯示了腦機接口領(lǐng)域的一項新突破,來(lái)自美國加州大學(xué)舊金山分校的神經(jīng)外科教授Edward Chang及其同事,讓機器能夠將腦電波信號直接翻譯為文字語(yǔ)句,意味著(zhù)人不張口就能“說(shuō)出”心中所想。
腦機接口技術(shù)迎新突破,打造“腦電波翻譯機”
在Edward Chang的研究中,他們分別將用以檢測癲癇的電極植入到4名受試者的顱內,這些電極會(huì )將他們大聲讀出句子時(shí)的神經(jīng)活動(dòng)記錄下來(lái)。
之后,這些記錄會(huì )被添加到一個(gè)循環(huán)神經(jīng)網(wǎng)絡(luò )中,繼而將規律性出現的神經(jīng)特征表現出來(lái),該特征可能與言語(yǔ)的重復性特征(元音、輔音或發(fā)音器官接受的指令等)相關(guān)。緊接著(zhù),另一個(gè)循環(huán)神經(jīng)網(wǎng)絡(luò )將進(jìn)行逐字解碼,最后形成一段句子。
Edward Chang及團隊在文中介紹稱(chēng),他們通過(guò)該機器翻譯方法解碼并轉換神經(jīng)活動(dòng)的錯誤率低至3%,已經(jīng)能夠媲美于專(zhuān)業(yè)級言語(yǔ)轉錄。
此外他們在實(shí)驗過(guò)程中還發(fā)現,如果利用某人的神經(jīng)活動(dòng)和言語(yǔ)對循環(huán)網(wǎng)絡(luò )進(jìn)行預訓練后,再在另一名實(shí)驗者身上進(jìn)行訓練,最終的解碼結果會(huì )有所改善,這意味著(zhù)這一方法在不同人員之間或將實(shí)現轉移。
可以預見(jiàn),當這一成果被用于臨床,那些失語(yǔ)者以及中風(fēng)患者等群體,將能夠借助腦機接口技術(shù)重新正常發(fā)聲,在不開(kāi)口的前提下,擺脫手語(yǔ)等輔助表達。另外,如果再配以一個(gè)搭載自然語(yǔ)言處理技術(shù)的揚聲器系統,該類(lèi)群體也能夠通過(guò)語(yǔ)音實(shí)現交流。
腦機接口與文字較勁兒
腦機接口是前沿科研之一,不僅吸引了Facebook等企業(yè)和資方的關(guān)注,也成為創(chuàng )業(yè)熱門(mén)領(lǐng)域之一。就在前不久,馬斯克的腦機接口創(chuàng )業(yè)公司Neuralink已經(jīng)取得了新的突破,發(fā)布了“腦后插管”的新技術(shù),聲稱(chēng)能夠通過(guò)一臺神經(jīng)手術(shù)機器人,像微創(chuàng )眼科手術(shù)一樣安全無(wú)痛地在腦袋上穿孔,并向顱內植入芯片。
具體到研究項目,“腦電波轉換成文字”是重點(diǎn)領(lǐng)域之一,涉及兩個(gè)研究方向,一個(gè)方向專(zhuān)注于控制,另一個(gè)方向專(zhuān)注于轉換。
在“控制”這一賽道上,團隊會(huì )在與腦機接口系統連接的電腦中設置一個(gè)輸入法,繼而利用神經(jīng)網(wǎng)絡(luò )算法對受試者顱內電極所捕捉的腦電波信號進(jìn)行解析和轉換,讓受試者能夠實(shí)現“腦電波打字”,通過(guò)控制鍵盤(pán)輸入來(lái)表達自己內心所想。
只不過(guò),相比于人們自然交流的語(yǔ)速,這類(lèi)通過(guò)大腦控制打字的方法顯得非常低效。
相比于“控制”,“轉換”在難度上則高得多。包括馬金團隊在內,諸如Facebook等企業(yè)和高校團隊也在致力于這方面的研究,意圖通過(guò)神經(jīng)網(wǎng)絡(luò )算法,將顱內電極所捕捉的信號直接解碼并轉換為文字或語(yǔ)音。
在速度上,這類(lèi)方法有可能達到人類(lèi)正常水平。就在Edward Chang及團隊于去年發(fā)布的一個(gè)研究成果中,他們已經(jīng)讓AI能夠以每分鐘150個(gè)詞的速度將人類(lèi)的腦電波轉換成語(yǔ)言。
從臨床意義上來(lái)看,這類(lèi)腦機接口技術(shù)對部分群體帶來(lái)的利好是肉眼可見(jiàn)的。而在更廣范圍內,“腦電波轉換成文字”能夠帶來(lái)的效益遠不止于此。
以智能家居為例,從最初的手動(dòng)開(kāi)關(guān)到現在的語(yǔ)音交互,這一場(chǎng)景下的控制方式已經(jīng)從動(dòng)手變成動(dòng)口。但在更多人所暢想的場(chǎng)景中,他們甚至已經(jīng)不想再動(dòng)口,而是希望當自己腦海中出現某一個(gè)念頭的時(shí)候,腦機接口系統能夠將信號轉換為機器可理解的文字,繼而所涉及的家電等設備主體能夠在時(shí)間上無(wú)縫銜接,執行人們腦海中的指令。
不過(guò)這里需要注意的是,目前的腦機接口研究項目中,在獲取腦電波信號環(huán)節,研究員們所采取的措施還是以顱內電極為主。
不可否認,這一方式能夠更為精準的獲取腦電波信號,從而方便接下來(lái)的信號解碼和轉換等。不過(guò),就商業(yè)落地而言,雖然這類(lèi)技術(shù)取得的成果是有目共睹的,但是諸如安全、倫理等問(wèn)題也是事實(shí)存在的,距離更大范圍應用還有很長(cháng)的路。相比之下,更多創(chuàng )業(yè)公司選擇外接腦機接口設備,犧牲部分準確性,提高安全性。隨著(zhù)腦機接口技術(shù)不斷取得突破,并尋找到可落地場(chǎng)景,想必腦機接口將迎來(lái)新一波熱度。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
