構建“芯時(shí)代”統一戰線(xiàn),云知聲宣布開(kāi)源全棧語(yǔ)音交互方案

韓平 7年前 (2018-07-24)

Turnkey方案的開(kāi)源,必將大大促進(jìn)整體智能硬件產(chǎn)品的開(kāi)發(fā)。

構建“芯時(shí)代”統一戰線(xiàn),云知聲宣布開(kāi)源全棧語(yǔ)音交互方案

云知聲聯(lián)合創(chuàng )始人、芯片負責人李霄寒博士

“其實(shí)現在外面好多合作伙伴都說(shuō)我們特別‘獨’,不過(guò)等你們的東西做出來(lái),大家就不會(huì )這么說(shuō)啦。”云知聲聯(lián)合創(chuàng )始人、芯片技術(shù)負責人李霄寒經(jīng)常用這句話(huà)作為開(kāi)頭來(lái)鼓勵自己的芯片團隊盡快完成 Turnkey整體音箱方案,因為在 5月份云知聲首款面向物聯(lián)網(wǎng)的 AI芯片——UniOne的發(fā)布會(huì )上,在 UniOne 上實(shí)現 Turnkey 音箱方案并將其整體開(kāi)源,已經(jīng)作為一個(gè)重大舉措發(fā)布了。

構建“芯時(shí)代”統一戰線(xiàn),云知聲宣布開(kāi)源全棧語(yǔ)音交互方案

談起之前和合作伙伴的合作,李霄寒還是比較感慨的,云知聲之所以能成為國內唯一實(shí)現 IVM(智能硬件模組)在白電領(lǐng)域大規模出貨的 AI公司,其中最關(guān)鍵的一條就是云知聲提供了軟硬件云+端一體化解決方案,為客戶(hù)提供了一站式解決方案。但是這種模式,讓很多希望和云知聲展開(kāi)合作的技術(shù)方案公司感覺(jué)云知聲不太愿意和大家一起玩,所以有人半開(kāi)玩笑半認真地說(shuō)云知聲比較“獨”。

構建“芯時(shí)代”統一戰線(xiàn),云知聲宣布開(kāi)源全棧語(yǔ)音交互方案

但是另一方面,李霄寒認為前兩年的“獨”,恰恰是對合作伙伴的負責。因為面向智能家居實(shí)現 AI落地,牽涉到非常多的環(huán)節,比如需要積累可以量產(chǎn)化的結構經(jīng)驗;比如需要通過(guò)引擎、硬件平臺選型以及系統優(yōu)化,滿(mǎn)足家電廠(chǎng)商整體的功耗要求;再比如適配云知聲引擎,并在價(jià)格和性能方面達到最佳配置的通用芯片選型。這些都需要經(jīng)過(guò)團隊之間日常的緊密的合作,有時(shí)候甚至需要針對某些硬件特點(diǎn)做相應的引擎代碼級別修改,才能真正實(shí)現最佳效果。

“如果僅僅提供一個(gè)引擎給自己的合作伙伴,再提供一些 SDK層面的適配和支持,其實(shí)對自己的合作伙伴,包括對自己的團隊,都是不負責任的。因為大家資源都是有限而寶貴的,引擎原廠(chǎng)沒(méi)有足夠的硬件、系統和產(chǎn)品經(jīng)驗,是無(wú)法高效支撐合作伙伴,最終大家做了很多合作,可能只是一場(chǎng)熱鬧,而無(wú)法做到量產(chǎn)出貨。”這是李霄寒的結論。

正是在這種思想的指導下,云知聲一面提供著(zhù) IVM的整體解決方案,一面把自己在 IVM實(shí)際落地場(chǎng)景下積累的經(jīng)驗和參數,落實(shí)到自有AI芯片UniOne的設計中,期望通過(guò)芯片,最大可能地把家居場(chǎng)景下的關(guān)鍵部分進(jìn)行固化,再將該芯片之上的全棧語(yǔ)音交互進(jìn)行開(kāi)源,大大降低技術(shù)門(mén)檻、縮短上市時(shí)間,從而確保合作伙伴與云知聲的合作都有收獲。

構建“芯時(shí)代”統一戰線(xiàn),云知聲宣布開(kāi)源全棧語(yǔ)音交互方案

“不過(guò)這么做壓力很大”,作為資深金庸迷,李霄寒有時(shí)候在內部開(kāi)玩笑,說(shuō)基于 UniOne整體開(kāi)源交互方案出來(lái)之前,自己經(jīng)常想起《倚天屠龍記》里面趙敏說(shuō)的那兩句話(huà)“周公恐懼流言日,王莽禮謙下士時(shí)”,不過(guò)這也更加促進(jìn)了自己領(lǐng)導的芯片團隊加班加點(diǎn)。

碎片化的IoT市場(chǎng) vs基于UniOne的統一戰線(xiàn)

兵無(wú)常勢,水無(wú)常形, UniOne出來(lái)后,云知聲也進(jìn)入到自己的“芯時(shí)代”,遠講降噪的2Mic、4Mic算法的各個(gè)參數,離線(xiàn)喚醒達到最佳喚醒率/誤喚醒率的閾值,離線(xiàn)識別命令的模型大小和反應速度,都已經(jīng)調到了最佳狀態(tài)并且固化在 UniOne中。在這種情況下,和合作伙伴一起做,就在一個(gè)非常穩固并且高起點(diǎn)地基礎上了。面向很多潛在地客戶(hù),云知聲均有一套經(jīng)過(guò)驗證過(guò)的參數,可以保證最終產(chǎn)品的性能,如果后續云知聲算法有升級,也可以通過(guò)刷新 UniOne中的固件來(lái)確保效果。與此同時(shí),UniOne上目前實(shí)現的音箱整體交互方案,也將開(kāi)源。

“Turnkey方案的開(kāi)源,必將大大促進(jìn)整體智能硬件產(chǎn)品的開(kāi)發(fā)”,談及這點(diǎn),李霄寒信心滿(mǎn)滿(mǎn),原因主要來(lái)源于以下三個(gè)方面:

一、智能硬件的產(chǎn)品經(jīng)理非常稀缺,尤其是懂語(yǔ)音交互設計的產(chǎn)品經(jīng)理。語(yǔ)音交互(VUI)與之前屏幕為主要展示的圖形界面交互(GUI)差別非常大,前者是扁平結構,一句話(huà)直達系統任何一個(gè)圖形界面,可以做任何一個(gè)操作。而后者是樹(shù)形結構,需要一步步點(diǎn)擊。這兩種交互各有優(yōu)勢,而VUI目前市面上人才不多,又由于其扁平結構的特性,在設計的時(shí)候,需要從系統整體層面來(lái)考慮,而不是簡(jiǎn)簡(jiǎn)單單一個(gè)App層面。如此總總,都大大增加了VUI設計難度。

“產(chǎn)品交互設計如果都不好,最終開(kāi)發(fā)的產(chǎn)品效果就可想而知了。”而作為云知聲創(chuàng )始團隊的李霄寒,在十多年前就在 Motorola中國研究中心從事人機交互相關(guān)的研究工作,從 Motorola手機上的語(yǔ)音交互到云知聲車(chē)載到格力空調、斐訊音箱,李霄寒帶領(lǐng)云知聲團隊積累了豐富的VUI設計和開(kāi)發(fā)經(jīng)驗,而這些經(jīng)驗凝結而成的整體語(yǔ)音交互方案,將隨著(zhù)UniOne一起作為T(mén)urnkey方案整體開(kāi)源,這一切將大大降低行業(yè)門(mén)檻。

二、語(yǔ)音交互方案開(kāi)源將大大縮短開(kāi)發(fā)周期。作為一個(gè)系統級的功能,語(yǔ)音交互方案將處理音頻驅動(dòng),處理與系統其他應用的交互,處理各個(gè)案件和喚醒事件,而且必須足夠健壯穩定,這些都隨著(zhù)云知聲開(kāi)源方案得到解決。合作伙伴可以只做淺層次的定制化改造,比如喚醒詞修改;也可以做深層次開(kāi)發(fā),比如基于云知聲架構框架增加自己的對話(huà)Session;也可以在看懂整體方案情況下,完全重寫(xiě)。

構建“芯時(shí)代”統一戰線(xiàn),云知聲宣布開(kāi)源全棧語(yǔ)音交互方案

三、 云知聲經(jīng)過(guò)考驗的實(shí)施團隊,提及云知聲的競爭優(yōu)勢,很多客戶(hù)都對云知聲的服務(wù)表示認可,這與云知聲有一支經(jīng)驗豐富并且善于和客戶(hù)配合的實(shí)施團隊密不可分。而在“芯時(shí)代”,這支團隊將為愿意采用云知聲UniOne的合作伙伴提供整體開(kāi)源方案的技術(shù)支持,包括代碼培訓、工具開(kāi)發(fā)等,盡一切可能降低合作伙伴熟悉整體開(kāi)源方案的學(xué)習曲線(xiàn)陡峭度。

正如在UniOne芯片發(fā)布會(huì )上李霄寒所強調的,IoT是一個(gè)碎片化的市場(chǎng),面對這個(gè)碎片化的市場(chǎng),如何以一個(gè)高效的方式應對,是云知聲,也是云知聲的合作伙伴需要認真面對并深度思考的?,F在云知聲給出了自己的回答,通過(guò)凝結自己場(chǎng)景落地經(jīng)驗的UniOne芯片,將其上的全棧語(yǔ)音交互方案進(jìn)行開(kāi)源,結成統一戰線(xiàn)。各個(gè)合作伙伴可以在開(kāi)源方案上將精力更多地放在自己熟悉的細分市場(chǎng)定制化方向,更快更好更多的出貨。而云知聲聚焦在自己性能改進(jìn)和芯片迭代,更高性能更低成本。

“9月份,大家一起來(lái)”,李霄寒非常高興自己終于可以在9月份的 UniOne Turnkey方案開(kāi)源研討會(huì )上甩掉戴在自己和云知聲頭上兩年多的“獨”的帽子了。

構建“芯時(shí)代”統一戰線(xiàn),云知聲宣布開(kāi)源全棧語(yǔ)音交互方案

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到