圖鴨科技武俊敏:打造從壓縮、通信到分析的完整視頻解決方案
圖像壓縮技術(shù)已經(jīng)存在20多年,20年來(lái)技術(shù)不斷地推進(jìn),導致其技術(shù)門(mén)檻越來(lái)越高。
我們經(jīng)常會(huì )遇到這種狀況,想要把圖片壓縮的又小又能保持圖片的高清度;想要在語(yǔ)音聊天時(shí)保持通話(huà)流暢;想要在視頻時(shí)保持視頻的清晰度和流暢度……
圖鴨科技就是這樣一家公司,他們主要研發(fā)圖片壓縮、通信傳輸和視頻分析技術(shù)與產(chǎn)品。
每個(gè)起點(diǎn)都不簡(jiǎn)單——高起點(diǎn)的圖像壓縮技術(shù)
圖鴨科技的CEO是來(lái)自上海交通大學(xué)的武俊敏。武俊敏在創(chuàng )立圖鴨科技前曾在專(zhuān)門(mén)做3G手機視頻直播業(yè)務(wù)的掌贏(yíng)科技當過(guò)首席科學(xué)家,主要研究人臉美化和表情遷移技術(shù)。
武俊敏在掌贏(yíng)科技積累了許多關(guān)于人臉美化和表情遷移的技術(shù),例如表情遷移用到小波變換、非線(xiàn)性TensorFlow等算法。而圖像壓縮是通過(guò)損失較少的比特存儲空間或不損耗比特,來(lái)表示原來(lái)像素矩陣,其使用的算法種類(lèi)更多也更加復雜??梢哉f(shuō)人臉美化、表情遷移與圖像壓縮技術(shù)是兩個(gè)完全獨立的技術(shù)。武俊敏的創(chuàng )業(yè)基于自身的學(xué)習基礎,轉向一個(gè)新的技術(shù)方向。而這個(gè)新方向要困難的多。
(圖:圖鴨科技CEO武俊敏)
“圖像壓縮技術(shù)已經(jīng)存在20多年,20年來(lái)技術(shù)不斷地推進(jìn),導致其技術(shù)門(mén)檻越來(lái)越高。”武俊敏說(shuō)道,“因此,我在一開(kāi)始請教了許多師兄和前輩,一起研究圖像壓縮的算法。”對于創(chuàng )業(yè)公司來(lái)說(shuō),開(kāi)始都是困難的,資金、人才、技術(shù)可能都處于一個(gè)不完善的狀態(tài)。但是,這些困難必須一個(gè)個(gè)解決掉,做不下去就要死去。
必須相信技術(shù)會(huì )不斷進(jìn)步——升級打造完整視頻解決方案
自2016年8月創(chuàng )建以來(lái),接近一年半的時(shí)間,圖鴨科技在圖像壓縮方面取得了不俗的成績(jì)。其圖像壓縮與JPEG相比,壓縮率提升了70% 多,和WebP相比壓縮率提高了60% 多。即在保持相同圖像峰值信噪比的同時(shí),極大減少了存儲空間。此技術(shù)能幫助需要大量傳輸、儲存圖片的企業(yè)節省一大筆開(kāi)支。
不過(guò),在圖像壓縮取得不錯成績(jì)后,武俊敏團隊發(fā)現,海量和高清的圖片和視頻對通信的要求很高。因此,圖鴨對圖像和音視頻的通信傳輸進(jìn)行了研究。
在2017年年初完成千萬(wàn)級天使輪融資后,圖鴨科技造的音視頻傳輸解決方案延時(shí)低至50-100ms。其內容主要包括保證質(zhì)量的前提下,允許免費接入VoIP SDK,零成本實(shí)現實(shí)時(shí)音視頻通訊功能。同時(shí),通訊效果普遍優(yōu)于Skype、微信等大眾品牌。
圖鴨還提供了所有涉及通訊方式的功能模塊,打通了Android、iOS、Mac和Windows等平臺,一站式服務(wù),保證節約接入和成本維護,使使用其系統的廠(chǎng)商不再為各個(gè)模塊接入SDK廠(chǎng)商不同而煩惱。
同時(shí),圖鴨不僅提供一站式服務(wù),還為開(kāi)發(fā)者提供了便利平臺。“去年年底VolP技術(shù)的服務(wù)器源代碼和客戶(hù)端網(wǎng)絡(luò )模塊代碼已經(jīng)開(kāi)源,開(kāi)發(fā)者可以進(jìn)行二次開(kāi)發(fā)。”武俊敏表示。
為了推動(dòng)壓縮技術(shù)的進(jìn)一步發(fā)展,武俊敏將壓縮和模式識別的技術(shù)融合,相互借鑒,創(chuàng )造性地得到了較好的壓縮效果。但是武俊敏對其技術(shù)發(fā)展還不滿(mǎn)意。
(圖:公司視頻分析項目展示)
所以,圖鴨科技在不斷進(jìn)行技術(shù)創(chuàng )新的同時(shí),又更加深入的探索視頻智能分析技術(shù)。視頻智能分析不僅使用到了已有的表情遷移和人臉美化技術(shù),還需要利用深度學(xué)習和人臉識別算法,對視頻進(jìn)行檢測和分類(lèi),提取視頻關(guān)鍵幀和關(guān)鍵段落。
這樣,公司就形成了一套完整的視頻解決方案,從視頻的壓縮,到通信傳輸,再到視頻的分析。
就像社會(huì )進(jìn)化論被很多理論學(xué)家質(zhì)疑,“技術(shù)會(huì )不斷的進(jìn)步”也被許多人質(zhì)疑。對于此,武俊敏認為,技術(shù)會(huì )不斷的進(jìn)步已經(jīng)成為技術(shù)工作者的一種價(jià)值取向,“你只有相信技術(shù)會(huì )不斷地進(jìn)步,才會(huì )不斷地去努力去實(shí)踐,這樣才有可能出成果。而不去實(shí)踐,是永遠不會(huì )出成果的。”
有道是,春江水暖鴨先知——迎接5G和AR設備的爆發(fā)點(diǎn)
雖然圖鴨科技已經(jīng)做出了一套完整的視頻解決方案,但是目前的分析系統能力還不夠強,其準確度和時(shí)間復雜度并沒(méi)有達到令武俊敏滿(mǎn)意的程度。
武俊敏說(shuō):“目前的分析系統要達到其基本要求,還需要1年時(shí)間,要達到滿(mǎn)意的要求約需一年半的時(shí)間。整個(gè)2018年,要將視頻解決方案上線(xiàn)并做好。”
目前,圖鴨科技在準備下一輪pre-A的融資,并打算在今年6月份之前完成。融資將被用于技術(shù)升級和公司運營(yíng)。當問(wèn)到圖鴨科技是否會(huì )在視頻解決方案之外,開(kāi)拓一些新的應用,武俊敏表示,“在公司技術(shù)發(fā)展成熟滿(mǎn)意之前,無(wú)意向其他業(yè)務(wù)方向擴散。對于一家科技公司來(lái)說(shuō),技術(shù)就是命根子。”武俊敏說(shuō)道。
(圖:圖鴨科技團隊)
就像電影《阿甘正傳》的臺詞一樣,“未來(lái)就像一盒巧克力,你永遠不知道下一顆是什么味道。”對于圖鴨科技和武俊敏來(lái)說(shuō),把眼光聚焦于當前技術(shù)的發(fā)展才是重中之重
而在靜心發(fā)展已有技術(shù)的同時(shí),仍要對未來(lái)的機會(huì )保持高度的敏銳度。眾所周知,當5G時(shí)代帶來(lái)的時(shí)候,將會(huì )給現有的視頻等數據傳輸帶來(lái)變革性的變化。對此武俊敏說(shuō),“5G的到來(lái)將會(huì )推動(dòng)公司的發(fā)展。5G時(shí)代帶來(lái)的更多的視頻量和更多的存儲需求,而基礎的光纖網(wǎng)絡(luò )設備并沒(méi)有太多的改進(jìn),因此對于整套視頻解決方案的要求也會(huì )更大。”同時(shí),AR眼鏡的爆發(fā)也會(huì )為企業(yè)帶來(lái)新的生機。對于這兩個(gè)機會(huì ),圖鴨科技會(huì )力求抓住。有道是“春江水暖鴨先知”。
結語(yǔ):
目前,國內做視頻壓縮、傳輸和分析的整套視頻解決方案的企業(yè)并不多。國外的此類(lèi)公司也大都只做其中某個(gè)方向,做出整個(gè)完整技術(shù)流程的并不多。因此,圖鴨科技的壓縮技術(shù)和整套視頻解決方案有極大的競爭優(yōu)勢。而且,圖鴨科技的解決方案已經(jīng)部分了落地,用在了智能門(mén)禁、遠程視頻傳輸、無(wú)人店等場(chǎng)景。
【鎂客·請講】專(zhuān)注于報道科技創(chuàng )新項目;我們敞開(kāi)心扉面對每一位創(chuàng )業(yè)者,力求為您呈現一群鮮活、有性格的品牌和人物;我們傾聽(tīng)創(chuàng )業(yè)故事和人生經(jīng)歷、探討商業(yè)模式和行業(yè)趨勢、對接資本市場(chǎng)和供需雙方,以期為產(chǎn)業(yè)發(fā)展注入新的活力。
歡迎做客【鎂客·請講】,欄目合作請發(fā)送郵件至:post@im2maker.com
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
