機器視覺(jué)市場(chǎng)腥風(fēng)血雨,華捷艾米要做嵌入式的3D感知芯片
在蘋(píng)果iPhone X的Face ID帶動(dòng)下,基于深度傳感器獲取深度信息的傳感器廠(chǎng)商正在迎來(lái)發(fā)展的黃金時(shí)間。
近幾年,在機器視覺(jué)領(lǐng)域內,一直出現大公司并購、整合小的技術(shù)公司的情況,鎂客君此前做過(guò)一張表格,統計了像蘋(píng)果、Facebook、微軟等大公司收購或者投資的三維視覺(jué)技術(shù)公司:
Markets and Markets的一份報告也顯示,預計到2020年全球機器視覺(jué)市場(chǎng)規模將達到125億美元。麥姆斯咨詢(xún)也顯示,預計2016~2022年間3D傳感器市場(chǎng)規模的復合年增長(cháng)率為26.5%,2022年將達到54.6億美元。
“這個(gè)市場(chǎng)一旦到了消費級,成本降下來(lái)之后必然會(huì )出現很多的并購,技術(shù)的整合,不過(guò)現在深度傳感器市場(chǎng)還很小,大鱷還沒(méi)有進(jìn)來(lái)。”同樣是專(zhuān)注于機器視覺(jué)研發(fā)的華捷艾米聯(lián)合創(chuàng )始人沈瑄表示。
在今年的高交會(huì )上,當鎂客君見(jiàn)到沈瑄時(shí)候,滿(mǎn)頭大汗的他剛和客戶(hù)聊完,正坐在展區的休息沙發(fā)上,大口地啃著(zhù)麥當勞的漢堡,當時(shí)已經(jīng)是下午四點(diǎn)左右。
時(shí)勢造英雄。就像大多數人工智能公司一樣,在多年的技術(shù)積累后,華捷艾米趕上了這一波AI熱潮。
深度傳感器市場(chǎng)的腥風(fēng)血雨
高交會(huì )上,華捷艾米的展臺也吸引了非常多的年輕用戶(hù),在電視大屏前,手舞足蹈地和屏幕內的游戲內容交互:身體動(dòng)一下,游戲內的人物位置也會(huì )相應發(fā)生變化,當你跳一下,相對應的游戲人物也會(huì )做出跳躍的反饋,這就是華捷艾米基于自研芯片打造的AR體感交互產(chǎn)品IMI-3DAR攝像頭,芯片中的骨骼跟蹤技術(shù)能夠準確、實(shí)時(shí)的識別玩家的動(dòng)作。
據沈瑄介紹,目前華捷艾米的產(chǎn)品主要有三類(lèi),第一個(gè)是相關(guān)項目;第二是整機產(chǎn)品,他們將OTT盒子和攝像頭做成了一體,主要應用于教育或者學(xué)習領(lǐng)域;第三是小型化手機模組。
“雖然AR攝像頭應用于手機領(lǐng)域的市場(chǎng)是應用于TV市場(chǎng)的十倍,但由于手機集成化很高,添加體感技術(shù)這一功能相對較難。相比之下,AR體感技術(shù)嵌入TV則比較簡(jiǎn)單,嵌入良率高達98%,所以短期之內,我們先推出嵌入TV的產(chǎn)品,將其做好之后,逐步向手機領(lǐng)域拓展。”
IMI-AR一體機
說(shuō)到捕捉三維視覺(jué)信息,主流的三種技術(shù)方案:雙目、結構光以及飛行時(shí)間(TOF),從功耗、準確率以及環(huán)境適應性來(lái)說(shuō)各有優(yōu)劣。
華捷艾米的技術(shù)主要是結構光的方案,以飛行時(shí)間為例,“TOF的精確度是要比結構光要高的 但是它的成本、功耗和結構光相比就高很多了。”
“我們只能說(shuō)是在某個(gè)時(shí)間點(diǎn),選擇最優(yōu)性?xún)r(jià)比的技術(shù)方案,而在當下,結構光無(wú)疑是最佳的選擇,”
正如開(kāi)篇所說(shuō),華捷艾米也收到了收購的橄欖枝,“我們不會(huì )賣(mài)的,現在這個(gè)市場(chǎng)才剛剛起步。”
嵌入式的方案是消費端的趨勢
華捷艾米的3D感知芯片研發(fā)已經(jīng)進(jìn)入第三代,沈瑄表示,“明年我們要做16nm制程的,18年11月份第一批會(huì )正式量產(chǎn),現在的重點(diǎn)是做嵌入式的方案,包括嵌入到電視機、平板以及手機中,這一代芯片的量產(chǎn)會(huì )在明年3月份。”
在蘋(píng)果iPhone X的Face ID帶動(dòng)下,基于深度傳感器獲取深度信息的傳感器廠(chǎng)商正在迎來(lái)發(fā)展的黃金時(shí)間,而像華捷艾米的嵌入式方案無(wú)疑是最佳的選擇。
他們的嵌入式方案主要包括三大塊:芯片、光學(xué)元件以及軟件的SDK,沈瑄認為這種嵌入式的方案是消費端的趨勢,蘋(píng)果正在將這股風(fēng)帶起來(lái)。
“主要推的還是手機廠(chǎng)商,除了提供硬件之外,人臉、手勢的路徑規劃算法都會(huì )融入到新的芯片中。”
在手機的人臉識別這塊,雖然目前也有手機廠(chǎng)商推出人臉識別解鎖,但是和蘋(píng)果的結構光方案相比,差距很大,簡(jiǎn)單的2D圖片都可以蒙混過(guò)關(guān),用沈瑄的話(huà)說(shuō),安卓市場(chǎng)要等到明年9、10月份才能逐漸擁有類(lèi)似于Face ID的人臉識別功能。
我們認為AR肯定會(huì )火!
眼瞅著(zhù)2017年又要快結束了,去年的這個(gè)時(shí)候,VR遇到了高潮后的第一波落潮,一年的時(shí)間內,整個(gè)VR硬件、內容生態(tài)圈并沒(méi)有發(fā)生大的變化,相較之下,AR反而有種迎頭而上的勢頭。
在沈瑄看來(lái),VR行業(yè)在15年起來(lái)以后,走下坡路無(wú)非就兩個(gè)主要原因:
“硬件的不成熟,電池、眩暈的問(wèn)題,如果你要達到很好的效果價(jià)格就上來(lái)了,而消費級市場(chǎng)對這個(gè)是最敏感的。
其次是體驗的問(wèn)題導致硬件的普及率不高,反向又造成了內容和CP的投入不夠,沒(méi)有終端,我做的游戲推給誰(shuí)呢?”
沈瑄認為在VR發(fā)展走到拐角的時(shí)候,蘋(píng)果解決了AR的問(wèn)題。
“我們認為AR肯定會(huì )火!”
“蘋(píng)果把結構光做成嵌入式的3D相機,通過(guò)iPhone推廣出去,讓這個(gè)技術(shù)和設備來(lái)到了普通消費者身邊。第二,他們有App Store,App Store的聚合和引領(lǐng)力太大了,現在每周有幾百款用ARkit開(kāi)發(fā)的應用。以日區為例,AR排名第一的應用周下載量都是2、30萬(wàn)。”
華捷艾米選擇在這個(gè)時(shí)間點(diǎn)做一些正確的事情,“其實(shí)我們對華捷艾米的定義是,未來(lái)我們做的是AR芯片、算法,像光學(xué)模組這些任何一家手機模組廠(chǎng)商都可以去做。”
所以對于華捷艾米來(lái)說(shuō),他們最核心的永遠是算法,這也是他們最根本的價(jià)值所在。
“像谷歌也在做這塊市場(chǎng),他們要在19年出一個(gè)10nm的芯片,我們知道走這條路肯定是對的。”
未來(lái),最普通的攝像頭也能獲取三維視覺(jué)信息
由于機器視覺(jué)是非?;A的技術(shù),所以它應用的場(chǎng)景非常多,比如電視、游戲健身、教育培訓、機器人、醫療康復、智能安防以及IOT物聯(lián)網(wǎng)等領(lǐng)域。
未來(lái)在深度傳感器領(lǐng)域內,消費級市場(chǎng)會(huì )越來(lái)越大,但是圍繞倉儲、物流的企業(yè)級市場(chǎng)也有很大的機會(huì ),以京東的無(wú)人倉儲為例,機器人自動(dòng)運貨送到定點(diǎn),都需要基于深度傳感器獲取環(huán)境中的深度信息。
沈瑄認為。“隨著(zhù)計算能力的強化以及技術(shù)的發(fā)展,以后甚至是最普通的攝像頭也能完成對三維視覺(jué)信息的獲取。”
以人類(lèi)為例,我們的大腦皮層有50%的區域是用于視覺(jué),在經(jīng)過(guò)幾億年的進(jìn)化以后,我們的眼鏡可以在150毫秒內將看到的場(chǎng)景識別理解出來(lái)。但是,現在要讓機器只憑簡(jiǎn)單的攝像頭做到這些是不可能的,首先它們的二進(jìn)制計算方式和人腦神經(jīng)元就有很大區別,現有的計算力無(wú)法在這么短的時(shí)間內識別出,但是隨著(zhù)像模仿人類(lèi)大腦的量子計算機的發(fā)展,或許十年以后,兩個(gè)普通的RGB攝像頭就可以識別出深度信息。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
