硬紀元AI峰會(huì )前瞻:成像技術(shù)距離下一次顛覆還有多遠?

Joker 8年前 (2017-07-03)

在現實(shí)生活中,越來(lái)越多的行業(yè)用到了攝像頭,像直播、監控等等,而在當下,因為某些物理原因,普通攝像頭已經(jīng)不能夠滿(mǎn)足行業(yè)發(fā)展的需求。

不論是成像技術(shù),亦或是三維感知,其實(shí)都屬于深度感知的范疇。雖然目前市場(chǎng)對于深度感知技術(shù)的需求呈井噴狀態(tài),但是能夠提供成熟產(chǎn)品和方案的公司卻屈指可數,造成這一現象的核心原因就是技術(shù)門(mén)檻過(guò)高。

硬紀元AI峰會(huì )前瞻:成像技術(shù)距離下一次顛覆還有多遠?

從三維感知的角度來(lái)看,AI人工智能主要分為感知和認知兩個(gè)層面。

針對感知層而言,有一個(gè)里程碑事件是深度傳感器的普及。2009年,微軟Kinect 誕生是當時(shí)的一個(gè)大事件,是人工智能感知傳感器中的革命性的里程碑,從此以后大家終于可以很方便和低成本地獲取3D信息了;另外,計算機視覺(jué)長(cháng)期存在兩大難題:圖像理解和三維重建。

一直以來(lái),求解3D都是人們的夢(mèng)想,最初它需要拍兩張或多張照片,費很大的勁兒來(lái)重建。但今天有了sensor,人們直接可以測量3D,它一下就開(kāi)啟了今天和未來(lái)的很多應用。

但是,Kinect V2是基于連續波間相法的ToF(Time-of-Flight)深度相機,它存在不能抗陽(yáng)光,不能遠距離工作的缺陷。而另一種獲取三維數據的方式是通過(guò)機械掃描式激光雷達,但它同樣存在無(wú)法解決的缺陷:產(chǎn)能受限成本高、數據稀疏空間分辨率低,限制了它們的應用范圍。

深度感知現有的三種解決方案

現階段常見(jiàn)的深度感知解決方案,主要依靠深度攝像頭,在獲取平面圖像之外,還可以獲取圖像中的深度信息,比如說(shuō)三維的位置以及尺寸等信息,這也就讓計算機獲得了環(huán)境和對象的三維立體數據。

硬紀元AI峰會(huì )前瞻:成像技術(shù)距離下一次顛覆還有多遠?

從技術(shù)角度來(lái)細分的話(huà),深度感知攝像頭目前有如下三種解決方案:

結構光:目前應用最廣泛的深度感知方案,基本原理是由結構光投射器向被測物體表面投射可控制的光點(diǎn)、光條或光面結構,并由圖像傳感器獲得圖像,通過(guò)系統幾何關(guān)系,利用三角原理計算得到物體的三維坐標。上文中提到的Kinect 1代就是使用的這項技術(shù)。

雙目視覺(jué):只需安裝兩個(gè)攝像頭,利用雙目立體視覺(jué)成像原理,通過(guò)兩個(gè)攝像機來(lái)提取包括三維位置在內的信息進(jìn)行深度感知。因為沒(méi)有涉及光學(xué)系統,所以雙目視覺(jué)解決方案的成本較低,但是該項技術(shù)對于硬件設備的要求又相對較高。

ToF:飛行時(shí)間(Time of Flight)技術(shù)的縮寫(xiě),基本原理是傳感器發(fā)出經(jīng)調制的近紅外光,遇物體后反射,傳感器通過(guò)計算光線(xiàn)發(fā)射和反射時(shí)間差或相位差,來(lái)?yè)Q算被拍攝景物的距離,以產(chǎn)生深度信息,此外再結合傳統的相機拍攝,就能將物體的三維輪廓以不同顏色代表不同距離的地形圖方式呈現出來(lái)。ToF是受環(huán)境影響最小的技術(shù),不過(guò)由于其分辨率不高,所以并不適用于高精度需求的應用場(chǎng)景。

三維感知技術(shù)對于A(yíng)I的革命性推動(dòng)及應用

目前全球范圍內感知深度的ToF傳感器有很多種,其中以光珀智能科技的ToF傳感器最具代表性。

杭州光珀智能科技有限公司(以下簡(jiǎn)稱(chēng)“光珀”)主要專(zhuān)注于全球新一代ToF傳感器技術(shù)的研發(fā)。光珀在基于PCT的專(zhuān)利保護下提出原理創(chuàng )新,使得他們的ToF傳感器和傳統的ToF深度相機(基于連續波間相法)相比,其遠距離及抗陽(yáng)光的特性更類(lèi)似傳統意義上的激光雷達。同時(shí)也解決了機械掃描式激光雷達產(chǎn)能受限成本高、數據稀疏空間分辨率低的兩大缺陷。

光珀智能CEO白云峰介紹說(shuō):“目前,我們已經(jīng)推出了‘光珀第一代ToF傳感器芯片’,并由此構建了三個(gè)固態(tài)面陣激光雷達技術(shù)平臺,分別滿(mǎn)足不同距離下(近、中、遠)、強陽(yáng)光下(100Klux)、大場(chǎng)景(70?)、高精度(<1%)、高空間分辨率(0.06?H)等三維感知需求。這三個(gè)技術(shù)平臺可以服務(wù)于智能安防、機器人的導航與避障、無(wú)人駕駛的環(huán)境感知。特別是在無(wú)人駕駛領(lǐng)域,光珀的傳感器滿(mǎn)足了量產(chǎn)無(wú)人車(chē)對激光雷達低成本、高空間分辨率的兩大需要。

“光珀正和科研院校聯(lián)手創(chuàng )建大場(chǎng)景下的稠密三維數據集。而我們相信,這樣的數據集會(huì )對未來(lái)人工智能的發(fā)展有著(zhù)革命性的推動(dòng)作用。”

深度感知領(lǐng)域還能有哪些突破?

現階段的深度感知技術(shù)還處于前期,雖然在硬件性能和算法程序上已經(jīng)有所突破,但是依然面臨諸多限制,這也導致了很多應用場(chǎng)景還處于商業(yè)化探索階段。那么,對于深度感知領(lǐng)域,還能有哪些突破?

硬紀元AI峰會(huì )前瞻:成像技術(shù)距離下一次顛覆還有多遠?

如果你想得到答案,就一定不要錯過(guò)鎂客網(wǎng)7月9日在北京國家會(huì )議中心舉辦的“3E“硬紀元”AI+產(chǎn)業(yè)應用創(chuàng )新峰會(huì )”,峰會(huì )期間將會(huì )有眾多人工智能、深度感知領(lǐng)域的大咖,分享他們的最新見(jiàn)解與洞察。所以,你還在猶豫什么,趕緊點(diǎn)擊鏈接報名參加吧!

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到