計算機視覺(jué)下一個(gè)技術(shù)拐點(diǎn)?前端成像或將開(kāi)啟“視覺(jué)2.0時(shí)代”
目前國內AI視覺(jué),幾乎都把焦點(diǎn)集中在對圖像的后端處理上。雖然算法足夠優(yōu)秀,但產(chǎn)品落地卻困難重重,原因是忽略了前端成像的重要作用。
“計算機視覺(jué)的前端成像技術(shù),背后是至少100億數量級的龐大需求!”
在日前剛結束的2018 AWE現場(chǎng),身為眼擎科技CEO的朱繼志,滿(mǎn)懷激動(dòng)的下了這么一個(gè)結論。
朱繼志說(shuō)話(huà)的語(yǔ)氣非常篤定,因為他們的eyemore X42芯片上市不到兩個(gè)月,就已一路高歌,初露崢嶸。而業(yè)內對eyemore X42的看法是:這款全球第一款完全自主研發(fā)并正式對外發(fā)布的AI視覺(jué)成像芯片將“引領(lǐng)AI機器進(jìn)入視覺(jué)2.0時(shí)代”。
既然這款芯片目前在國內甚至全球同領(lǐng)域內屬于獨一份,好奇之下,我們不禁就和他多聊了幾句。
2018將是AI落地第一年,視覺(jué)市場(chǎng)規模潛力巨大
近幾年,人工智能的火熱是毋庸置疑的,上到國家兩次將其寫(xiě)入政府工作報告,下到雨后春筍般出現的各種AI公司,所有這些都在昭示著(zhù)一個(gè)嶄新的人工智能時(shí)代即將到來(lái)。
同樣的,在眾多的AI技術(shù)和應用中,計算機視覺(jué)是最大的切入點(diǎn)和最具潛力的領(lǐng)域。畢竟,在我們獲取的全部信息中,視覺(jué)信息的比例達到了80%以上,因此,這將是一個(gè)前景無(wú)限的市場(chǎng)方向。
計算機視覺(jué)的應用領(lǐng)域幾乎涵蓋了我們所知的所有行業(yè),自動(dòng)駕駛、金融風(fēng)控/交易、安防、新零售、智能手機、機器人......
國內計算機視覺(jué)領(lǐng)域,商湯和曠世算是兩只最大的獨角獸,而他們于去年上演的融資競賽更是吸引了無(wú)數業(yè)內人士的目光:先是2017年7月,商湯科技B輪融資4.1億美元,接著(zhù)到10月31日,曠視科技Face++又宣布獲得4.6億美元C輪融資,隨后商湯即傳出接受阿里15億元投資的消息......
不用多說(shuō)什么,僅從這一連串創(chuàng )紀錄的融資金額中,我們就可以感受到計算機視覺(jué)在A(yíng)I界的熱度。
據相關(guān)研究報告預計,2018年全球計算機視覺(jué)市場(chǎng)規模將達到50億美元左右,而到2020年,中國計算機視覺(jué)市場(chǎng)規模將增長(cháng)至725億元,未來(lái)前景極為廣闊。
“2016年是AI的概念年,2017年是demo年,2018年是落地第一年。”朱繼志認為,在未來(lái)的三年內,AI會(huì )很快的實(shí)現更為廣泛的落地應用 。
“盡管現在整個(gè)產(chǎn)業(yè)很多技術(shù)都還有一些問(wèn)題,但是其整體架構已經(jīng)出來(lái)了。”朱繼志說(shuō)。
深耕前端成像領(lǐng)域,視覺(jué)2.0將為產(chǎn)業(yè)生態(tài)帶來(lái)質(zhì)變
眾所周知的是,目前國內AI視覺(jué)領(lǐng)域的科技企業(yè),幾乎都在使用傳統攝像頭,都把焦點(diǎn)集中在對圖像的后端處理上。這就導致了一個(gè)尷尬的現象:絕大多數的AI公司算法足夠優(yōu)秀,但前端成像技術(shù)不過(guò)硬,導致實(shí)際落地時(shí)機器的“眼睛”不能適應外界光線(xiàn)變化,識別效果差的尷尬局面。
以自動(dòng)駕駛汽車(chē)為例,在諸如車(chē)輛經(jīng)過(guò)隧道、對面駛來(lái)的車(chē)開(kāi)大燈、夜間紅綠燈被道路景觀(guān)燈遮擋/干擾、夜色漆黑伸手不見(jiàn)五指等等異常情況下,往往會(huì )由于識別不準而發(fā)生行車(chē)事故;
同樣,安防領(lǐng)域也會(huì )因為紅外黑白畫(huà)面和逆光的人臉發(fā)黑而無(wú)法識別、工業(yè)檢測中會(huì )有因為高光和反光導致無(wú)法檢測的情形等等。
“在復雜的光線(xiàn)環(huán)境下,AI機器獲取的圖像信噪比會(huì )受到極大影響,這是導致市場(chǎng)上AI視覺(jué)產(chǎn)品難以落地的最大原因。”朱繼志認為,要徹底解決這一難題,關(guān)鍵在于做好AI視覺(jué)產(chǎn)品的前端成像。
要克服AI機器在復雜光線(xiàn)下的圖像識別,就要首先解決圖像的獲取和前端處理。目前,業(yè)內主流的解決方案有3種。
第一種就是我們所熟知的激光雷達,在光線(xiàn)不好的情況下,通過(guò)主動(dòng)發(fā)射激光并利用光線(xiàn)反射來(lái)獲取物體的圖像和三維信息。激光雷達的優(yōu)點(diǎn)非常明顯,它可以獲得極高的角度、距離和速度分辨率,同時(shí)也具有良好的抗干擾能力。
不過(guò),受限于巨大的體積和昂貴的價(jià)格(各類(lèi)32線(xiàn)、42線(xiàn)、64線(xiàn)等型號產(chǎn)品,價(jià)格動(dòng)輒數萬(wàn)數十萬(wàn)甚至上百萬(wàn),雖然在持續降低,但依然不親民),它正在被邊緣化。正如馬斯克所說(shuō)的,“激光雷達就像一根拐杖”。這個(gè)比喻很恰當,視覺(jué)能力不行的時(shí)候,需要依靠激光雷達這樣的拐杖,但拿著(zhù)拐杖卻是永遠跑不快的。
剩下的兩種方案則都是在相機和成像處理的基礎上加以改進(jìn)。首先是陣列計算相機技術(shù),原理有點(diǎn)類(lèi)似于蜻蜓、蒼蠅等多目昆蟲(chóng)的復眼,通過(guò)數個(gè)、數十個(gè)甚至上百個(gè)相機組成的陣列,拍攝出擁有億級以上像素的動(dòng)態(tài)圖像,為AI機器提供視覺(jué)支持。
目前,這一技術(shù)尚在研發(fā)階段,受限于體積和供應鏈的制約,其產(chǎn)品也還處在落地的早期階段。
第三種方案,即是眼擎科技所做的,AI視覺(jué)前端成像引擎芯片eyemore X42。
據朱繼志介紹說(shuō),眼擎所做的這種方式,像人的眼睛一樣,核心是把人的眼睛視力弄好——解決AI機器在各種光線(xiàn)下自動(dòng)適應光線(xiàn)的能力。
“我們堅信,以后AI機器的眼睛應該和我們人類(lèi)一樣,以后它們的視力一定不會(huì )比人眼差,甚至比人眼強。這就是我們創(chuàng )業(yè)的初衷,我們要從根本上解決AI的視力問(wèn)題。”
眼擎eyemore X42芯片,視覺(jué)2.0時(shí)代的AI機器成像引擎
關(guān)于A(yíng)I視覺(jué),馬斯克曾經(jīng)提出過(guò)“全天候被動(dòng)光學(xué)圖像識別”的概念,就是要解決復雜光線(xiàn),包括弱光、逆光、反光下的精準識別,這也是AI機器要解決的剛需問(wèn)題。眼擎科技把這種自動(dòng)適應光線(xiàn)的視覺(jué),稱(chēng)之為“視覺(jué)2.0”。
2018年1月19日下午,在2018極客公園創(chuàng )新大會(huì )上,國內AI視覺(jué)成像芯片科技公司眼擎科技正式對外發(fā)布“eyemore X42”芯片。據悉,eyemore X42是全球第一款完全自主研發(fā)并正式對外發(fā)布的AI視覺(jué)成像芯片。
數據顯示,eyemore X42成像引擎芯片,擁有比傳統ISP高20倍的計算能力,采用了20多種新的成像算法,集成了超過(guò)500種不同場(chǎng)景下的復雜光線(xiàn)數據。
eyemore X42芯片有三個(gè)特點(diǎn):首先它是一顆獨立成像芯片。目前各種相機、智能手機、攝像頭里都有成像功能,但都是被集成在主芯片里面的,只能叫集成成像。而eyemore X42整顆芯片只專(zhuān)注于一件事情,那就是成像。這有點(diǎn)像Intel的CPU帶了集成顯卡功能,但我們知道,只有像NVIdia的專(zhuān)用GPU才一定是未來(lái)的主流。
第二個(gè)特點(diǎn),eyemore X42拋棄了傳統的ISP成像架構,采用了全新的成像引擎架構,來(lái)解決復雜光線(xiàn)下的成像難題。而傳統的ISP,從架構上來(lái)講,無(wú)論如何也無(wú)法完美解決復雜光線(xiàn)的問(wèn)題。
第三個(gè)特點(diǎn)是,eyemore X42提供了豐富的API接口,讓做后端圖像識別的算法工程師,可以很方便的控制成像的過(guò)程。
eyemore X42的性能有多強大?也許其發(fā)布會(huì )當天現場(chǎng)演示的“微光/暗光環(huán)境下實(shí)現精準識別”的實(shí)驗,就能很好的說(shuō)明問(wèn)題。
“如果你問(wèn)所謂的微光會(huì )微到什么程度?這個(gè)很簡(jiǎn)單,我們有一個(gè)基本的標準,就是和人眼比,我們就是要超越人眼”,朱繼志說(shuō)到。
人眼的視網(wǎng)膜里有大約1.25億個(gè)視桿細胞和視錐細胞,它們扮演感光器的角色。其中,視桿細胞感知光線(xiàn)的明暗,而視錐細胞負責感知顏色。到光線(xiàn)的明暗達到一定程度(過(guò)亮或過(guò)暗)的時(shí)候,視錐細胞就停止工作,轉而切換到視桿細胞,因此這時(shí)人眼就只能感受到黑白的灰度,暫時(shí)失去了感知顏色的能力。
“我們現在做的事情是比人眼18個(gè)DB的八倍,在那種情況下。所以,在人眼看不清顏色、只能看清輪廓的情況下,我們能夠精準的還原顏色。”
人對世界顏色的感知能力是有限的,雖然理論上說(shuō)人的眼睛可以分辨出出高達1200萬(wàn)種顏色,但實(shí)際上遠遠低于這個(gè)數字。但機器能不能分辨出一百萬(wàn)種、一千萬(wàn)種甚至更多種顏色呢?這完全有可能。
我們很難想象的到,一個(gè)機器超越人眼之后可以做些什么。高維視覺(jué)和低維視覺(jué)相比,具有無(wú)可比擬的優(yōu)越性。
比如看到一朵花,我們看到的只是白色的,但機器看到的是五顏六色的,因為可能有100種白。這就是機器進(jìn)步的核心能力,能夠看到更多的信息,所以能夠給出更精準的反饋。
AI實(shí)體化之下,5年內視覺(jué)芯片將有100億數量級需求
隨著(zhù)AI技術(shù)的進(jìn)一步發(fā)展和應用的持續擴大,各種由AI芯片驅動(dòng)的機器/設備持續出現,使得AI已經(jīng)越來(lái)越呈現出實(shí)體化的趨勢。
“得益于人工智能的廣泛應用,目前已經(jīng)形成了一個(gè)很大的技術(shù)生態(tài)。在這個(gè)龐大的生態(tài)海洋里,AI機器這個(gè)新的物種已經(jīng)開(kāi)始進(jìn)化出來(lái),這些AI機器將會(huì )迅速進(jìn)入我們的現實(shí)世界。”朱繼志說(shuō)。
AI機器區別于一般機器的最大特點(diǎn)是,它不是一個(gè)普通的工具,它自己有大腦。我們可以把自動(dòng)駕駛、機器人、包括工藝檢測設備、智能的安防攝像頭/門(mén)禁/鎖具等等,都看做一個(gè)AI的機器。
另一方面,從信息時(shí)代發(fā)展到如今的AI時(shí)代,競爭核心已經(jīng)從加工制造工藝/硬件設備性能的競爭,升級為算力和算法的比拼。由此,作為算法和算力承載的芯片,就成了當今時(shí)代最大的競爭焦點(diǎn)。
而AI機器需要數量更多的、性能更強大的芯片,即各種AI芯片。
“AI機器這個(gè)新物種,就是被各種芯片所驅動(dòng)的。在比拼算法和算力的時(shí)代,一個(gè)AI機器所需要的芯片的數量,也就是芯片的密度,會(huì )呈現數量級的增長(cháng)。”
以目前突然躥紅的比特幣為例,其挖礦的設備——礦機,就是芯片的需求大戶(hù)。在一個(gè)普通的礦機里,就會(huì )有幾十到數百顆處理器芯片,而這個(gè)在以前是不可能想象的。
除此之外,基于萬(wàn)物互聯(lián)場(chǎng)景下的自動(dòng)駕駛汽車(chē),它的視覺(jué)系統、路徑規劃系統、車(chē)內溫度調節、對外通訊通信等等,每一個(gè)獨立的處理單元都至少需要一顆芯片;同樣的還有各種機器人、各種無(wú)人機、安防監控、無(wú)人超市......
朱繼志認為,以后一臺AI機器對各種各樣的芯片的需求,會(huì )有成百上千個(gè)。在視覺(jué)2.0的內因驅動(dòng)下,各類(lèi)AI芯片的大規模應用時(shí)代已然來(lái)臨,AI機器這個(gè)新物種,將為AI芯片開(kāi)辟一個(gè)龐大的新增市場(chǎng)。
AI機器對視覺(jué)器官的需求量同樣是巨大的,由此AI視覺(jué)芯片的供應量也將隨之激增。
在汽車(chē)領(lǐng)域,一臺自動(dòng)駕駛的汽車(chē),將會(huì )安裝10個(gè)視覺(jué)攝像頭;在安防領(lǐng)域,所有的監控攝像頭,都面臨著(zhù)人臉識別的升級;在工業(yè)設備領(lǐng)域,通過(guò)視覺(jué)的方式進(jìn)行產(chǎn)品的檢測,將會(huì )成為每一條產(chǎn)線(xiàn)的標配,以后每一條產(chǎn)線(xiàn)上都將配置超過(guò)10個(gè)智能攝像頭;在無(wú)人零售,如Amazon go正在把關(guān)注的重點(diǎn)從商品的標簽遷移到每個(gè)顧客的消費習慣,它的每家無(wú)人零售店都配置了超過(guò)100個(gè)以上的攝像頭。
據不完全預測,未來(lái)5年內,各種各樣的AI機器將會(huì )帶來(lái)100億數量級的視覺(jué)設備需求,而視覺(jué)芯片的需求量將高于這個(gè)數字。
“這將是所有AI芯片創(chuàng )業(yè)者的機會(huì )。”
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
