計算機視覺(jué)中的深度學(xué)習:技術(shù)、市場(chǎng)和5個(gè)你想不到的未來(lái)
本文從算法、市場(chǎng)及硬件三個(gè)角度觀(guān)察深度學(xué)習對計算機視覺(jué)的影響。
【編者按】本文由新智元整理,來(lái)源:vision-system.com,整理:王楠
本文從算法、市場(chǎng)及硬件三個(gè)角度觀(guān)察深度學(xué)習對計算機視覺(jué)的影響。以下三個(gè)視頻中,谷歌TensorFlow移動(dòng)端和嵌入式應用團隊負責人Pete Warden介紹了如何用TensorFlow框架開(kāi)發(fā)不同的低能耗深度學(xué)習產(chǎn)品。調研公司Tractica首席分析師表示,到2024年,深度學(xué)習服務(wù)業(yè)產(chǎn)值將超過(guò)500億美元。IEEE Fellow Chris Rowen預測,神經(jīng)網(wǎng)絡(luò )將催生出新的價(jià)值鏈,全新的IP、工具和數據服務(wù)也會(huì )應運而生。
嵌入式視覺(jué)聯(lián)盟主編Brian Dipert今天發(fā)布博文,介紹了2016年嵌入式視覺(jué)峰會(huì )(Embedded Vision Summit)中有關(guān)深度學(xué)習的內容:
谷歌工程師Pete Warden介紹如何利用TensorFlow框架,開(kāi)發(fā)為Google Translate、Google Photos等不同產(chǎn)品訂制的深度學(xué)習方案;
調研公司Tractica的首席分析師Bruce Daley從市場(chǎng)的角度介紹深度學(xué)習在計算機視覺(jué)產(chǎn)業(yè)生態(tài)中的影響,以及Tractica對未來(lái)計算機視覺(jué)市場(chǎng)發(fā)展和機遇的預測;
最后,電子設計自動(dòng)化軟件公司Cadence的CTO、IEEE Fellow Chris Rowen給出了神經(jīng)網(wǎng)絡(luò )在計算機視覺(jué)產(chǎn)業(yè)的五大趨勢。
讓嵌入式機器智能成為可能
TensorFlow移動(dòng)端和嵌入式應用團隊負責人Pete Warden,介紹了如何使用TensorFlow框架開(kāi)發(fā)不同的深度學(xué)習產(chǎn)品,還談了谷歌為什么選擇開(kāi)源TensorFlow,以及讓這個(gè)機器學(xué)習框架支持低功耗應用的方法。Warden此前是機器學(xué)習算法公司Jetpac 的CTO,在2014年該公司被谷歌收購后加入谷歌。
Warden開(kāi)場(chǎng)直奔主題,再次為人盡皆知的TensorFlow打廣告:是深度學(xué)習開(kāi)源框架;支持視覺(jué)、語(yǔ)音及自然語(yǔ)言處理等多種應用;在谷歌公司內外都有廣泛應用,在谷歌內部的應用包括Google Translate、Google Photos、OK Google、RankBrain。
Warden號召開(kāi)發(fā)人員都來(lái)使用TensorFlow,因為T(mén)ensorFlow擁有經(jīng)過(guò)完善測試、產(chǎn)品級的代碼,專(zhuān)門(mén)針對工程師需求,歷史記錄會(huì )得到妥善管理,他們團隊一直認真工作,所以長(cháng)期支持沒(méi)有問(wèn)題。
TensorFlow使用圖表示計算任務(wù),圖中的節點(diǎn)被稱(chēng)之為 op,一個(gè) op 獲得 0 個(gè)或多個(gè) Tensor, 執行計算, 產(chǎn)生 0 個(gè)或多個(gè) Tensor。每個(gè) Tensor 是一個(gè)類(lèi)型化的多維數組,比如一個(gè)圖像集可以表示為四維浮點(diǎn)數數組。
Warden介紹了怎樣用TensorFlow打造App:首先,下載一個(gè)免費的TensorFlow模型,當然這個(gè)模型是已經(jīng)訓練過(guò)了的,然后,使用你自己的圖像數據訓練這個(gè)模型。這之后就可以開(kāi)始用TensorFlow搭建自己的平臺,在移動(dòng)設備上用C++運行。Warden接著(zhù)講了在TensorFlow上調用C++的方法。
在談到為什么世界上還需要一個(gè)開(kāi)源機器學(xué)習框架的時(shí)候,Warden表示,TensorFlow與OpenCL不同,是一種描述神經(jīng)網(wǎng)絡(luò )的高級語(yǔ)言,不過(guò)TensorFlow也支持OpenCL和CUDA。至于TensorFlow與OpenCV的區別——總之OpenCV很好,有很多傳統計算機視覺(jué)模塊,鑒于深度學(xué)習得出的結果一般會(huì )更好,將兩者整合起來(lái)也很容易。
TensorFlow具有獨一無(wú)二的架構,模塊化和數據流的優(yōu)化性能高于其他開(kāi)源深度學(xué)習框架。在谷歌,TensorFlow的開(kāi)發(fā)過(guò)程一直是產(chǎn)品導向的。
作為移動(dòng)端和嵌入式應用團隊的負責人,Warden強調,TensorFlow非常重視移動(dòng)端和嵌入式應用的開(kāi)發(fā),TensorFlow結構很容易簡(jiǎn)化,也就能夠應用于低功耗App。TensorFlow支持推理的8比特整數計算,并且專(zhuān)門(mén)針對8比特整數代碼做了優(yōu)化。
深度學(xué)習服務(wù)產(chǎn)業(yè)市值將超過(guò)500億美元
深度學(xué)習算法是加速大規模數據分析并使其自動(dòng)化的關(guān)鍵工具,有很多商業(yè)應用。調研公司Tractica的首席分析師Bruce Daley從市場(chǎng)的角度介紹深度學(xué)習在計算機視覺(jué)產(chǎn)業(yè)生態(tài)中的影響,在名為《深度學(xué)習如何拓展計算機視覺(jué)市場(chǎng)》中,Daley圍繞深度學(xué)習的計算機視覺(jué)市場(chǎng)和技術(shù)、使用案例以及產(chǎn)業(yè)生態(tài)。作為T(mén)ractica的首席分析師,Daley還給出了Tractica調研發(fā)現的具體市場(chǎng)機會(huì )和產(chǎn)業(yè)整體趨勢。
首先,Daley回顧了人工智能發(fā)展歷史及標志性事件,快進(jìn)到2015年,企業(yè)級人工智能應用開(kāi)始出現。根據Tractica預計,到2025年,光是深度學(xué)習軟件的銷(xiāo)售額就能達到104億美元,而且硬件和服務(wù)還會(huì )增長(cháng)更多,其中深度學(xué)習相關(guān)服務(wù)的產(chǎn)值高達500多億美元。
深度學(xué)習雖然不會(huì )對生活造成直接影響,但它會(huì )從最根本的層面改變生活——改變數據。你可以用同樣是算法處理各種不同類(lèi)型的數據。隨著(zhù)社會(huì )越來(lái)越數字化,數據增加,深度學(xué)習展現出了優(yōu)勢。不過(guò),Daley也指出,在產(chǎn)品周期里當過(guò)了成熟期以后,數據的價(jià)值就會(huì )逐漸降低。同時(shí),深度學(xué)習也有局限:雖然應用廣泛,但依賴(lài)高質(zhì)量的數據,無(wú)法用數學(xué)語(yǔ)言描述,人才嚴重不足。
深度學(xué)習的市場(chǎng)將是這個(gè)樣子的
到了具體應用,Daley表示,Facebook 用戶(hù)每天都會(huì )上傳3.5億張照片,谷歌的圖片列表更是高達1萬(wàn)億之多,用人力給這些圖片打標簽是不可能的,但這些又都是寶貴的數據,這時(shí)候深度學(xué)習就派上用場(chǎng)了。
就像谷歌可以用計算機識別貓,如果一個(gè)人在網(wǎng)上看了很多貓的照片,那么計算機會(huì )自動(dòng)推薦更多的與貓相關(guān)的內容。不過(guò),這種技術(shù)很神奇,但消費者為什么會(huì )花錢(qián)買(mǎi)呢?因此必須有好的商業(yè)模式。
接下來(lái),Daley介紹了使用深度學(xué)習的計算機視覺(jué)系統在農業(yè)、零售業(yè)、服裝(量身定制)、廣告、制造等產(chǎn)業(yè)中的應用和趨勢,以及在這些產(chǎn)業(yè)中值得關(guān)注的企業(yè)。
神經(jīng)網(wǎng)絡(luò ):5個(gè)你想不到的未來(lái)
最后,電子設計自動(dòng)化軟件公司Cadence的CTO、IEEE Fellow Chris Rowen,分析了神經(jīng)網(wǎng)絡(luò )計算的本質(zhì)及局限,尤其是在實(shí)時(shí)和嵌入式系統中的應用。
Rowen表示,雖然最近神經(jīng)網(wǎng)絡(luò )可能有些過(guò)于“火”了,但還是有一些機會(huì )可以切實(shí)分析地分析一些意想不到但卻很有可能發(fā)生的未來(lái)。Rowen預測,計算機視覺(jué)產(chǎn)業(yè)接下來(lái)會(huì )發(fā)生一系列變革,從神經(jīng)網(wǎng)絡(luò )改變數據商業(yè)模式到云端、全新軟硬件中的應用。
Rowen在演講中給出的不怎么驚人的預測是:
神經(jīng)網(wǎng)絡(luò )的云端的應用會(huì )增多
神經(jīng)網(wǎng)絡(luò )很快將擁有實(shí)時(shí)嵌入功能
能耗和帶寬的限制將推動(dòng)CNN在嵌入式和服務(wù)器等處理器上的優(yōu)化
實(shí)時(shí)神經(jīng)網(wǎng)絡(luò )不僅能識別物體,還能識別行動(dòng)
計算機視覺(jué)將成為計算和高端部署的主要問(wèn)題
然后,Rowen 認為很有可能出現的是:
通過(guò)網(wǎng)絡(luò )和引擎結構優(yōu)化,近期會(huì )帶寬會(huì )編程原來(lái)的20倍
不久后將會(huì )出現1000-tera MAC神經(jīng)網(wǎng)絡(luò )嵌入式芯片和1000000 tera-MAC神經(jīng)網(wǎng)絡(luò )服務(wù)器
新的EDA模式
新的價(jià)值鏈會(huì )帶來(lái)全新的IP、工具和數據服務(wù)
數據為王,擁有大規模、多樣化數據的人是贏(yíng)家
可能傷及隱私
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
