搜索

北航教授李波：說(shuō)AI會(huì )有低潮就是胡扯，這是人類(lèi)長(cháng)期的追求

鎂客 8年前 (2017-09-28)

這一輪所謂人工智能的高潮，和以往的幾次都有所不同，那是因為其受到了產(chǎn)業(yè)界的極大關(guān)注和參與。而以前并不是這樣。

當今世界是一個(gè)高度信息化的世界，甚至我們有一只腳已經(jīng)踏入了智能化時(shí)代。而在我們日常交流和信息互動(dòng)中，迅速發(fā)展的多媒體技術(shù)起到了至關(guān)重要的作用。

北航教授李波：AI沒(méi)有落與不落，“應用”才是退潮后的裸泳者

在日前結束的“2017中國多媒體大會(huì )”上，提出了“智能媒體，創(chuàng )新未來(lái)”的主題。會(huì )后，我們采訪(fǎng)了大會(huì )主席、北京航空航天大學(xué)教授李波，就當前人工智能技術(shù)在多媒體中的應用以及二者相互促進(jìn)展開(kāi)對話(huà)。

多媒體（Multimedia）是數據的最主要的現形式。在計算機系統中，多媒體指文本、圖形、圖像、視頻、聲音、動(dòng)畫(huà)和影片等，在實(shí)際應用中，也可以多種媒體綜合使用。多媒體的應用領(lǐng)域已涉足諸如安防、影視、娛樂(lè )、廣告、藝術(shù)、教育、工程、商業(yè)及科研等諸多行業(yè)。

AI熱起來(lái)，首先爆發(fā)在多媒體領(lǐng)域

多媒體技術(shù)是把信息技術(shù)與應用結合起來(lái)的核心技術(shù)。很多信息在現實(shí)生產(chǎn)和生活中的使用，都會(huì )涉及到聲圖文視頻等，還有在我們常說(shuō)的人機交互中，多媒體技術(shù)也都發(fā)揮著(zhù)重要的作用。

當前這一輪的人工智能熱起來(lái)，與多媒體關(guān)系很大，首先是深度學(xué)習用于語(yǔ)音識別，很大程度上提升了識別效果。其次是圖像分析，對圖像分類(lèi)、人臉識別、以及圖像檢索等也有大幅度提升。這些都是AI與多媒體應用結合的表現。

北航教授李波：AI沒(méi)有落與不落，“應用”才是退潮后的裸泳者

另一方面，關(guān)于多媒體技術(shù)本身的發(fā)展。多媒體的數據量很大，其內容豐富多彩，理解難度大，它本身的內容分析就需要智能處理，目前多媒體處理正在朝著(zhù)智能化方向發(fā)展。所以本次大會(huì )的主題里有一個(gè)叫做“智能媒體”，體現的就是這件事情。

關(guān)于主題中的“創(chuàng )新未來(lái)”，因為多媒體技術(shù)是一種與應用結合十分緊密的技術(shù)，所以說(shuō)它必將在各行各業(yè)、方方面面發(fā)揮越來(lái)越重要的作用。大家目前聽(tīng)到的、看到的很多東西都是這樣，比如無(wú)人駕駛系統，它首先要感知周?chē)膱?chǎng)景，要有視覺(jué)技術(shù)支撐。又比如大家看到的機器人問(wèn)詢(xún)系統，它的核心在于語(yǔ)音識別、自然語(yǔ)言理解，也是以模擬人的聽(tīng)覺(jué)和語(yǔ)音處理來(lái)實(shí)現的。

所以說(shuō)，多媒體技術(shù)的智能化對經(jīng)濟社會(huì )、生產(chǎn)生活的方方面面產(chǎn)生了重大影響，這也是另一個(gè)主題“創(chuàng )新未來(lái)”的由來(lái)。

圖像識別和語(yǔ)音識別之外，有更多的AI應用在我們身邊

首先呢，我們要區分人工智能和深度學(xué)習。人工智能是一種跨學(xué)科的、多學(xué)科交叉的技術(shù)，它在不同的應用行業(yè)對其的要求也有所區別。

北航教授李波：AI沒(méi)有落與不落，“應用”才是退潮后的裸泳者

現在所說(shuō)的深度學(xué)習影響很大，它最早是在語(yǔ)音和圖像識別取得突破。但是，深度學(xué)習只是其中一種技術(shù)，人工智能還有很多其他的技術(shù)，遠遠不只深度學(xué)習這種技術(shù)，例如數據分析、模式識別、智能控制等，也都是屬于人工智能技術(shù)的范疇。

北航教授李波：AI沒(méi)有落與不落，“應用”才是退潮后的裸泳者

例如數據內容分析方面的技術(shù)，在金融行業(yè)的風(fēng)控、在股票市場(chǎng)的監管、在電信行業(yè)的反欺詐、在智慧物流的調度等方面，也都在發(fā)揮重要的智能作用。此外，在工業(yè)生產(chǎn)過(guò)程中，例如各種復雜調度、零件裝配、故障檢測等，也都用到很多人工智能技術(shù)做支撐。

AI技術(shù)本身并沒(méi)有落與不落，退潮之后也沒(méi)有裸泳者

常說(shuō)人工智能有“三起兩落”，現在正處于第三次“起”的階段，那將來(lái)還會(huì )有第三次的“落”嗎？如果有，哪些技術(shù)和應用會(huì )成為退潮之后的裸泳者？

人工智能為什么會(huì )有所謂的“三起兩落”？因為人來(lái)一直在不斷地拓展自己的智力，在追求更高更大的目標，并用于方方面面。

人類(lèi)發(fā)明了車(chē)輛，讓我們可以跑的更快；發(fā)明制造了飛機，讓我們可以飛上天空。

所以說(shuō)，人工智能的起落過(guò)程并沒(méi)有什么值得擔憂(yōu)的，它只是人來(lái)在追求更高目標過(guò)程中正常的階段性體現。另外，落與不落，只是發(fā)展狀況的一種相對說(shuō)法。

北航教授李波：AI沒(méi)有落與不落，“應用”才是退潮后的裸泳者

但是，這一輪所謂的人工智能高潮，和以往幾次都有所不同。為什么呢？因為本輪的人工智能之所以這么熱，那是因為其所處的環(huán)境有了本質(zhì)的變化，并受到產(chǎn)業(yè)界的極大關(guān)注和參與，而前兩輪并不是這樣。

雖然從第二輪開(kāi)始，產(chǎn)業(yè)界對智能系統開(kāi)始逐步重視，但相比這一輪來(lái)說(shuō)，重視程度遠遠不及，并沒(méi)有現在的普及和全面，對普通老百姓的工作和生活的影響也遠不如現在這么大。

原因是什么？首先是現在的環(huán)境不一樣了，現在是互聯(lián)網(wǎng)時(shí)代的快速發(fā)展，另外是在大數據的背景下，再加上計算系統的高性能化（現在普通手機的計算性能抵得上以前的一臺大型計算機），使得這一輪人工智能在某些應用方面可以做的很實(shí)，真正體現較高的智能特征。

當然，由于各個(gè)行業(yè)之間千差萬(wàn)別，其對人工智能技術(shù)的需求不盡相同，所以也使得人工智能對具體行業(yè)的影響各有不同。比如說(shuō)對我們的聽(tīng)、說(shuō)、寫(xiě)等相關(guān)度比較高的，以及與大數據聯(lián)系緊密的行業(yè)，影響就非常大；而對于其他的行業(yè)（需要做綜合的決策，而數據量又不夠多），影響可能就會(huì )相對較小。

北航教授李波：AI沒(méi)有落與不落，“應用”才是退潮后的裸泳者

但即使是人工智能不那么熱的時(shí)候，也不能說(shuō)AI技術(shù)就沒(méi)用了。事實(shí)上，人工智能已經(jīng)悄然進(jìn)入我們生活的方方面面，在潛移默化中發(fā)揮作用并影響世界。

只要人類(lèi)追求智能、追求更高目標的決心不變，人工智能的高潮就會(huì )一直存在且持續下去。

數據驅動(dòng)和知識驅動(dòng)相結合的思維方式，是未來(lái)AI的目標

人類(lèi)思維是一種綜合的思維，來(lái)自?xún)蓚€(gè)方面：一方面是來(lái)自數據驅動(dòng)的學(xué)習，通過(guò)數據在人腦中的不斷抽象，就會(huì )形成高一層的語(yǔ)義。也就說(shuō)，基于深度學(xué)習的智能，更多的就表現在這個(gè)方面。

另一方面，是知識驅動(dòng)展現的智能。人類(lèi)的思考是有目的的，在同樣條件下，出于不同的目的，思考的結論可能不同；所以在同一個(gè)場(chǎng)景里，今天和昨天可關(guān)注的事不同。

原因是什么？因為我們的目的不一樣。也就是說(shuō)，人類(lèi)思考同樣存在至上而下的目標驅動(dòng)；在展現智能方面，也存在利用高層知識去影響分析理解，這就是所謂的知識驅動(dòng)。

北航教授李波：AI沒(méi)有落與不落，“應用”才是退潮后的裸泳者

在復雜的應用中，數據驅動(dòng)和知識驅動(dòng)都會(huì )存在，這樣才能展現高水平的智能，所以說(shuō)這兩方面都是需要的。在我們常說(shuō)的小樣本分析，更需要知識驅動(dòng)發(fā)揮作用。

在數據不足時(shí)，人類(lèi)依靠經(jīng)驗也能實(shí)現正確的判斷和思維；這說(shuō)明機器也需要借鑒其他領(lǐng)域學(xué)習的知識，提高小數據或小樣本下的學(xué)習效果，目前在這方面還存在著(zhù)很多不足和缺陷，需要深入系統的研究。

現在的攝像設備更多是在被動(dòng)采圖，未來(lái)將要實(shí)現主動(dòng)視覺(jué)

在視覺(jué)這件事情上，人類(lèi)的視覺(jué)范疇比我們目前見(jiàn)到的圖像和視頻的范疇更加廣泛。人類(lèi)的視覺(jué)能感受到客觀(guān)世界的方方面面，而我們在客觀(guān)世界里能見(jiàn)到的物理現象是很多的，有聲光電熱、位置、方向、速度等等。

但目前的攝像頭只能做到被動(dòng)感知。直白的說(shuō)，就是你讓攝像頭照什么，它就會(huì )照什么。而人類(lèi)不是這樣，當人類(lèi)在思考需要什么之后，自己就會(huì )去主動(dòng)獲取什么。

北航教授李波：AI沒(méi)有落與不落，“應用”才是退潮后的裸泳者

舉個(gè)例子，在同一個(gè)場(chǎng)景里，人類(lèi)看到了一輛汽車(chē)。如果他要想把車(chē)牌看清楚，他就會(huì )調整視覺(jué)到車(chē)牌的位置；如果他想把駕駛員看清楚，他就會(huì )調整視覺(jué)到駕駛員的位置。

而我們的攝像頭在這方面就做的比較差勁了，它并不會(huì )主動(dòng)根據目標而調整自己的拍攝視覺(jué)。在主動(dòng)去感知周?chē)膱?chǎng)景和全方位、立體的感知周邊環(huán)境等方面，做得很不夠。

此外，現在大多用的是以光學(xué)攝像頭為主的設備，但上面也說(shuō)到了客觀(guān)世界除了視覺(jué)還有很多方面，而這些僅憑光學(xué)攝像頭是根本無(wú)法完全收集到的。所以我們將來(lái)會(huì )需要像激光、紅外、雷達、GPS等結合起來(lái)的攝像設備。

將來(lái)計算機的感知系統應該是用綜合型的視覺(jué)來(lái)完成，而不是現在被動(dòng)式的采圖。將來(lái)的攝像頭也應該是一雙很聰明的慧眼，類(lèi)似甚至要超過(guò)人眼的功能。

未來(lái)的Tof深度相機需要把更多信息整合到一起

在說(shuō)到深度相機和傳統相機區別的時(shí)候，首先要說(shuō)一下我們的客觀(guān)世界。

眾所周知，我們的客觀(guān)世界是三維的，我們在認識世界的時(shí)候，深度信息、位置信息等是非常重要的。傳統相機的成像也好、視頻也好，都是二維的信息，缺乏深度信息。

北航教授李波：AI沒(méi)有落與不落，“應用”才是退潮后的裸泳者

而深度相機是在傳統相機的基礎上，加上了深度信息，使得機器在分析周?chē)鷪?chǎng)景的時(shí)候，多了一維信息，從而提高了分析的準確性。

同時(shí)，由于客觀(guān)世界遠遠不止深度，還有很多像溫度、濕度、速度、方向等等，所以未來(lái)的深度相機應該要把更多的信息也整合到一起。

不過(guò)，在深度信息的獲取方面，如在特定場(chǎng)景、遮擋、距離等的情況下，準確感知深度就存在著(zhù)較大的困難。

所以目前的應用也相對有限，像只在室內、倉庫、游戲交互等短距離的場(chǎng)景下，才能有理想的效果，而在其他場(chǎng)景則會(huì )大打折扣。

最后，記得關(guān)注微信公眾號：鎂客網(wǎng)（im2maker），更多干貨在等你！

鎂客網(wǎng)

科技 | 人文 | 行業(yè)

微信ID：im2maker

長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

鎂客訂閱者

鎂客訂閱者

4069篇

文章總數

最新文章

2019網(wǎng)絡(luò )安全合規和數據保護實(shí)踐國際峰會(huì )

從滿(mǎn)足到超預期，兒童智能硬件如何探索最佳用戶(hù)體驗

擁抱數據浪潮，引領(lǐng)未來(lái)風(fēng)向|2019大數據產(chǎn)業(yè)峰會(huì )圓滿(mǎn)落幕

創(chuàng )米科技推出1099元智能門(mén)鎖C1，正式開(kāi)啟“全屋安全”智能時(shí)代

助力文化產(chǎn)業(yè)升級極客網(wǎng)“文化產(chǎn)業(yè)新星計劃”盛大開(kāi)啟

janpanese日本护士tube_色欲久久久天天天_国产精品国产三级区别第一集_一色屋任你精品亚洲香蕉