AI總會(huì )有低潮,但為什么科學(xué)家們一直有快感?
攻克技術(shù)難關(guān)本身就是一件很有成就感的事情,那當然也是很有快感的事情。
自1956年,4位年輕的美國科學(xué)家提出“人工智能(AI)”的概念以來(lái),在長(cháng)達61年的發(fā)展中,AI更是歷經(jīng)了“三起兩落”的曲折歷程。
在這期間,有對技術(shù)盲目崇拜的瘋狂,也有對未來(lái)充滿(mǎn)疑惑的低潮。不過(guò)從總體上看,我們還是可以說(shuō)人工智能一直在螺旋式上升的狀態(tài),其中有一些技術(shù)甚至對社會(huì )的很多相關(guān)行業(yè)都產(chǎn)生了重大影響和顛覆(具體請見(jiàn)文章:「深度」跨越一甲子的AI已在何處迎來(lái)爆發(fā)?16位頂級專(zhuān)家給出了答案)。
由此,也引發(fā)了業(yè)內對人工智能的眾多思考和期待。
郭延文 南京大學(xué)計算機系教授
南京大學(xué)計算機技術(shù)與科學(xué)系教授、博士生導師,計算機軟件新技術(shù)國家重點(diǎn)實(shí)驗室的郭延文,一直致力于計算機技術(shù)方面的研究,對目前最熱門(mén)的AI和VR相關(guān)領(lǐng)域有著(zhù)深刻而獨到的見(jiàn)解。
郭延文認為,終極狀態(tài)下的人工智能,借助VR的強力和全面加持,將會(huì )讓人類(lèi)無(wú)所不能,甚至人們進(jìn)入虛擬現實(shí)也不再需要任何介質(zhì)。那時(shí),誰(shuí)都可以隨時(shí)將自己置身于一個(gè)包括視覺(jué)、聽(tīng)覺(jué)、觸感和嗅覺(jué)全體感的虛擬環(huán)境中,而不用借助人體器官的感覺(jué)。
做AI技術(shù)研究這么枯燥,科學(xué)家會(huì )有快感嗎?
據研究表明,人的感覺(jué)器官中接受信息最多的是視覺(jué)器官,視覺(jué)信息占大腦接受外部信息的80%,AI的研究是為了讓機器像人一樣智能,為了達到這個(gè)目標,讓機器能夠像人一樣通過(guò)眼睛觀(guān)察、理解和感知現實(shí)世界就尤為重要,這就是計算機視覺(jué)的研究范疇,是AI應用的關(guān)鍵技術(shù)。
郭延文教授和他的技術(shù)團隊一直以來(lái)都在做計算技術(shù)方面的研究,在常人眼里這是一份會(huì )枯燥而乏味的工作。自然,從事這項工作何來(lái)快感?
事實(shí)恰好相反,科學(xué)家的快感始終是滿(mǎn)滿(mǎn)到讓人羨慕的!
他們的快感來(lái)自于攻關(guān)克難的過(guò)程。
郭延文說(shuō):“在計算機科學(xué)領(lǐng)域,我做兩個(gè)方面的研究,一個(gè)是計算機圖形學(xué)與虛擬現實(shí),另一個(gè)是圖像視頻處理和計算機視覺(jué)。
“做圖形,就是在計算機中把我們看到的現實(shí)世界進(jìn)行建模,然后把它繪制出來(lái),就像你打的計算機游戲、看的三維動(dòng)畫(huà)電影等,都是借助計算機圖形技術(shù)生成的;另外的圖像視頻處理和計算機視覺(jué),作為人工智能技術(shù)重要的落地場(chǎng)景,比如說(shuō)視頻里的人、車(chē)和物的檢測、家里門(mén)禁系統的人臉識別等,都非常具有現實(shí)應用價(jià)值。”
從這個(gè)層面上看,在做這些工作,從過(guò)程到結果,相對于其他技術(shù)門(mén)類(lèi)來(lái)說(shuō)似乎顯得更形象、更直觀(guān)。但是,其中仍然不乏大量的枯燥內容。
“話(huà)又說(shuō)回來(lái),這一領(lǐng)域里畢竟也有很多偏向于基礎理論方面的研究,比如說(shuō)理論計算機科學(xué)、量子計算等等。我也有多位同事從事這方面的研究,在外人看來(lái)這多少略顯枯燥,然而專(zhuān)注于這方面的科研人員、科學(xué)家,他們對自身領(lǐng)域的感情,那絕對都是真愛(ài)!
“就像偉大的數學(xué)家發(fā)現數學(xué)之美,我們也能發(fā)現計算之美,大家都很享受研究的過(guò)程。另外,攻克技術(shù)難關(guān)本身就是一件很有成就感的事情,那當然也是很有快感的事情。”
如果一項技術(shù)遲遲未能突破,科學(xué)家會(huì )鳴金收兵、偃旗息鼓嗎?
很顯然,這是個(gè)尷尬而難堪的話(huà)題。
數學(xué)史上最著(zhù)名的“無(wú)解難題”之一、由法國數學(xué)家皮耶·德·費瑪在17世紀30年代提出的“費馬大定理”,就是一個(gè)典型的案例。這一定理在提出之后,憋死了無(wú)數英雄好漢!直到三百多年后的1995年,才被英國數學(xué)家安德魯·懷爾斯徹底證明。
幾乎在任何人的生活和工作中,失敗或是挫折總是不可避免的。對此,郭延文也有著(zhù)自己的切身體會(huì ):“說(shuō)一個(gè)典型的例子吧。前年我們做了一個(gè)借助航空攝影進(jìn)行三維場(chǎng)景重建的科研項目,用無(wú)人機為城市、工廠(chǎng)和港口等做三維實(shí)景建模,我們研發(fā)了國內第一個(gè)自帶操作系統的航空攝影器材。記得有一次進(jìn)行實(shí)驗的時(shí)候,無(wú)人機在天上拍了一圈,落地后我們發(fā)現,系統盤(pán)里竟然一張照片、一點(diǎn)數據都沒(méi)有!
“我現在還清楚的記得,當時(shí)大家的看到之后,心都涼了......心想是不是系統設計方向錯了、理論模型有缺陷?......那種蒼涼、失望,以至于懷疑人生的感覺(jué),到現在仍然記憶猶新。”
不過(guò),我們相信,在成功的解決了問(wèn)題之后,那種絕望的經(jīng)歷就成了科學(xué)研究路上美麗的墊腳石。
因此說(shuō),做研究的很多時(shí)候很難設定一個(gè)時(shí)間表。但是研究也是有時(shí)效性的,如無(wú)人駕駛技術(shù),很多巨頭都在做,這里的各種研究大概都是有時(shí)間表的。如果說(shuō)你慢了,就會(huì )被別人超越。
所以,這一般也是學(xué)術(shù)和產(chǎn)業(yè)的區別。
計算機視覺(jué)完全達到甚至超過(guò)人眼,我們還要等多久?
眾所周知的是,目前計算機視覺(jué)在一個(gè)特定場(chǎng)景下的特定任務(wù),已經(jīng)達到和超過(guò)人眼的水平。比如正面的人臉識別,已經(jīng)有一些較成熟的算法了。
不過(guò)在一般環(huán)境下的場(chǎng)景,計算機視覺(jué)技術(shù)距離人眼的認知水平還有較大差距。
郭延文說(shuō):“計算機視覺(jué)跟人眼的差距主要在兩個(gè)方面。一個(gè)是信息的采集。人眼是天然感知深度的,對環(huán)境、光照等具有很好的魯棒性。但是計算機視覺(jué)是通過(guò)配備的攝像設備實(shí)現的,單目視覺(jué)對視點(diǎn)和光線(xiàn)等的變化以及復雜環(huán)境的魯棒性較差。”
“第二就是對信息的歸納和推理,雖然目前人工智能技術(shù)已經(jīng)有了很大發(fā)展,經(jīng)典學(xué)習理論和深度學(xué)習技術(shù)等也在不斷進(jìn)步,但相比人類(lèi)歸納、聯(lián)想和推理的能力,還有很大的差距,從而也造成了計算機視覺(jué)和人眼認知的較大差距。”
但是我們相信,隨著(zhù)大數據、人工智能的發(fā)展,其距離人眼視覺(jué)的差距將會(huì )越來(lái)越小,并最終實(shí)現超越。
擴展:自在特殊情況下,如強光、相似障礙物(如一群讓人眼花的斑馬)等,如何實(shí)現準確的視覺(jué)識別與處理?
這兩個(gè)場(chǎng)景下的問(wèn)題,是傳統的基于可見(jiàn)光的圖像處理領(lǐng)域,比較難以處理的問(wèn)題。
不過(guò)現在的圖像處理技術(shù)已經(jīng)開(kāi)始在做基于RGB-D的、含深度圖像的分析和理解。如強光或陰影環(huán)境下,如果沒(méi)有深度信息,計算機經(jīng)常就會(huì )識別不準。但是如果有了深度信息,那計算機的各種算法、處理就會(huì )工作的更好。
另外對于相似障礙物,也是一樣的道理。
就像手機來(lái)說(shuō),以后大家的手機應該會(huì )逐步標配含有深度感知功能的攝像頭了。
在VR的加持下,終極的人工智能將會(huì )讓人類(lèi)自由穿梭時(shí)空
計算機早期叫計算器、電腦、微機等,人工智能就是讓機器具有像人一樣的智能。近些年由于大數據、機器學(xué)習、深度學(xué)習等的興起和發(fā)展,計算機和人工智能都到了很高的水平。
“我所設想的,他們的最終形態(tài)應該是計算機或者機器,具有像人一樣的智能,能夠用我們所能想到的各種方法,讓我們人類(lèi)的生活更美好。再加上虛擬現實(shí),未來(lái)你想干什么、想要什么,計算機都能幫你實(shí)現。”郭延文說(shuō)到。“人們進(jìn)入虛擬現實(shí)也不再需要任何介質(zhì),隨時(shí)可以將自己置身于一個(gè)包括視覺(jué)、聽(tīng)覺(jué)、觸感和嗅覺(jué)全體感的虛擬環(huán)境中。最終讓人不想區分哪里是現實(shí)、哪里是虛幻,這種似夢(mèng)非夢(mèng)的感覺(jué)肯定會(huì )棒極了!”
由此再加以延伸的話(huà),我們是不是可以這樣理解:在虛擬現實(shí)的加持下,終極的人工智能將會(huì )讓人類(lèi)自由穿梭時(shí)空?
比如你要去火星又坐不起航天飛機,那就來(lái)個(gè)虛擬現實(shí)吧,它會(huì )讓你“想到就到”。剛開(kāi)始,你還想著(zhù)動(dòng)動(dòng)手腳,走兩步或者觸摸個(gè)什么東西。到后來(lái),如果加入腦神經(jīng)觸發(fā)等技術(shù),你根本不用動(dòng),就能完全實(shí)現諸如走動(dòng)、觸摸等各種由肢體或器官帶來(lái)的感覺(jué)。
到了那個(gè)時(shí)候,物質(zhì)的存在似乎就不那么重要了。
VR和AR是一對手足兄弟,誰(shuí)也不會(huì )取代誰(shuí)
近來(lái),業(yè)內一直有觀(guān)點(diǎn)稱(chēng),今后AR將取代或吞并VR,因為人們更喜歡在真實(shí)的場(chǎng)景中實(shí)現VR的各種效果。事實(shí)真的是這樣嗎?
對此,郭延文教授有自己的理解,“VR和AR各有各的用途。VR主要應用領(lǐng)域包括文化教育、數字娛樂(lè )、醫療、科學(xué)仿真等等;對比來(lái)說(shuō),AR的話(huà),看到現實(shí)場(chǎng)景,利用VR技術(shù),用虛擬物體去增強我們對現實(shí)世界的觀(guān)察和感知。它的意義不僅僅是對場(chǎng)景的顯示,更重要的是對現實(shí)世界更強化的理解和認知。而要做到這種理解,就必須要用到人工智能技術(shù),如計算機視覺(jué)、圖形圖像識別等。”
這樣來(lái)看,我們很難斷定VR和AR誰(shuí)會(huì )取代誰(shuí),只能說(shuō)二者在未來(lái)會(huì )在各自特定的領(lǐng)域和行業(yè)內實(shí)現越來(lái)越多的結合,從而獲得更大的發(fā)展。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
