谷歌DeepMind新進(jìn)展,讓深度學(xué)習學(xué)會(huì )“過(guò)目不忘”
只需通過(guò)一個(gè)例子,該算法便可認出圖像中的物體或其他東西。
正常情況下,計算機算法通常需要成千上萬(wàn)個(gè)例子才能學(xué)會(huì )一件事情,但谷歌DeepMind的研究人員卻找到了一種新的方法,直接繞過(guò)這一流程。這種新方法被他們稱(chēng)為“單次學(xué)習”,即算法只需通過(guò)一個(gè)例子便可認出圖像中的物體或其他東西。
事實(shí)上,不少算法的確能夠準確地識別物體,但該結果以龐大的數據訓練為前提,因而不是一般的耗費時(shí)間和金錢(qián)。此外,如此多的數據搜集也顯得并不實(shí)際——例如,不可能為了讓一個(gè)機器人在一套不熟悉的房子里行走而為其提供長(cháng)時(shí)間的學(xué)習機會(huì )。
為解決這個(gè)問(wèn)題,谷歌DeepMind研究員奧里奧爾·溫亞爾斯(Oriol Vinyals)在深度學(xué)習系統中增加了一個(gè)記憶組件。該團隊利用一個(gè)名為ImageNet的標記圖片數據庫對該系統的能力進(jìn)行了驗證。
目前,該算法仍需要分析數百種圖片,但未來(lái)它將學(xué)會(huì )對圖片中獨特元素的分析,用一張照片識別新的物體。對此,溫亞爾斯稱(chēng),如果能夠快速識別出一個(gè)新單詞的意思,這項技術(shù)的用途便會(huì )得到明確體現。這對谷歌非常有用,因此該公司可以借此快速學(xué)習某個(gè)新的搜索項的含義。
DeepMind并不是第一個(gè)研究單次學(xué)習方法的團隊,但之前人們所開(kāi)發(fā)得單次學(xué)習系統通常不兼容深度學(xué)習系統。“我認為這是一種很有趣的方法,它提供了一種新穎的方式對大規模的數據庫進(jìn)行單次學(xué)習。”韓國先進(jìn)科技學(xué)院大腦和機器智能實(shí)驗室主任Sang Wan Lee說(shuō),“這為人工智能社區做出了技術(shù)貢獻,計算機視覺(jué)研究人員可能非常重視此事。”
當然,也有人對這項技術(shù)的用途提出質(zhì)疑。哈佛大學(xué)腦科學(xué)系副教授山姆·格什曼(Sam Gershman)表示,人類(lèi)通常是通過(guò)理解一張圖像的組成元素來(lái)學(xué)習的,這需要一些實(shí)際的知識或嘗試。例如,“賽格威可能看上去與自行車(chē)或摩托車(chē)大不相同,但它卻可以使用相同的零件。”
不過(guò),格什曼和Sang Wan Lee都表示,機器要在學(xué)習能力上比拼人類(lèi)仍然要經(jīng)過(guò)一段時(shí)間的發(fā)展。“我們遠遠沒(méi)有揭開(kāi)人類(lèi)單次學(xué)習的秘密。”Sang Wan Lee說(shuō)。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
