揭秘Facebook的人工智能實(shí)驗室

鎂客 10年前 (2015-10-03)

Facebook是一個(gè)非常成功的社交網(wǎng)絡(luò )公司,而它在人工智能領(lǐng)域的成就同樣不能小看。

最近,中美互聯(lián)網(wǎng)論壇在西雅圖召開(kāi),對于Facebook是否能入華再次成為焦點(diǎn)。如今的Facebook已經(jīng)不僅僅是一個(gè)成功的社交網(wǎng)絡(luò )公司,近年來(lái),它用無(wú)人機提供互聯(lián)網(wǎng)服務(wù)、收購Oculus發(fā)展虛擬現實(shí)、不斷探索人工智能,可以說(shuō)Facebook已經(jīng)成為了世界上最先進(jìn)的科技研究中心之一。

當然現在包括谷歌、IBM等公司都對人工智能有強烈的興趣,而Facebook也加大了對這個(gè)領(lǐng)域的投入,希望解決模擬一般智力的問(wèn)題——即讓計算機日漸脫離線(xiàn)性邏輯的機器的思考方式,而像我們自由形態(tài)的人類(lèi)以多管齊下的方式來(lái)思考。下面我們就來(lái)深度解析下關(guān)于Facebook人工智能的那些事。

Facebook人工智能研究室

一切始于2013年,Facebook的巨大成功并沒(méi)有阻止創(chuàng )始人兼CEO Mark Zuckerberg對未來(lái)十年、二十年發(fā)展的探索。當然,Facebook其實(shí)也已經(jīng)將機器學(xué)習運用到其流行的社交網(wǎng)絡(luò )中,比如說(shuō)決定用戶(hù)會(huì )在News Feeds中看到什么內容。不過(guò)相比起當時(shí)前沿的神經(jīng)網(wǎng)絡(luò )成果,這不過(guò)是小兒科。一些Facebook工程師也一直在嘗試卷積神經(jīng)網(wǎng)絡(luò )(CNNs),這是一種非常強大的機器學(xué)習,現在普遍被用于圖像識別。 即便人工智能還處于發(fā)展初期,Zuckerberg對它的潛力依然非??春?,因此組建一支最好的人工智能研究實(shí)驗室的想法就出現了。

他從谷歌大腦(Google Brain)挖了一位叫做Marc Aurelio Ranzato的工程師。然后追本溯源找到了卷積神經(jīng)網(wǎng)絡(luò )的發(fā)明者——Yann LeCun作為人工智能實(shí)驗室的負責人。Yann LeCun是人工智能界的一個(gè)傳奇,卷積神經(jīng)網(wǎng)絡(luò )是他職業(yè)生涯的巔峰之作。你是否曾經(jīng)好奇過(guò)ATM怎么能識別你的支票?這就得益于 LeCun負責的「SN」的神經(jīng)網(wǎng)路模擬器的早期研究,于1996年被采用。

作為人工智能實(shí)驗室負責人Yann LeCun被Zuckerberg授予了完全的信任,而他對研究室也有自己的看法,如果你想要吸引頂尖人才,你得有一個(gè)雄心勃勃的研究室,和一個(gè)雄心勃勃的長(cháng)期目標。然后你還得給他們工作上的自由權,同時(shí)對你的研究你必須持有非常開(kāi)放的態(tài)度。這和Facebook一貫開(kāi)放到理念也是不謀而合的。

這個(gè)肩負著(zhù)Facebook的未來(lái)的團隊規模很小,由大約 30個(gè)研究科學(xué)家和15名工程師組成。團隊有三個(gè)分支:由LeCun管理著(zhù)一個(gè)由20名工程師和研究人員組成的團隊。Menlo Park的是一個(gè)同等規模的分支。六月,FAIR又在巴黎設立了一個(gè)更小的5人組,還有很多在Facebook其他部門(mén)一起合作致力于人工智能發(fā)展的團隊。

揭秘Facebook神秘的人工智能實(shí)驗室2

這些研究人員和工程師來(lái)自科技領(lǐng)域的各個(gè)層面,同時(shí)當中很多人都曾與Lecun合作過(guò)。比如負責領(lǐng)導語(yǔ)言研究子群的Leon Bottou,是LeCun的一個(gè)老同事,他們曾一同研發(fā)了神經(jīng)網(wǎng)絡(luò )模擬器;他們的團隊顧問(wèn) Vladimir Vapnik,曾和Lecun一起在貝爾實(shí)驗室工作,發(fā)表了關(guān)于機器學(xué)習的形成性研究,其中包括一項測量機器學(xué)習能力的技術(shù),他也是統計學(xué)習理論之父。

Facebook對人工智能的探索

迄今,最好的人工智能系統也是愚鈍的,因為它們沒(méi)有常識?,F在對于機器如何學(xué)習簡(jiǎn)單的推理能力,人工智能領(lǐng)域的專(zhuān)家知道得并不多。而Facebook也正致力于制造能足夠好地學(xué)習已知世界的機器。

「記憶網(wǎng)絡(luò )」

LeCun將記憶網(wǎng)絡(luò )的工作整合進(jìn)卷積神經(jīng)網(wǎng)絡(luò ),并使它們獲得記憶保持的能力。LeCun把這個(gè)新的記憶模型比作大腦中的分別由海馬體和大腦皮層控制的短期記憶和長(cháng)期記憶。而記憶單元允許研究者向該「記憶網(wǎng)絡(luò )」講說(shuō)一個(gè)故事,隨后使該網(wǎng)絡(luò )回答關(guān)于這個(gè)故事的問(wèn)題。

比如我們把《指環(huán)王》一書(shū)的主要情節簡(jiǎn)短概述給「記憶網(wǎng)絡(luò )」,當被問(wèn)及在書(shū)中某一具體情節中魔戒在哪里,這個(gè)「記憶網(wǎng)絡(luò )」能做出簡(jiǎn)短正確的回答。這意味著(zhù)它理解書(shū)中事物與時(shí)間的關(guān)系,而不是從全書(shū)中做簡(jiǎn)單的搜索。

揭秘Facebook神秘的人工智能實(shí)驗室3

「嵌入世界」

為了能搭建出一個(gè)系統,確保讓所有人可以把時(shí)間花在他們真正關(guān)心的事情上,FAIR團隊開(kāi)發(fā)了一個(gè)被稱(chēng)為「嵌入世界」的項目。

在嵌入世界項目中開(kāi)發(fā)的人工神經(jīng)網(wǎng)絡(luò )能夠根據視覺(jué)相似性將在同一地點(diǎn)拍攝的兩張不同照片連接起來(lái),并能指出文字描述是否符合場(chǎng)景。它重建了現實(shí)的一種虛擬記憶,并將之在其他地方和事件的背景下進(jìn)行聚類(lèi)。它甚至能根據一個(gè)人之前的喜好,興趣以及數字經(jīng)歷「虛擬地表示這個(gè)人」。雖然這還只是帶有實(shí)驗性質(zhì)的,但是對Facebook的新聞流呈現具有很大的影響,在跟蹤標簽上也進(jìn)行了一定的使用。

另外,Facebook的人臉識別技術(shù)已達到世界第一,通過(guò)DeepFace這項技術(shù),Facebook的人臉識別已達到97%的準確率。

「計算機視覺(jué)」

Rob Fergus領(lǐng)導著(zhù)有關(guān)計算機視覺(jué)的AI團隊,他們已經(jīng)在自動(dòng)標記相片上得到使用,接下來(lái)將被用于標記視頻。大量視頻因為缺乏元數據,或者沒(méi)有任何描述性文本,而被淹沒(méi)于噪聲中。AI將會(huì )能夠觀(guān)看視頻,并將它們大致分類(lèi)。

這對Facebook阻止那些不想被上傳到他們服務(wù)器上的內容具有巨大的意義—例如色情照片,版權問(wèn)題或者其他違反他們使用條款的任何內容。它也能鑒別新聞事件,對不同類(lèi)型的視頻進(jìn)行管理。Facebook此前一直將這些任務(wù)劃分給外包公司,當這項技術(shù)穩定后,Facebook就能降低這部分的人工成本。

在目前的測試中,人工智能表現得很有希望。給它播放一段正在進(jìn)行的體育視頻,比如冰球、籃球或乒乓球,人工智能能夠準確地識別出這個(gè)體育項目。并且還可以區分壘球和棒球,漂流和皮劃艇,以及籃球和街球這些類(lèi)似的運動(dòng)。

「語(yǔ)言科技」

Facebook本著(zhù)讓世界更開(kāi)放更連通的宗旨,因此語(yǔ)言服務(wù)是它的重點(diǎn),因為超過(guò)一半以上的Facebook用戶(hù)不說(shuō)英語(yǔ),然而Facebook上大部分的內容都是通過(guò)英語(yǔ)呈現的,因此如何能智能的翻譯也就是語(yǔ)言科技小組成立的原因。

我們知道過(guò)去Google翻譯那種直接逐詞翻譯有很大的缺陷,因為一些語(yǔ)法、俚語(yǔ)的原因導致翻譯的不準確,而Facebook在翻譯里面加入了人工智能的元素,讓翻譯更精確。比如:約有三億三千萬(wàn)用戶(hù)經(jīng)常點(diǎn)擊「見(jiàn)翻譯」按鈕使用這些翻譯服務(wù)。如下圖所示:

揭秘Facebook神秘的人工智能實(shí)驗室5

如果你是第一個(gè)點(diǎn)擊翻譯按鈕的人,恭喜,你已經(jīng)開(kāi)始操作人工智能了。人工智能本身具有適應性,經(jīng)過(guò)訓練后便可以很快掌握俚語(yǔ)。語(yǔ)言科技小組最近發(fā)現法國球迷在用一個(gè)新俚語(yǔ)表達「wow」,人工智能在接受那部分公用數據的神經(jīng)網(wǎng)絡(luò )訓練以后,現在能夠可靠地將文本翻譯出來(lái)。他們通過(guò)每天對人工智能進(jìn)行新數據的訓練擴展Facebook的詞庫,不過(guò)所有語(yǔ)言的詞庫正在按月更新。

「Facebook M」

我們已經(jīng)習慣于個(gè)人數字助理,比如Siri、Cortana,以及Google Now。但Facebook選擇了一條不同的道路,其名為「M」的新型個(gè)人AI助理?yè)碛谐绞謾C界限處理復雜事物的能力。比如Siri可以發(fā)短信,而M可以預定航班或制定旅行計劃。

Facebook M的主干來(lái)自于今年早些時(shí)候收購的一家創(chuàng )業(yè)公司:Wit.ia。人工智能不僅幫助M更好地完成一般的任務(wù),也能完成有一些特殊情況的任務(wù)。并且Facebook設立了「AI訓練者」,主要可以讓M從人類(lèi)訓練者身上學(xué)到應該怎么做,并應用到之后的任務(wù)中,這其實(shí)更像是人類(lèi)學(xué)習的過(guò)程。

Facebook在人工智能團體中的角色

“我們的研究項目都是完全公開(kāi)的。幾乎我們做的每件事都會(huì )發(fā)布,大部分的代碼也都是開(kāi)源的。” LeCun 說(shuō)道。“你可以在 Facebook 的研究網(wǎng)站上和 ArXiv——一個(gè)收納電腦科學(xué)、數學(xué)及物理研究的圖書(shū)館,找到這些出版物。”這其實(shí)就能看出Facebook整個(gè)團隊的態(tài)度,研究固然對他們的用戶(hù)很重要,但它的核心價(jià)值更佳體現在讓人類(lèi)對如何更好地用機器來(lái)模仿智能的知識。

也是人工智能的研究本來(lái)就是最復雜的科學(xué)挑戰之一,不可能憑借某個(gè)人或者某個(gè)公司自己解決,它需要集體的力量,我們也希望Facebook的人工智能會(huì )帶給我們更多的驚喜。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到