吳恩達談深度學(xué)習局限:AI 經(jīng)濟價(jià)值目前僅來(lái)自監督學(xué)習
《財富》刊登吳恩達專(zhuān)訪(fǎng),吳恩達介紹了百度內部深度學(xué)習平臺等人工智能應用。
《財富》近日刊登吳恩達專(zhuān)訪(fǎng),吳恩達介紹了百度內部深度學(xué)習平臺等人工智能應用。吳恩達還指出,近年來(lái) AI 發(fā)展主要得益于數據(燃料)和計算力(引擎)的發(fā)展,眼下數據比計算力發(fā)展稍快(給引擎的燃料還夠),但硬件發(fā)展日益加快,在某些領(lǐng)域甚至超過(guò)了數據(給引擎的燃料不夠),要努力保持兩者同步發(fā)展 AI 才能繼續往前。
2016 年 5 月 23 日,《財富》網(wǎng)站刊登了對吳恩達在加州森尼韋爾的百度人工智能實(shí)驗室接受了《財富》雜志的專(zhuān)訪(fǎng),他談了幾個(gè)問(wèn)題:(1)為什么現在人工智能這么火;(2)企業(yè)是如何利用人工智能來(lái)賺錢(qián);(3)為什么人工智能滅世論嚴重夸大。
目前 AI 創(chuàng )造的經(jīng)濟價(jià)值幾乎全部來(lái)自監督學(xué)習
Fortune:你將如何定義人工智能,或者說(shuō)商業(yè)上可行的人工智能?
吳恩達:我們在過(guò)去幾年中看到,計算機在處理數據以進(jìn)行預測這方面做得越來(lái)越好了。這既包括預測用戶(hù)最有可能點(diǎn)擊什么樣的廣告,也包括在圖片中識別出人、預測哪些網(wǎng)頁(yè)最符合你的搜索查詢(xún)需求——以及數百個(gè)其他的諸如此類(lèi)的例子。許多這樣的應用可以讓用戶(hù)的數字體驗變得更美好,而有些時(shí)候這些改變也提高了企業(yè)的技術(shù)最低門(mén)檻。
Fortune:是否可以說(shuō),目前主流的人工智能主要關(guān)心從數據中識別出模式,而不太關(guān)心建造出能像人類(lèi)一樣思考的計算機?
吳恩達:盡管人工智能常常被過(guò)度宣傳,我仍認為人工智能的進(jìn)展程度已遠遠超出了許多人的想象。目前,幾乎所有由人工智能創(chuàng )造的經(jīng)濟價(jià)值都來(lái)自監督學(xué)習技術(shù)。監督學(xué)習的意思是,基于系統曾經(jīng)接受過(guò)的其他實(shí)例的輸入,來(lái)學(xué)習對結果進(jìn)行預測或對東西進(jìn)行分類(lèi)。這些任務(wù)可以是:“給你一幅圖片,請把那個(gè)人從圖里找出來(lái)”,“給你一個(gè)網(wǎng)頁(yè),請預測用戶(hù)是否會(huì )點(diǎn)擊這個(gè)網(wǎng)頁(yè)”或者“給你一封電子郵件,請判斷它是否是垃圾郵件。”
語(yǔ)音識別是這方面的另一個(gè)例子,在語(yǔ)音識別中輸入的是音頻剪輯,而輸出是音頻內容轉換成的文本。
機器學(xué)習這幾年之間發(fā)生了什么
Fortune:由于蘋(píng)果 Siri 提供的新功能,語(yǔ)音識別最近比較火。下一步怎樣才能讓智能助理型的應用更加有用呢?
吳恩達:我們想要追求的目標是,讓與計算機交談變得像與人交談一樣自然。這是一個(gè)遠期目標,我們短期內不能實(shí)現它,但當我們實(shí)現這個(gè)目標后,就會(huì )有更多的用戶(hù)想使用它。目前,很大程度上只是一些技術(shù)熱衷者在使用語(yǔ)音功能。世界上的大部分人并不使用語(yǔ)音來(lái)與電腦互動(dòng)。
與機器交談的感覺(jué)仍然和與人交談的感覺(jué)非常不同:你只能夠交談某些方面的東西,你不能在交談中打斷機器人。有些時(shí)候,機器人的回應會(huì )比較慢。有些時(shí)候,你說(shuō)的東西會(huì )令機器非常困惑。比方說(shuō),如果我對計算機說(shuō),“請打電話(huà)給卡洛,號碼 555-1000……不,等等,1005”,計算機就很難理解我的話(huà),也很難采取正確的行動(dòng)。
Fortune:幾年之前,沒(méi)有幾家人工智能是面向消費者的,而今天像語(yǔ)音識別和能理解照片的算法這樣的技術(shù)已很普遍。這幾年之間發(fā)生了什么?
吳恩達:機器學(xué)習方面的大量進(jìn)展是由計算能力的提高和數據的增長(cháng)所驅動(dòng)的——不過(guò)我這個(gè)觀(guān)點(diǎn)在學(xué)界可能不太受歡迎。我們可以把它類(lèi)比于建造太空火箭:你需要大功率火箭發(fā)動(dòng)機,你也需要大量的燃料。如果你有許多燃料但只擁有小功率發(fā)動(dòng)機,你的火箭大概無(wú)法飛離地面。如果你擁有大功率發(fā)動(dòng)機但只有一點(diǎn)點(diǎn)燃料,你的火箭即使飛上天也無(wú)法進(jìn)入軌道。
只有當你同時(shí)具有了大功率發(fā)動(dòng)機和大量燃料時(shí)你才能去探索太空中的奇妙之地。作為類(lèi)比,大型電腦相當于火箭發(fā)動(dòng)機(在百度我們已經(jīng)可以建造超級電腦了),而大規模數據則相當于火箭燃料。
在過(guò)去十年中,數據的增長(cháng)或者說(shuō)火箭燃料的增長(cháng)略微超出了我們建造火箭發(fā)動(dòng)機以利用燃料的能力。不過(guò)目前,我們在擴增火箭發(fā)動(dòng)機方面的能力已經(jīng)追了上來(lái),在有些時(shí)候甚至反過(guò)來(lái)超過(guò)了我們提供火箭燃料的能力。我們必須努力工作才能同時(shí)擴展這兩種能力。
Fortune:好像現在每當深度學(xué)習被應用于某個(gè)任務(wù)時(shí),它都能為那個(gè)任務(wù)產(chǎn)生最佳結果。我們是否也能夠把深度學(xué)習應用于企業(yè)銷(xiāo)售數據,從而比傳統企業(yè)軟件或流行的“大數據”工具更快地找到有意義的商業(yè)洞見(jiàn)?
吳恩達:深度學(xué)習的一大局限是,它所創(chuàng )造的幾乎所有價(jià)值都來(lái)自“從輸入到輸出的映射”的方法。比方說(shuō)你有一些企業(yè)數據,其中 X 或許是用戶(hù)在亞馬遜上的帳號,而 Y 是“用戶(hù)是否進(jìn)行了購物?”這樣一個(gè)問(wèn)題。如果你擁有關(guān)于 X-Y 配對的大量數據,那么你就能夠利用深度學(xué)習來(lái)進(jìn)行預測。然而,如果讓電腦自己在數據中進(jìn)行探索和發(fā)現,這方面的算法在很大程度上尚處于搖籃期。
正因為如此,那些關(guān)于人工智能邪惡殺人機器人和超級智能的宣傳都是嚴重夸大的。上面提到的 “從 X 到 Y 的映射”只是一種很狹窄的學(xué)習方式。而人類(lèi)可以以多得多的方式來(lái)學(xué)習。這種“從 X 到 Y 的映射”方法在技術(shù)上被稱(chēng)為監督學(xué)習。我認為,關(guān)于監督學(xué)習之外的其他學(xué)習方式,我們仍然沒(méi)有找到正確的思路。
中國市場(chǎng)上的人工智能
Fortune:在美國谷歌和 Facebook 的工作引人矚目。能否告訴我們,百度用人工智能做了些什么?
吳恩達:百度有一件事情做的很不錯,它創(chuàng )造了一個(gè)機器學(xué)習內部平臺。這個(gè)平臺能夠讓全公司的工程師、包括那些不研究人工智能的人都能以各種創(chuàng )造性的方式來(lái)利用深度學(xué)習——他們會(huì )用深度學(xué)習創(chuàng )造出一些像我這樣的人工智能研究者從未想到過(guò)的東西。除了我們核心的網(wǎng)絡(luò )搜索、圖像搜索和廣告業(yè)務(wù)外,深度學(xué)習還支持著(zhù)大量的創(chuàng )意產(chǎn)品,這些創(chuàng )意產(chǎn)品構成一條非常長(cháng)的長(cháng)尾。
例如,我們的電腦安全產(chǎn)品使用深度學(xué)習來(lái)識別安全威脅。我從未想過(guò)深度學(xué)習可以做這個(gè),也不知道該怎么做。我們也使用深度學(xué)習來(lái)提前預測一個(gè)硬盤(pán)何時(shí)會(huì )崩潰,而這就既增加了系統的可靠性,也降低了數據中心的成本。
Fortune:百度也制造了類(lèi)似谷歌眼鏡的產(chǎn)品,還制造了數字助理,甚至智能自行車(chē)。這些產(chǎn)品有市場(chǎng)嗎?還是說(shuō)它們目前只是一些有趣的實(shí)驗而已?
吳恩達:我認為這些目前還屬于研究性探索。不過(guò),通過(guò)我們從社區中獲得的反饋,我們了解到對智能自行車(chē)和可穿戴攝像機的需求是確實(shí)存在的。
實(shí)際上幾周之前,我們剛剛在中國發(fā)布一個(gè)名叫 Dulife 的新產(chǎn)品的 demo,該產(chǎn)品使用計算視覺(jué)和自然語(yǔ)言處理技術(shù)來(lái)告訴盲人其面前有什么東西。比方說(shuō),在中國,有好幾種面值不同的鈔票大小相同,而盲人必須通過(guò)觸摸才能知道它們哪里不一樣。然而,當鈔票被反復使用后,它的盲文部分會(huì )磨損,這樣盲人就很難辨別其面值。在這種情境中,計算機視覺(jué)可以告訴盲人,這是一張 20 元的紙幣,還是一張 50 元的紙幣。這種產(chǎn)品是盲人十分需要的。
Fortune:在這些移動(dòng)和可穿戴設備方面,中國市場(chǎng)是否與美國市場(chǎng)以及其他市場(chǎng)有什么不同呢?
吳恩達:中國市場(chǎng)非常不一樣。其中一個(gè)差異是,中國目前最大、最熱的技術(shù)趨勢是 O2O,即從線(xiàn)上到線(xiàn)下。 O2O 的概念指的是,用你的移動(dòng)設備把你周?chē)耐庠诜?wù)連接起來(lái),無(wú)論這些服務(wù)是洗車(chē)、送餐、尋找附近的打折電影、美甲還是雇傭私家廚師。在美國也有這些東西,不過(guò)中國巨大的人口密度使得 O2O 可以迅速成長(cháng)。
還有,在中國許多用戶(hù)的第一件計算性設備是智能手機。當你的第一件計算性設備是手機的時(shí)候,你就會(huì )學(xué)習用最有效的方式來(lái)使用手機做事,而不一定會(huì )改為使用電腦。
我們可能正在接近 AI 期望值的頂點(diǎn)
Fortune:什么時(shí)候我們會(huì )不再把人工智能當成新鮮事物來(lái)看待,而是像對待許多其他技術(shù)一樣把它視為理所當然呢?
吳恩達:我想,就像在 Gartner 公司的技術(shù)成熟曲線(xiàn)(Gartner Hype Cycle)上,我們可能正在接近人工智能期望值的頂點(diǎn)。我認為,對人工智能超級智能的恐懼曾經(jīng)達到過(guò)頂點(diǎn),而如今這種恐懼的高潮已經(jīng)過(guò)去了。很難講,或許我是錯的,但我希望的是這樣一個(gè)未來(lái):到那時(shí),我們將不再夸大人工智能,而是集中精力去探索人工智能的進(jìn)步。
Fortune:這么說(shuō),我們近期是不是還達不到這樣的水平:我們的設備或應用程序能識別出我們或我們周?chē)臇|西,而我們對此能習以為常?
吳恩達:我認為,在計算視覺(jué)方面還要等很久,因為目前計算視覺(jué)的產(chǎn)品并不多。不過(guò)我可以分享一個(gè)盈利很好的計算視覺(jué)產(chǎn)品。
在百度的廣告系統中,如果你向用戶(hù)展示一段文本,這沒(méi)問(wèn)題。運用我們的深度學(xué)習技術(shù),我們可以幫助廣告商選擇一個(gè)小圖片,這個(gè)小圖片可以與文本并列放置。這樣,你不僅會(huì )讀到一小段關(guān)于在巴厘島度假的廣告,還會(huì )看到一幅巴厘島的小圖片,而你只需要幾分之一秒的時(shí)間就能理解它。這一服務(wù)能讓用戶(hù)更快地明白某個(gè)廣告是關(guān)于什么的,它極大的促進(jìn)了我們在溝通用戶(hù)與廣告商方面的能力。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
