深度學(xué)習應用系統分析:應用組合和形態(tài)矩陣找到正確路徑

鎂客 9年前 (2016-11-28)

對深度學(xué)習研究和應用的興趣從未這么熱過(guò)。深度學(xué)習最迷人的地方是,神經(jīng)網(wǎng)絡(luò )似乎能夠解決以前只能用定制方法解決的各種問(wèn)題。

深度學(xué)習應用系統分析:應用組合和形態(tài)矩陣找到正確路徑

【導讀】本文收錄了arXiv.org上關(guān)于深度學(xué)習的一些最新的研究論文,列出了這些文章的內容,包括“深度學(xué)習八大靈感應用”、“深度學(xué)習用例”、“科學(xué)與工程中的深度學(xué)習應用”、“深度學(xué)習應用程序的下一次浪潮”等。針對這些文章缺乏系統方法的問(wèn)題,提出了具體的組合矩陣、形態(tài)矩陣解決方案,并給出了預測示例。

隱藏的潛力

對深度學(xué)習研究和應用的興趣從未這么熱過(guò)。幾乎每天都可以在arXiv.org找到無(wú)數的新研究論文。這些論文為我們描述了新的方法,人工神經(jīng)網(wǎng)絡(luò )可以靠這些方法應用于我們日常生活的各個(gè)領(lǐng)域。深度學(xué)習最迷人的地方是,神經(jīng)網(wǎng)絡(luò )似乎能夠解決以前只能用定制方法解決的各種問(wèn)題。

此外,每天都會(huì )出現新的文章或博客,告訴我們更多奇特的應用深度學(xué)習的方式。這些文章、博客甚至書(shū)籍的問(wèn)題是,它們不對神經(jīng)網(wǎng)絡(luò )應用程序進(jìn)行系統性的處理。至少到目前為止,我還沒(méi)有看到有人這么做。如果你知道有人這么做過(guò),請告訴我。

最先進(jìn)的方法

在搜索這篇文章的材料時(shí),我發(fā)現了一些總結深度學(xué)習應用程序的文章。下面是來(lái)自那些文章的許多引用與相關(guān)鏈接。

1.第一篇文章是 Jason Brownlee 發(fā)表的深度學(xué)習八大靈感應用”,來(lái)自博客 Machine Learning Mastery。

下面是這些應用的列表:

1. 黑白圖像的著(zhù)色。

2. 添加聲音到無(wú)聲電影。

3. 自動(dòng)機器翻譯。

4. 照片中的對象分類(lèi)。

5. 自動(dòng)手寫(xiě)生成。

6. 字符文本生成。

7. 圖像字幕生成。

8. 自動(dòng)游戲。

正如上表所列的,這些應用都可以歸到聽(tīng)覺(jué)、視覺(jué)和空間這幾種感覺(jué)模態(tài),這些模態(tài)也是人工智能研究最初得到應用的地方。

2 ,第二篇文章名為“深度學(xué)習用例”,來(lái)自專(zhuān)門(mén)用于Java的Deeplearning4j 機器學(xué)習庫網(wǎng)站。

深度學(xué)習應用系統分析:應用組合和形態(tài)矩陣找到正確路徑

和上一篇一樣,我們可以將這里的所有應用程序歸類(lèi)為聽(tīng)覺(jué),視覺(jué)和空間三種模態(tài)。其實(shí)并不存在空間模態(tài),但出于一般性的考慮,我用“空間模態(tài)”來(lái)指代對序列的處理。

3 下一篇是為John Murphy的“科學(xué)與工程中的深度學(xué)習應用”。本文介紹了和前面幾篇類(lèi)似的深度學(xué)習應用,但也提供了另外一些奇特的應用,例如科學(xué)實(shí)驗設計、高能物理和藥物發(fā)現方面的應用。

4.此外,我想提及“深度學(xué)習應用程序的下一次浪潮”這篇文章。文中充滿(mǎn)各種最奇異的、你可能聞所未聞的應用程序。例如:天氣預報和事件檢測、用于腦癌檢測的神經(jīng)網(wǎng)絡(luò )。

5,最后一篇文章來(lái)自 Quora,是關(guān)于深度學(xué)習應用程序的一組問(wèn)答。

上面所有這些文章缺乏的是系統方法。這種系統方法不僅描述深度學(xué)習的當前應用,而且能夠預測未來(lái)的可能應用。

組合矩陣

我建議使用組合矩陣:所有當前的深度學(xué)習應用程序可以從矩陣中推導出來(lái),該矩陣還具有提示未來(lái)應用程序的優(yōu)點(diǎn)。

在該矩陣中,每一行和每一列都枚舉出了各種類(lèi)型的感覺(jué)模態(tài),這樣,我們可以在矩陣中找到任意兩個(gè)感覺(jué)模態(tài)配對后的選項對,例如,語(yǔ)音 - 圖像識別便是一個(gè)這樣的選項對。矩陣中的每一個(gè)選項對都可以根據當前或未來(lái)可能的深度學(xué)習應用來(lái)解釋。

深度學(xué)習應用系統分析:應用組合和形態(tài)矩陣找到正確路徑

預測示例

如果我們看第4行、第B列,將找到來(lái)自音頻模態(tài)的“語(yǔ)音識別器 - >語(yǔ)音生成器”選項對,這可以被解釋為從語(yǔ)言到語(yǔ)言的翻譯應用,例如Google翻譯。此外,如果我們選擇第6行,第D列,將找到“圖像識別器 - >圖像生成器”,這正是arXiv.org上的深度卷積逆向圖形網(wǎng)絡(luò )論文背后的想法。

可以看出,該矩陣中的可能選項對的總數是 12 *(12-1)= 132。一般而言,選項對總數為 N *(N-1)。

如果我們想要構思一個(gè)新的應用程序,我們可以系統性地遍歷矩陣并尋找新的選項對,或選擇一個(gè)隨機的選項對,例如第4行和第H列,將得到“圖像識別器 - >自然語(yǔ)言生成器”。它可能是這樣一個(gè)應用:讀取對著(zhù)手機攝像頭說(shuō)話(huà)的人的唇語(yǔ),并生成文本發(fā)送到另一應用。當身處嘈雜環(huán)境時(shí),這個(gè)應用程序會(huì )很有用。(想法來(lái)自這鏈接)。

注意,我這樣組織這個(gè)矩陣,只是為了舉例子方便。也可以用其他方式來(lái)組織矩陣,那樣就會(huì )產(chǎn)生其他的深度學(xué)習應用的可能組合。此外,該矩陣可以是多維的,以便考慮各種參數組合。

形態(tài)矩陣

嘗試預測深度學(xué)習應用的另外一種方法是,使用由加州理工學(xué)院的瑞士天體物理學(xué)家 Fritz Zwicky 開(kāi)發(fā)的形態(tài)矩陣法。順便說(shuō)一句,這種方法已經(jīng)成功地用于預測中子星的存在。在瑞典形態(tài)學(xué)學(xué)會(huì )的網(wǎng)站上,可以找到關(guān)于形態(tài)矩陣及其應用的詳細解釋?,F在,我們只需知道,該矩陣是以這樣的方式構成:其第一行具有各種感覺(jué)模態(tài),例如聽(tīng)覺(jué),視覺(jué),觸覺(jué)等,其余的行則為這些模態(tài)提供可能的選項。下面的屏幕截圖將有助于澄清這一點(diǎn)。

深度學(xué)習應用系統分析:應用組合和形態(tài)矩陣找到正確路徑

預測示例

既然我們有了形態(tài)矩陣,我們就可以把深度學(xué)習應用看作一個(gè)模態(tài)選項的集合。例如,當我們從表格中鎖定“語(yǔ)音識別/生成和圖像識別”這個(gè)選項后,我們就可以理解 2016年11用 16日剛剛提交到 arXiv.org 的《在野外環(huán)境讀取唇語(yǔ)》這篇最新的深度學(xué)習應用論文的本質(zhì)。

請注意,此矩陣可以以其他方式組合,以產(chǎn)生深度學(xué)習可能應用的不同組合。

結論

正如本文所示,通過(guò)組合和形態(tài)矩陣來(lái)系統地尋找深度學(xué)習以及一般意義上的機器學(xué)習應用,這是可能和有效的。

【編者按】本文轉自新智元。文章來(lái)源:gettocode,作者:Andrei Cheremskoy。編譯:朱煥

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到