深度學(xué)習驅動(dòng)智能搜索引擎,RankBrain革了SEO的命

鎂客 9年前 (2016-06-07)

去年開(kāi)始,谷歌使用以深度學(xué)習為基礎的人工智能核心搜索算法RankBrain,用越來(lái)越“類(lèi)人化”的算法個(gè)性定制每個(gè)搜索結果。

【編者按】本文由新智元編譯,來(lái)源:techcrunch,作者:John Rampton,譯者:朱煥 胡祥杰

深度學(xué)習驅動(dòng)智能搜索引擎,RankBrain革了SEO的命

【導讀】想在谷歌或百度等搜索結果中排名靠前,除了廣告(給錢(qián)),你還可以選擇SEO(搜索引擎優(yōu)化):讓網(wǎng)站符合算法的規則,提升在搜索引擎內的自然排名。但去年開(kāi)始,谷歌使用以深度學(xué)習為基礎的人工智能核心搜索算法RankBrain,本文認為這種越來(lái)越“類(lèi)人化”的算法個(gè)性定制每個(gè)搜索結果,每個(gè)網(wǎng)站的排名都變得看似更加隨機,在搜索引擎中“鉆空子”難度將越來(lái)越大,SEO將持續極端技術(shù)化,只有把握好分析和大數據做SEO,才有望獲得巨大收益。

RankBrain還是一種弱人工智能

如今,每個(gè)人都聽(tīng)說(shuō)過(guò)谷歌的 RankBrain 算法了。這個(gè)新型人工智能機器學(xué)習算法是從加州山景城谷歌總部誕生出的最新、最重大的算法。然而,讀者中的許多人大概還沒(méi)意識到,RankBrain 將引起 SEO(搜索引擎優(yōu)化)行業(yè)的快速轉變。在本文中,我將帶你去了解一些鮮明的事例,讓你明白 SEO 的不少舊規則都不再適用了,并讓你知道,要想領(lǐng)先于潮流以繼續為你的業(yè)務(wù)提供 SEO 服務(wù),你需要做什么。

那么,什么是人工智能呢?

一般來(lái)說(shuō)有三種類(lèi)型的人工智能:

1,弱人工智能: 這是為某個(gè)特殊目的服務(wù)的人工智能(例如,用于擊敗國際象棋世界冠軍的人工智能)

2,強人工智能:這是那種任何事情都能做的人工智能。一旦人工智能能像人類(lèi)一樣行動(dòng),我們就認為它具有了強人工智能。

3,超人工智能(Artificial Superintelligence):人工智能在做所有事情時(shí)都具有極高的水平(例如,具有超越單個(gè)人類(lèi)的水平)。

當我們談?wù)摴雀璧?RankBrain,以及談?wù)摴雀枘壳罢谶\行的那些機器學(xué)習算法時(shí),我們談的是弱人工智能。實(shí)際上,弱人工智能已經(jīng)存在了一段時(shí)間了。你是否想過(guò)你的電子郵件服務(wù)中的垃圾過(guò)濾器是怎么工作的?是的,那就是弱人工智能的一種體現。我最喜歡的弱人工智能項目還有:谷歌翻譯,IBM Watson,亞馬遜的自動(dòng)產(chǎn)品推薦,自動(dòng)駕駛汽車(chē)以及我們親愛(ài)的谷歌 RankBrain.

在弱人工智能界,有多種不同的實(shí)現方式。Pedro Domingos 曾在 MasterAlgorithm 一書(shū)中明確指出,那些試圖實(shí)現完美人工智能的數據科學(xué)家可以被分為五個(gè)“派別”,它們是:

• 符號主義者

• 聯(lián)結主義者

• 進(jìn)化主義者

• 貝葉斯主義者

• 行為類(lèi)比主義者(Analogizers)

谷歌的 RankBrain 屬于聯(lián)結主義派。聯(lián)結主義者相信,我們所有的知識都被編碼為我們大腦中的神經(jīng)元聯(lián)結。而 RankBrain 使用的具體方法是一種被專(zhuān)家稱(chēng)為“反向傳播”的技術(shù),這一路方法后來(lái)也被人們稱(chēng)之為深度學(xué)習。

聯(lián)結主義者宣稱(chēng),該方法能從原始數據中學(xué)習任何東西,因此它最終能夠實(shí)現知識發(fā)現的自動(dòng)化。谷歌顯然也相信這一點(diǎn)。2014年 1月 26日,谷歌宣布收購 深度學(xué)習公司Deepmind,顯露了在這領(lǐng)域的雄心。

因此,當我們談?wù)?RankBrain 時(shí),我們可以說(shuō)它使用的是弱人工智能中的深度學(xué)習技術(shù)。那么,該領(lǐng)域目前發(fā)展如何呢?以及更重要的,它正在如何改變 SEO 業(yè)務(wù)呢?

2025 年左右實(shí)現強人工智能?

WaitButWhy.com 的 Tim Urban 在其文章《AI 革命: 通向超級人工智能之路》中比任何人都更清楚地解釋了這一技術(shù)的增長(cháng)。

當你回顧歷史時(shí),該技術(shù)的進(jìn)展是這樣的:

深度學(xué)習驅動(dòng)智能搜索引擎,RankBrain革了SEO的命

不過(guò),正如 Urban 所指出的,在現實(shí)中,你其實(shí)看不見(jiàn)你自己位置的右側(即你的未來(lái))。因此,當你站在圖表的當下位置是,這是你實(shí)際感受到的樣子:

深度學(xué)習驅動(dòng)智能搜索引擎,RankBrain革了SEO的命

這一圖表所展現是的,當人類(lèi)試圖預測歷史時(shí),他們常常會(huì )低估未來(lái)的趨勢。這是因為他們總是去看位于圖的左側的過(guò)去,而不是位于圖的右側的未來(lái)。

然而,現實(shí)是,隨著(zhù)時(shí)間演化,人類(lèi)進(jìn)步正在越來(lái)越快。Ray Kurzweil 將這稱(chēng)之為“加速循環(huán)定律”。Kurzweil 的理論背后的科學(xué)理由是:與過(guò)去的不夠先進(jìn)的社會(huì )相比,未來(lái)的更先進(jìn)的社會(huì )有能力以更快的速度進(jìn)步——因為那時(shí)的社會(huì )更先進(jìn)。這一推理也可以運用到人工智能以及技術(shù)進(jìn)步的增長(cháng)速度方面。

在計算資源方面,我們已經(jīng)看到了這一點(diǎn)。下面的圖標可以讓你看看,由于“加速循環(huán)定律”,事情進(jìn)展得有多快:

深度學(xué)習驅動(dòng)智能搜索引擎,RankBrain革了SEO的命

正如你所看到的和我們都直觀(guān)感受到的,處理器和計算機技術(shù)的增長(cháng)都獲益于加速循環(huán)定律。另一件令人震驚的事是:未來(lái)的某一天,一臺簡(jiǎn)易電腦的處理能力將不僅超過(guò)單個(gè)的人,而且超過(guò)所有人類(lèi)的總和。

深度學(xué)習驅動(dòng)智能搜索引擎,RankBrain革了SEO的命

實(shí)際上,看起來(lái)我們將在 2025 年左右實(shí)現強人工智能。技術(shù)顯然正在越來(lái)越快地擴張,這想必會(huì )讓我們大多數人感到驚訝。

從傻瓜到愛(ài)因斯坦

正如我上面解釋的,谷歌的 RankBrain 只是弱人工智能的一個(gè)例子。這意味著(zhù),RankBrain 可以在某個(gè)特定領(lǐng)域中比一個(gè)人做得更好,但也僅此而已:它只是一種相對較弱形式的人工智能。然而,哪怕是這種“弱”人工智能,也會(huì )飛快地變成一種我們不知該怎么對付的東西。

深度學(xué)習驅動(dòng)智能搜索引擎,RankBrain革了SEO的命

你可以清楚地看到,谷歌的 RankBrain 盡管在特定任務(wù)上極其聰明,但在通用的智力尺度上仍然是失敗的。然而,如果我們把加速循環(huán)定律應用在人工智能領(lǐng)域,將會(huì )發(fā)生什么呢?Tim Urban 進(jìn)行了這樣一個(gè)思想實(shí)驗:

“當人工智能的智力越來(lái)越接近我們時(shí),我們會(huì )看到它變得越來(lái)越聰明,像一個(gè)動(dòng)物一樣。之后,它將達到人類(lèi)的最低水平——用 Nick Bostrom 的話(huà)說(shuō),是村里的傻瓜的水平——我們會(huì )說(shuō)‘ 哇奧,它看起來(lái)像個(gè)人類(lèi)傻瓜,真可愛(ài)!' 然而重要的是,在所有智力水平構成的譜系中,從傻瓜到愛(ài)因斯坦的所有人類(lèi)都只占了一個(gè)很小的區域——因此,在人工智能實(shí)現‘村中傻瓜’水平并具有強人工智能之后,它將突然變得比愛(ài)因斯坦更聰明,而我們不會(huì )知道那將是什么樣。”

深度學(xué)習驅動(dòng)智能搜索引擎,RankBrain革了SEO的命

那么,這對 SEO 業(yè)務(wù)以及我們目前的人工智能來(lái)說(shuō)意味著(zhù)什么呢?

在我們去預測未來(lái)之前,讓我們先看看 RankBrain 已經(jīng)怎樣改變了 SEO。我與卡耐基梅隆大學(xué)校友、Market Brew (一家為 Fortune 500 強的 SEO 團隊提供搜索引擎模型的公司)的 CTO、聯(lián)合創(chuàng )始人 Scott Stouffer 就這一問(wèn)題進(jìn)行了交流。作為一名搜索工程師,Stouffer 對過(guò)去幾十年的發(fā)展具有一個(gè)大部分人都不具有的獨特視角。

谷歌開(kāi)始把主要精力放在人工智能后,SEO行業(yè)應如何應對?下面是他的一些建議。

回歸分析是有嚴重缺陷

這是 SEO 行業(yè)中當前最大的缺陷。每當谷歌的排名發(fā)生巨大變化時(shí),都會(huì )出現許多“大師”——來(lái)自本行業(yè)知名公司的一些數據科學(xué)家和 CTO 會(huì )宣稱(chēng),他們知道為什么谷歌最近排名指數發(fā)生了變化。其實(shí),他們最常用的方法是仔細分析幾個(gè)月以來(lái)的排名數據,并去了解在所有類(lèi)型的網(wǎng)站中排名情況是如何改變的。

按照目前的回歸分析方法,這些數據科學(xué)家會(huì )指出一些受到了(正面或負面)影響的特定類(lèi)型的網(wǎng)站,并十分肯定地認為谷歌最近的算法轉變是針對這些網(wǎng)站共有的某類(lèi)算法(內容或外鏈)而出現的。

然而,如今谷歌已經(jīng)不這么干了。谷歌的 RankBrain 采用機器學(xué)習/深度學(xué)習方法,它的工作方式與過(guò)去十分不一樣。

其實(shí),谷歌內部已經(jīng)存在許多核心算法。RankBrain 的任務(wù)是去學(xué)習這些核心算法以何種方式混合起來(lái)才能最佳地應用到每種類(lèi)型的搜索結果中去。例如,在某些搜索結果中,RankBrain 可能學(xué)習到最關(guān)鍵的搜索信號是這些搜索結果中的元標題(Meta Title)。

為那些元標題匹配算法賦予更多的權重,這可能會(huì )帶來(lái)更好的搜索體驗。但在另一個(gè)搜索結果中,同樣的元標題信號與良好的搜索體驗之間可能卻是負相關(guān)。因此,在那一類(lèi)搜索中,諸如 PageRank 之類(lèi)的其他算法可能會(huì )被賦予更多權重。

深度學(xué)習驅動(dòng)智能搜索引擎,RankBrain革了SEO的命

這意味著(zhù),在每個(gè)搜索結果中,谷歌都使用了完全不同的算法混合方式。現在,你就會(huì )明白,為什么“在缺乏搜索結果語(yǔ)境的情況下,對所有網(wǎng)站進(jìn)行回歸分析”這種方法是有嚴重缺陷的。

出于這些原因,現在的回歸分析必須根據每一次的特定搜索來(lái)進(jìn)行。Stouffer 最近談到了一種可以用來(lái)測量谷歌算法改變程度的搜索模型方法。

首先,你可以截一張圖,以確定搜索引擎模型在過(guò)去為某個(gè)具體關(guān)鍵詞搜索而被校準到了什么程度。然后,當探測到排名方式發(fā)生了改變之后,你可以對搜索引擎模型進(jìn)行重新校準,以展示出這兩種搜索引擎模型設置之間的差異。通過(guò)這一方法,在經(jīng)歷了排名方式變化之后,你就可以看出哪些特定算法被增加或減少了權重。

知道了這一點(diǎn)后,我們就可以聚焦于如何提升網(wǎng)站對這些特定搜索結果的 SEO。但同樣的方法并不適用于其他搜索結果。這是因為 RankBrain 是在搜索結果(或關(guān)鍵詞)的水平上進(jìn)行操作的。確切地說(shuō),RankBrain為每個(gè)搜索結果都進(jìn)行算法的個(gè)性定制。

把握細分領(lǐng)域,避免錯誤分類(lèi)

谷歌還發(fā)現,他們可以讓 RankBrain 這個(gè)新型深度學(xué)習系統學(xué)會(huì ),“好”網(wǎng)站長(cháng)什么樣,“壞”網(wǎng)站長(cháng)什么樣。就像他們?yōu)槊恳粋€(gè)搜索結果進(jìn)行不同的算法權重賦予一樣,他們也發(fā)現每個(gè)垂直領(lǐng)域都有不同的“好”網(wǎng)站和“壞”網(wǎng)站實(shí)例。這無(wú)疑是因為不同的垂直領(lǐng)域具有不同的客戶(hù)關(guān)系管理方式,不同的模板和數據結構類(lèi)型。

當 RankBrain 運行時(shí),它實(shí)際上在學(xué)習每種垂直環(huán)境中的正確“設定”是什么樣的。你或許已經(jīng)猜到,這些正確設定是什么完全取決于該設定所處于的垂直領(lǐng)域是什么樣的。例如,在醫療產(chǎn)業(yè)中,谷歌知道像 WebMD.com 這樣的網(wǎng)站聲譽(yù)良好,并會(huì )把這樣的網(wǎng)站放在其搜索索引的頂部位置。而任何結構上與 WebMD 網(wǎng)站相似的網(wǎng)站也會(huì )被歸類(lèi)到“好”網(wǎng)站的類(lèi)別中。類(lèi)似的,那些與已知的醫療領(lǐng)域垃圾網(wǎng)站結構相似的網(wǎng)站則會(huì )被歸為“壞”網(wǎng)站的類(lèi)別。

由于Rankbrain 使用深度學(xué)習能力同時(shí)對“好”網(wǎng)站和“壞”網(wǎng)站進(jìn)行歸類(lèi),如果你的網(wǎng)站中包含許多不同產(chǎn)業(yè)的信息,那將會(huì )怎樣呢?

深度學(xué)習驅動(dòng)智能搜索引擎,RankBrain革了SEO的命

首先,我們必須再多討論一下深度學(xué)習是如何工作的。在把所有網(wǎng)站都分為“好”“壞”兩組之前,RankBrain 必須首先決定每個(gè)網(wǎng)站分別屬于什么類(lèi)別。像 Nike.com 和 WebMD.com 這樣的網(wǎng)站很好歸類(lèi)。盡管這兩個(gè)網(wǎng)站上都有很多不同的子類(lèi)別,但它們都具有單一的一般類(lèi)別。這類(lèi)網(wǎng)站很容易被分類(lèi)。

然而,那些包含了許多不同類(lèi)別的網(wǎng)站呢?這類(lèi)網(wǎng)站中的一個(gè)很好的例子是那些 How-To 型網(wǎng)站。這些網(wǎng)站通常擁有許多通用類(lèi)別。面臨這些網(wǎng)站,深度學(xué)習方法就會(huì )崩潰。那么,在面對這些網(wǎng)站時(shí),谷歌使用什么樣的訓練數據呢?答案是:它可能是使用看起來(lái)隨機的數據。它可能從眾多類(lèi)別中選擇這個(gè)類(lèi)別,也可能選擇另一個(gè)類(lèi)別。對于像 Wikipedia 這樣的著(zhù)名網(wǎng)站來(lái)說(shuō),谷歌可能完全不采取任何分類(lèi)過(guò)程,以確保深度學(xué)習過(guò)程不會(huì )打擾用戶(hù)既有的搜索體驗(因為維基這樣的大網(wǎng)站不太可能產(chǎn)生壞網(wǎng)頁(yè)。)

然而,對那些不那么知名的網(wǎng)站來(lái)說(shuō),會(huì )發(fā)生什么呢?答案是,“誰(shuí)知道呢?”或許,這個(gè)機器學(xué)習過(guò)程能自動(dòng)地對每個(gè)網(wǎng)站進(jìn)行分類(lèi),在此之后才會(huì )把它與其他網(wǎng)站進(jìn)行比較。一個(gè) How-To 型網(wǎng)站也許看起來(lái)和 WebMed 網(wǎng)站一個(gè)樣。

如果系統的分類(lèi)過(guò)程認為這個(gè)網(wǎng)站是關(guān)于鞋的,那么它就會(huì )把該網(wǎng)站與 Nike 網(wǎng)站結構進(jìn)行比較,而不是與 WebMD 進(jìn)行比較。也許,該網(wǎng)站的結構很像一家鞋類(lèi)垃圾網(wǎng)站,而不像聲譽(yù)良好的 WebMD 網(wǎng)站;如果是這樣,這個(gè)內容過(guò)于一般化的網(wǎng)站就會(huì )被打上“垃圾”的標簽。因此,如果這個(gè) How-To 型網(wǎng)站具有不同的子領(lǐng)域,最好讓每個(gè)子領(lǐng)域的樣子都類(lèi)似于該領(lǐng)域的最好網(wǎng)站。要把握住這些細分領(lǐng)域。

能辨認“好壞”的 RankBrain

讓我們再看看這將如何影響外鏈?;谏厦嫣岬降姆诸?lèi)過(guò)程,下面這一點(diǎn)將變得前所未有的重要:堅持只在你的鄰近領(lǐng)域中進(jìn)行外鏈。因為 RankBrain 能夠知道,你的某些外鏈是不是與你所在的垂直領(lǐng)域同類(lèi)網(wǎng)站的外鏈特征不同。

讓我們仍使用剛才的例子。一家公司有一個(gè)關(guān)于鞋的網(wǎng)站。我們知道 RankBrain 的深度學(xué)習過(guò)程會(huì )試圖把該網(wǎng)站的各個(gè)方面與鞋業(yè)領(lǐng)域的最佳和最差網(wǎng)站進(jìn)行比較。因此,該網(wǎng)站的外鏈特征也將用來(lái)與同類(lèi)的最佳和最差網(wǎng)站的外鏈特征進(jìn)行比較。

假設,一個(gè)典型的聲譽(yù)良好的鞋業(yè)網(wǎng)站擁有一下三個(gè)鄰近領(lǐng)域的外鏈:

運動(dòng)

健康

時(shí)尚

現在,假設該公司的 SEO 團隊決定從這三個(gè)鄰近領(lǐng)域中購買(mǎi)外鏈;此外,由于公司 CEO 和汽車(chē)產(chǎn)業(yè)有一些聯(lián)系,他們決定使用汽車(chē)網(wǎng)站的免費外鏈??雌饋?lái)這很“聰明”: 他們使用了交叉營(yíng)銷(xiāo)方法,在汽車(chē)網(wǎng)站上展示“租車(chē)就送免費鞋”的頁(yè)面,而這些頁(yè)面將導向該公司的新鞋頁(yè)面??雌饋?lái)很不錯,不是嗎?

然而,RankBrain 會(huì )發(fā)現這一點(diǎn),并發(fā)現該網(wǎng)站的外鏈特征與鞋業(yè)好網(wǎng)站的特征十分不同。更糟的是,它發(fā)現許多鞋業(yè)垃圾網(wǎng)站也擁有來(lái)自汽車(chē)網(wǎng)站的外鏈特征。

這樣,盡管 RankBrain 并不知道什么是“正確”的外鏈特征,它卻察覺(jué)出了對它的搜索引擎結果而言什么是“好”網(wǎng)站,什么是“壞”網(wǎng)站。這家鞋業(yè)網(wǎng)站將會(huì )被標記為“壞”,來(lái)自汽車(chē)網(wǎng)站的免費外鏈帶來(lái)的將是訪(fǎng)問(wèn)量的暴跌。

你沒(méi)法再鉆空子了

從我們前面對加速循環(huán)定律的討論中可以知道,RankBrain和其他人工智能未來(lái)都將會(huì )超越人腦。此刻,沒(méi)有人知道這一技術(shù)將把我們帶向何方。

不過(guò),有一些事情是確定的:

每個(gè)有競爭力的關(guān)鍵詞環(huán)境都需要被單獨檢驗。

大多數網(wǎng)站都需要把握好對細分領(lǐng)域的處理。

每家網(wǎng)站都應該模仿該領(lǐng)域中聲譽(yù)優(yōu)良的頂級網(wǎng)站的結構和組成。

在某種意義上,深度學(xué)習的方法讓 SEO 業(yè)務(wù)變得更簡(jiǎn)單了。當你知道 RankBrain 等類(lèi)似技術(shù)已經(jīng)具有了與人類(lèi)旗鼓相當的能力時(shí),你應該遵循的原則就變得很清楚了:你沒(méi)法再鉆空子了。

在另一種意義上,事情變得更難了。SEO 領(lǐng)域將繼續變得極端技術(shù)化。分析和大數據是今日的王道,那些對這些方法尚不熟悉的 SEO 必須盡快趕上。那些已經(jīng)擁有這些能力的 SEO 有希望未來(lái)獲得巨大收益。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到