糟了!算法說(shuō)它懂你

Lynn 7年前 (2018-08-20)

俗語(yǔ)有云:內容平臺,能力越大,責任越大。

2018年夏天的《中國好聲音》,清華大學(xué)的學(xué)霸以改編版的《止戰之殤》贏(yíng)得了周杰倫的轉身。在問(wèn)答環(huán)節,這位選手特意向大家介紹了歌曲的“合作者”——AI算法。

他說(shuō),主體歌詞的創(chuàng )作是由AI算法完成的,而他做的事,是“賦予歌詞人類(lèi)的溫度”。

算法懂世界,但是不懂人心

這是深度學(xué)習算法首次以如此華麗的姿態(tài)出現在綜藝節目上,像是AI在向世界宣告自己的“霸主”地位。事實(shí)上,它對我們生活的滲透早在多年前已經(jīng)開(kāi)始。

算法勾魂術(shù)

2000年,國內互聯(lián)網(wǎng)時(shí)代正式開(kāi)啟。智能算法隨著(zhù)互聯(lián)網(wǎng)對生活的滲透,也開(kāi)始進(jìn)入到各個(gè)公司的產(chǎn)品設計中。這種算法從早期的打標簽方式開(kāi)始,強調對用戶(hù)的“內在個(gè)性”的關(guān)注,使用戶(hù)在產(chǎn)品體驗過(guò)程中釋放訴求,進(jìn)入到特別推薦、社區等被算法充分了解的領(lǐng)域,進(jìn)一步提升了用戶(hù)的黏性。

對早期用戶(hù)而言,這樣的算法,是充滿(mǎn)新鮮感又刺激的。

文娛領(lǐng)域通過(guò)算法實(shí)現個(gè)性化推薦功能的開(kāi)山鼻祖,當屬于2005年成立的豆瓣。早期,它基于用戶(hù)社交屬性,即人群喜好的重合度因素,利用算法進(jìn)行分類(lèi)與關(guān)聯(lián)推薦,實(shí)現對書(shū)籍、音樂(lè )和電影內容的個(gè)性化推薦。當時(shí)的豆瓣還是社區模式,針對的也是有固定特性的垂直用戶(hù),這樣的算法非常巧妙地在形成了口碑效應,在短期內用戶(hù)量急速增長(cháng),成為了當時(shí)的“流量”大平臺。這種由算法帶來(lái)的超強用戶(hù)黏性使得在未來(lái)十年中,即便豆瓣幾經(jīng)飄搖,也依然有其影響力的重要原因。

算法懂世界,但是不懂人心

令人惋惜的是,雖然如今的豆瓣電影被看成中國的IMDB,但是就整個(gè)平臺而言,由于十年間計算機覆蓋率呈指數級增長(cháng),用戶(hù)覆蓋到社會(huì )各個(gè)角落,廣告、不良內容的逐漸滲入,豆瓣曾經(jīng)引以為傲的算法帶動(dòng)優(yōu)質(zhì)內容的初衷也不再存在。同時(shí)2010年以后,知乎、網(wǎng)易云音樂(lè )等內容平臺的出現,借助更加優(yōu)質(zhì)的AI智能算法迅速吸粉,瓜分了豆瓣原有的用戶(hù)陣地。

然而無(wú)論是曾經(jīng)的豆瓣社區,還是現在號稱(chēng)智能算法的各大內容平臺,推薦同質(zhì)化嚴重的同時(shí),也讓人質(zhì)疑,這些算法開(kāi)始不懂用戶(hù)了。

智能算法到底是什么

當下AI推薦機制下催生的內容平臺大致可分為四類(lèi),分別是以今日頭條為代表的新聞內容平臺,以知乎為代表的知識問(wèn)答平臺,以抖音、快手為代表的短視頻平臺和以網(wǎng)易云音樂(lè )為代表的流媒體音樂(lè )平臺。

盡管應用領(lǐng)域有所不同,各款產(chǎn)品的特性和生態(tài)布局也有差異,但是在個(gè)性化推薦機制的設計上,萬(wàn)變不離其宗,它們的心思如出一轍。

總體來(lái)看,AI推薦機制的框架設計基于三個(gè)維度。

第一個(gè)維度是內容,即基于音視頻或文本本身的內容提取標簽并以此分類(lèi)。如在音樂(lè )領(lǐng)域,可依據音頻中的頻率、歌曲名、歌手、音樂(lè )風(fēng)格特征等信息來(lái)將內容歸類(lèi)為布魯斯、藍調或者搖滾等;

第二個(gè)維度是用戶(hù),即對用戶(hù)行為數據進(jìn)行提取和分析。如在各大平臺上,都會(huì )見(jiàn)到喜歡、收藏等選項,這里面,用戶(hù)的操作會(huì )折合成一定的權重,并影響最終的算法結果;

第三個(gè)維度是場(chǎng)景,這其中包括了時(shí)間場(chǎng)景和環(huán)境場(chǎng)景。在不同的環(huán)境和時(shí)間段,同一用戶(hù)的選擇趨向也是不同的。

事實(shí)上,算法框架衍進(jìn)至今,是一步一步完善至此的。內容和用戶(hù)維度先后出現,最后才是場(chǎng)景,它們三者之間互為牽制和補充,從而避免推薦結果出現偏頗。

單純基于內容的算法有著(zhù)明顯的問(wèn)題,因其分析的是大量的數據,算法自然無(wú)法推薦新的和非主流的內容,易使推薦趨同。因而,對用戶(hù)行為的分析,自然就可以利用用戶(hù)對內容的態(tài)度來(lái)有效判斷新內容的質(zhì)量,并借助用戶(hù)的差異化來(lái)使得算法推薦保持一種持續更新的狀態(tài),這樣就彌補了內容算法的局限性。同時(shí),這一維度的直接好處就是,幫助平臺快速得獲得用戶(hù)的喜好信息。而場(chǎng)景的融入,則幫助算法更加精準的把握用戶(hù)選擇的變化規律,以實(shí)現人性化。

這里面,內容與用戶(hù)行為兩項維度占主導因素,前者受限歷史數據,后者受制于用戶(hù)行為。而兩者融合,則相得益彰。

人工管理與AI算法之間的博弈

今天,將推薦機制用到極致的平臺中,不得不提今日頭條。它通過(guò)將用戶(hù)分享和AI智能推薦機制很好的融合在一起,并以此“上位”。而隨著(zhù)影響力的擴大,今日頭條的算法推薦漏洞亦于無(wú)形中被放大,終被推上了風(fēng)口浪尖。

但是歷經(jīng)四次改版的今日頭條算法依然有著(zhù)AI無(wú)可避免的通病,包括對語(yǔ)境的判斷、對邊界性信息的篩選等,也因此雖然它在海量信息中為用戶(hù)做出了選擇,但這樣的選擇缺乏用戶(hù)意愿的反饋,缺乏詞義多重理解帶來(lái)的有效信息判斷,可能用戶(hù)在某一時(shí)刻看了一篇具備反諷意味的文章,通篇采用了魔幻主義寫(xiě)作手法,而算法就會(huì )基于這樣的無(wú)差別判斷,持續不斷地為他推送與其意愿不符的內容,而忽略了其真正想要獲得信息。

在這個(gè)層面上,算法的存在,不但沒(méi)有真的懂用戶(hù),反而在更廣的范圍內,試圖以技術(shù)的途徑承擔媒體的職責,卻忽略了媒體社會(huì )價(jià)值的根本在于信息的全面性、觀(guān)點(diǎn)的多樣性,而不是重復在某一個(gè)舒適的維度。

算法懂世界,但是不懂人心

在過(guò)去將算法設為主要運行機制,人工為輔助,今日頭條平臺的運行成本確實(shí)得到大幅的降低,商業(yè)利益得以最大化,但也因此凸顯了弊端。當然,今日頭條也在通過(guò)建立“青云計劃”等機制,廣招審核員去試圖扭轉內容的走勢,但正如其資深算法架構師曹歡歡博士所言,“平臺出于內容生態(tài)和社會(huì )責任的考量,像低俗內容的打壓,標題黨、低質(zhì)內容的打壓,重要新聞的置頂、加權、強插,低級別賬號內容降權都是算法本身無(wú)法完成,需要進(jìn)一步對內容進(jìn)行干預” 。

事實(shí)上,完全驅除人工管理根本是個(gè)偽命題。任何一種算法都是基于平臺價(jià)值與利益而產(chǎn)生的,它代表的也是平臺管理者的價(jià)值觀(guān)。在某種程度上,算法可以不動(dòng)聲色地讓你充分了解這個(gè)平臺的氣質(zhì)、個(gè)性甚至是追求。

而關(guān)于二者之間的對峙,則有個(gè)經(jīng)典的故事。自2015年開(kāi)始,因立場(chǎng)不一,老牌流媒體音樂(lè )服務(wù)平臺Spotify與Apple Music之間就一直處于對峙狀態(tài)。作為坐擁7500萬(wàn)用戶(hù)的音樂(lè )服務(wù)平臺,Spotufy堅持用大量的數據進(jìn)行個(gè)性化推薦,而人工挑選和推薦音樂(lè )一直是Apple Music的重要賣(mài)點(diǎn)。庫克認為,“我們擔心音樂(lè )正在失去人性,擔心它正在變成一個(gè)字節一樣的世界,而不再是一個(gè)藝術(shù)和技藝的世界”。

然而,從目前的統計數據來(lái)看,位居第一的Spotify的用戶(hù)數是Apple Music(第二位)的兩倍,卻是不爭的事實(shí)。

智能反被智能誤,你并不懂我

而用戶(hù),沒(méi)有糾結,簡(jiǎn)單直接。

作為資深音樂(lè )愛(ài)好者和網(wǎng)易用戶(hù),小乙對平臺主打的智能推薦其實(shí)存有不滿(mǎn),“網(wǎng)易云音樂(lè )會(huì )給我推薦不同的歌單,但我只會(huì )偶爾點(diǎn)開(kāi),而且點(diǎn)開(kāi)后我大致‘看’了一下,發(fā)現基本不是我想要的,它也并不懂我,很少能觸碰到我的點(diǎn)。”

對于今日頭條頭條的推薦機制,小甲也有類(lèi)似的感受,“我只是有那么一次點(diǎn)開(kāi)了娛樂(lè )新聞,結果平臺就狂推娛樂(lè )八卦給我,看不到我想看的,我非常反感。”

這不是算法引發(fā)的個(gè)例。如上文所言,算法在某種程度上試圖承擔媒體的介質(zhì)作用,它當然也可以從設計上,通過(guò)融入用戶(hù)和場(chǎng)景兩項因素彌補單純基于內容分析帶來(lái)的信息同質(zhì)化問(wèn)題,但是,算法的設計未考慮理想與現實(shí)之間的差距因素。

受用戶(hù)群體素養、不同領(lǐng)域用戶(hù)行為、人性原始欲望等因素影響,長(cháng)久下來(lái),平臺推薦的內容自然就會(huì )漸漸養成為是偏于大眾趣味的。馴化后的平臺帶來(lái)不了閱讀慣性之外的信息,無(wú)法增加技術(shù)的新鮮感,同時(shí)也“刻意”地流失了很多優(yōu)質(zhì)內容。優(yōu)質(zhì)內容的參與度低,算法的正向反饋會(huì )在無(wú)形中被削弱,而這也將極大地削弱內容創(chuàng )作者的動(dòng)力和創(chuàng )新性。

算法懂世界,但是不懂人心

當下,雖然各大平臺一直在通過(guò)資本運作等措施去阻止“個(gè)性化推薦”劍走偏鋒,但事實(shí)是,大眾文化的力量終還是把平臺的“棱角”抹平,成為了一個(gè)吸引新用戶(hù)和“懶人”的聚集地。

最后

在互聯(lián)網(wǎng)時(shí)代,碎片化信息無(wú)可避免成為了主流,在這樣的境況下形成有效的認知與思想體系不是一件簡(jiǎn)單的事。AI算法也毋庸置疑,是當今各個(gè)平臺的主流技術(shù)手段,然而其弊端和優(yōu)勢一樣,都在朝相反的方向撕扯平臺的核心價(jià)值和用戶(hù)。

內容型平臺最重要的作用不見(jiàn)得是信息的聚攏,更多的應該是引導,廣泛的、多維度的、有溫度有思想的內容引導。這顯然不是單純的算法一統天下能夠達成的,也不是加入人工干預就能周全的。

AI算法是天然趨勢,它懂用戶(hù)的前提是,尊重用戶(hù)。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到