圖片實(shí)測:智能鑒黃,哪家強?
當下,UGC內容量的爆發(fā)超出所有人的想象。據粗略統計,每天上傳到YouTube的視頻可以連續播放98年,Facebook每天發(fā)布的照片量堆起有80個(gè)埃菲...
當下,UGC內容量的爆發(fā)超出所有人的想象。據粗略統計,每天上傳到YouTube的視頻可以連續播放98年,Facebook每天發(fā)布的照片量堆起有80個(gè)埃菲爾鐵塔那么高,有200萬(wàn)篇文章在網(wǎng)上發(fā)布,相當于美國《時(shí)代》刊發(fā)770年的總量…… 面對如此龐大的內容量,如何篩選內容,確保內容符合法律法規,成了很多內容平臺首要解決的問(wèn)題。
在智能鑒黃領(lǐng)域,國內名氣較大的第三方平臺有阿里綠網(wǎng)和網(wǎng)易云易盾、騰訊云萬(wàn)象優(yōu)圖、圖譜科技等。內容平臺尤其是直播平臺在面對這些第三方服務(wù)時(shí),往往“一頭霧水”,因為不知道這些企業(yè)提供的服務(wù)到底怎么樣?能否解決他們的需求。
抱著(zhù)對技術(shù)發(fā)展的好奇心,筆者從一個(gè)內容審核外包公司獲取了一些圖片,在這些平臺上做了一下測評(為了保證文章能夠順利發(fā)出,一些圖片做了打碼處理),把結果呈現給大家,供各位參考。
第一張圖片:
不用多說(shuō),這種類(lèi)型的是犯罪圖片(已打碼處理),人工審核:黃色圖片一張!那么人工智能鑒黃平臺會(huì )如何評判呢?結果請見(jiàn)下圖。
結果顯示分別是:騰訊云、阿里綠網(wǎng)、圖譜科技、網(wǎng)易云易盾
從測試結果來(lái)看,個(gè)別智能識別系統的檢測結果不盡人意(檢測結果百分比越高代表違規越嚴重,反之,百分比低則可能被當做為正常性感圖片)??傮w來(lái)看,網(wǎng)易云易盾和阿里綠網(wǎng)的結果還是比較不錯的。
第二張圖片:
這張圖片沒(méi)打碼之前,屬于典型的擦邊球圖片,鑒黃服務(wù)平臺會(huì )是什么反應?我們一起來(lái)看看。
結果顯示分別是:騰訊云、阿里綠網(wǎng)、圖譜科技、網(wǎng)易云易盾
這張圖片有打擦邊球的嫌疑,對于人工審核來(lái)說(shuō),這些擦邊球基本上不可能通過(guò)。但是,對于智能系統來(lái)說(shuō),還是有通過(guò)的可能性的。在識別這張圖上,圖譜科技和網(wǎng)易云易盾的系統表現不錯。
第三張圖片:
這是一張正常的美女圖片,在智能鑒黃平臺這會(huì )是什么結果?
結果顯示分別是:騰訊云、阿里綠網(wǎng)、圖譜科技、網(wǎng)易云易盾
這張圖片的檢測結果出乎筆者的意料,三家鑒黃平臺評判出的百分比都不低,有一家給出“疑似”,真的不知道這些AI工程師到底喂給它什么樣的圖片,這樣的圖片都“招架不住”!
第四張圖片:
每個(gè)父母都希望在某些平臺上曬一下自己的萌娃,作為一個(gè)正常人,我們也非常樂(lè )意看到這樣的圖片——天真無(wú)邪類(lèi)型。這些圖片比上面的三張圖片可視性要高,對于這類(lèi)圖片,智能鑒黃平臺會(huì )如何批判?
結果顯示分別是:騰訊云、阿里綠網(wǎng)、圖譜科技、網(wǎng)易云易盾
從測試結果上來(lái)看,有2家智能鑒黃平臺都給出的評判百分比并不低,不得不承認,這個(gè)時(shí)代曬個(gè)萌娃都有可能要被某些服務(wù)干掉。為了避免個(gè)別圖片存在的樣本差異,筆者再測一組。
第五張圖片:
這張圖片雖然是嬰兒全裸,但是,在我們大多數人的眼里,小家伙挺可愛(ài),準裸。
測試結果:
結果顯示分別是:騰訊云、阿里綠網(wǎng)、圖譜科技、網(wǎng)易云易盾
這張圖片測試結果大體上幾個(gè)平臺的系統測試結果勉強能夠接受,沒(méi)有出現很離譜的測試結果。
總體測試結果分析:
第一張圖片:內容審核員評判:色情圖片;平臺表現:阿里綠網(wǎng)>網(wǎng)易云易盾>騰訊云>圖譜科技。
第二張圖片:內容審核員評判:色情圖片;平臺表現:網(wǎng)易云易盾>圖譜科技>阿里綠網(wǎng)>騰訊云。
第三張圖片:內容審核員評判:美女圖片;平臺表現:圖譜科技>網(wǎng)易云易盾>阿里綠網(wǎng)>騰訊云。
第四張圖片:內容審核員評判:萌娃圖片;平臺表現:網(wǎng)易云易盾>圖譜科技>阿里綠網(wǎng)>騰訊云。
第五張圖片:內容審核員評判:萌娃圖片;平臺表現:網(wǎng)易云易盾>圖譜科技>騰訊云>阿里綠網(wǎng)。
從總體的測試結果看,阿里綠網(wǎng)的結果過(guò)于似是而非,第一張圖片鑒定的還算可以,之后的圖片卻都是疑似?疑似這個(gè)評判的面太大了!圖譜科技作為一家創(chuàng )業(yè)型企業(yè),在缺少數據的情況下,做到這個(gè)程度也是可以理解的。網(wǎng)易云易盾的測試結果還是不錯,但是也有誤判的時(shí)候。騰訊云就不多評價(jià)了,測試結果不是很好,后續還需要數據訓練。
結束語(yǔ)
雖然說(shuō)人工智能這幾年發(fā)展很快,不過(guò)站在客觀(guān)的角度去看內容安全領(lǐng)域,筆者覺(jué)得也不能完全依賴(lài)人工智能,智能鑒黃+人工應該是目前最穩妥的方案。
但也非常期盼人工智能的技術(shù)進(jìn)步能夠讓鑒黃服務(wù)變得更加聰明,這既能減輕內容審核員的工作負擔,又能快速地凈化互聯(lián)網(wǎng)環(huán)境。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
