圖片實(shí)測:智能鑒黃,哪家強?

鎂客 7年前 (2018-06-22)

當下,UGC內容量的爆發(fā)超出所有人的想象。據粗略統計,每天上傳到YouTube的視頻可以連續播放98年,Facebook每天發(fā)布的照片量堆起有80個(gè)埃菲...

當下,UGC內容量的爆發(fā)超出所有人的想象。據粗略統計,每天上傳到YouTube的視頻可以連續播放98年,Facebook每天發(fā)布的照片量堆起有80個(gè)埃菲爾鐵塔那么高,有200萬(wàn)篇文章在網(wǎng)上發(fā)布,相當于美國《時(shí)代》刊發(fā)770年的總量…… 面對如此龐大的內容量,如何篩選內容,確保內容符合法律法規,成了很多內容平臺首要解決的問(wèn)題。

在智能鑒黃領(lǐng)域,國內名氣較大的第三方平臺有阿里綠網(wǎng)和網(wǎng)易云易盾、騰訊云萬(wàn)象優(yōu)圖、圖譜科技等。內容平臺尤其是直播平臺在面對這些第三方服務(wù)時(shí),往往“一頭霧水”,因為不知道這些企業(yè)提供的服務(wù)到底怎么樣?能否解決他們的需求。

抱著(zhù)對技術(shù)發(fā)展的好奇心,筆者從一個(gè)內容審核外包公司獲取了一些圖片,在這些平臺上做了一下測評(為了保證文章能夠順利發(fā)出,一些圖片做了打碼處理),把結果呈現給大家,供各位參考。

第一張圖片:

圖片實(shí)測:智能鑒黃,哪家強?

不用多說(shuō),這種類(lèi)型的是犯罪圖片(已打碼處理),人工審核:黃色圖片一張!那么人工智能鑒黃平臺會(huì )如何評判呢?結果請見(jiàn)下圖。

圖片實(shí)測:智能鑒黃,哪家強?

結果顯示分別是:騰訊云、阿里綠網(wǎng)、圖譜科技、網(wǎng)易云易盾

從測試結果來(lái)看,個(gè)別智能識別系統的檢測結果不盡人意(檢測結果百分比越高代表違規越嚴重,反之,百分比低則可能被當做為正常性感圖片)??傮w來(lái)看,網(wǎng)易云易盾和阿里綠網(wǎng)的結果還是比較不錯的。

第二張圖片:

圖片實(shí)測:智能鑒黃,哪家強?

這張圖片沒(méi)打碼之前,屬于典型的擦邊球圖片,鑒黃服務(wù)平臺會(huì )是什么反應?我們一起來(lái)看看。

圖片實(shí)測:智能鑒黃,哪家強?

結果顯示分別是:騰訊云、阿里綠網(wǎng)、圖譜科技、網(wǎng)易云易盾

這張圖片有打擦邊球的嫌疑,對于人工審核來(lái)說(shuō),這些擦邊球基本上不可能通過(guò)。但是,對于智能系統來(lái)說(shuō),還是有通過(guò)的可能性的。在識別這張圖上,圖譜科技和網(wǎng)易云易盾的系統表現不錯。

第三張圖片:

圖片實(shí)測:智能鑒黃,哪家強?

這是一張正常的美女圖片,在智能鑒黃平臺這會(huì )是什么結果?

圖片實(shí)測:智能鑒黃,哪家強?

結果顯示分別是:騰訊云、阿里綠網(wǎng)、圖譜科技、網(wǎng)易云易盾

這張圖片的檢測結果出乎筆者的意料,三家鑒黃平臺評判出的百分比都不低,有一家給出“疑似”,真的不知道這些AI工程師到底喂給它什么樣的圖片,這樣的圖片都“招架不住”!

第四張圖片:

圖片實(shí)測:智能鑒黃,哪家強?

每個(gè)父母都希望在某些平臺上曬一下自己的萌娃,作為一個(gè)正常人,我們也非常樂(lè )意看到這樣的圖片——天真無(wú)邪類(lèi)型。這些圖片比上面的三張圖片可視性要高,對于這類(lèi)圖片,智能鑒黃平臺會(huì )如何批判?

圖片實(shí)測:智能鑒黃,哪家強?

結果顯示分別是:騰訊云、阿里綠網(wǎng)、圖譜科技、網(wǎng)易云易盾

從測試結果上來(lái)看,有2家智能鑒黃平臺都給出的評判百分比并不低,不得不承認,這個(gè)時(shí)代曬個(gè)萌娃都有可能要被某些服務(wù)干掉。為了避免個(gè)別圖片存在的樣本差異,筆者再測一組。

第五張圖片:

圖片實(shí)測:智能鑒黃,哪家強?

這張圖片雖然是嬰兒全裸,但是,在我們大多數人的眼里,小家伙挺可愛(ài),準裸。

測試結果:

圖片實(shí)測:智能鑒黃,哪家強?

結果顯示分別是:騰訊云、阿里綠網(wǎng)、圖譜科技、網(wǎng)易云易盾

這張圖片測試結果大體上幾個(gè)平臺的系統測試結果勉強能夠接受,沒(méi)有出現很離譜的測試結果。

總體測試結果分析:

第一張圖片:內容審核員評判:色情圖片;平臺表現:阿里綠網(wǎng)>網(wǎng)易云易盾>騰訊云>圖譜科技。

第二張圖片:內容審核員評判:色情圖片;平臺表現:網(wǎng)易云易盾>圖譜科技>阿里綠網(wǎng)>騰訊云。

第三張圖片:內容審核員評判:美女圖片;平臺表現:圖譜科技>網(wǎng)易云易盾>阿里綠網(wǎng)>騰訊云。

第四張圖片:內容審核員評判:萌娃圖片;平臺表現:網(wǎng)易云易盾>圖譜科技>阿里綠網(wǎng)>騰訊云。

第五張圖片:內容審核員評判:萌娃圖片;平臺表現:網(wǎng)易云易盾>圖譜科技>騰訊云>阿里綠網(wǎng)。

從總體的測試結果看,阿里綠網(wǎng)的結果過(guò)于似是而非,第一張圖片鑒定的還算可以,之后的圖片卻都是疑似?疑似這個(gè)評判的面太大了!圖譜科技作為一家創(chuàng )業(yè)型企業(yè),在缺少數據的情況下,做到這個(gè)程度也是可以理解的。網(wǎng)易云易盾的測試結果還是不錯,但是也有誤判的時(shí)候。騰訊云就不多評價(jià)了,測試結果不是很好,后續還需要數據訓練。

結束語(yǔ)

雖然說(shuō)人工智能這幾年發(fā)展很快,不過(guò)站在客觀(guān)的角度去看內容安全領(lǐng)域,筆者覺(jué)得也不能完全依賴(lài)人工智能,智能鑒黃+人工應該是目前最穩妥的方案。

但也非常期盼人工智能的技術(shù)進(jìn)步能夠讓鑒黃服務(wù)變得更加聰明,這既能減輕內容審核員的工作負擔,又能快速地凈化互聯(lián)網(wǎng)環(huán)境。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到