谷歌新開(kāi)放了一個(gè)數據庫,要讓機器自動(dòng)識別視頻中的動(dòng)作行為
谷歌希望通過(guò)開(kāi)放這個(gè)數據庫,進(jìn)一步改進(jìn)他們基于視頻識別的機器視覺(jué)能力。
谷歌在機器視覺(jué)學(xué)習方面積累大量的數據以及技術(shù),最近,他們推出了一個(gè)新的視頻數據庫,名稱(chēng)為“原子視覺(jué)行為(AVA)“,該數據可由一個(gè)或多個(gè)標簽組成,能夠推動(dòng)計算機視覺(jué)識別影像中行為的研究。
說(shuō)到圖像識別,其實(shí)谷歌的照片應用就可以自動(dòng)識別出寵物圖像,很多公司也在圖片識別上作出很多優(yōu)化嘗試,比如Shutterstock上周公布了一項全新的測試功能,用戶(hù)可以根據自己的布局來(lái)搜索股票照片。
相較于這些發(fā)生在靜態(tài)圖像領(lǐng)域的機器視覺(jué)識別技術(shù),應用到視頻中的難度會(huì )更大,因為在視頻中,每一幀畫(huà)面的都包括各種復雜的場(chǎng)景,而且很多時(shí)候視頻中一個(gè)動(dòng)作是由不同的人發(fā)出的。不過(guò)視頻識別方面的應用現在也有一些案例,比如著(zhù)名色情網(wǎng)站Pornhub,它可以自動(dòng)對成人視頻進(jìn)行分類(lèi),包括讓系統識別出特定的性姿勢。
谷歌的軟件工程師也解釋道, “讓機器去識別影像中的人類(lèi)行為是發(fā)展計算機視覺(jué)的一大難題,盡管過(guò)去幾年在圖像分類(lèi)和尋找物體方面取得了突破。”所以谷歌推出了這個(gè)AVA數據庫,AVA包括80多個(gè)被動(dòng)作標簽標注的Youtube視頻網(wǎng)址,比如握手、接吻、喝酒、擁抱等等。
谷歌希望通過(guò)開(kāi)放這個(gè)數據庫,進(jìn)一步改進(jìn)他們基于視頻識別的機器視覺(jué)能力。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
