搜索

谷歌新開(kāi)放了一個(gè)數據庫，要讓機器自動(dòng)識別視頻中的動(dòng)作行為

巫盼 8年前 (2017-10-23)

谷歌希望通過(guò)開(kāi)放這個(gè)數據庫，進(jìn)一步改進(jìn)他們基于視頻識別的機器視覺(jué)能力。

谷歌在機器視覺(jué)學(xué)習方面積累大量的數據以及技術(shù)，最近，他們推出了一個(gè)新的視頻數據庫，名稱(chēng)為“原子視覺(jué)行為（AVA）“，該數據可由一個(gè)或多個(gè)標簽組成，能夠推動(dòng)計算機視覺(jué)識別影像中行為的研究。

谷歌新開(kāi)放了一個(gè)數據庫，要讓機器自動(dòng)識別視頻中的動(dòng)作行為

說(shuō)到圖像識別，其實(shí)谷歌的照片應用就可以自動(dòng)識別出寵物圖像，很多公司也在圖片識別上作出很多優(yōu)化嘗試，比如Shutterstock上周公布了一項全新的測試功能，用戶(hù)可以根據自己的布局來(lái)搜索股票照片。

相較于這些發(fā)生在靜態(tài)圖像領(lǐng)域的機器視覺(jué)識別技術(shù)，應用到視頻中的難度會(huì )更大，因為在視頻中，每一幀畫(huà)面的都包括各種復雜的場(chǎng)景，而且很多時(shí)候視頻中一個(gè)動(dòng)作是由不同的人發(fā)出的。不過(guò)視頻識別方面的應用現在也有一些案例，比如著(zhù)名色情網(wǎng)站Pornhub，它可以自動(dòng)對成人視頻進(jìn)行分類(lèi)，包括讓系統識別出特定的性姿勢。

谷歌的軟件工程師也解釋道， “讓機器去識別影像中的人類(lèi)行為是發(fā)展計算機視覺(jué)的一大難題，盡管過(guò)去幾年在圖像分類(lèi)和尋找物體方面取得了突破。”所以谷歌推出了這個(gè)AVA數據庫，AVA包括80多個(gè)被動(dòng)作標簽標注的Youtube視頻網(wǎng)址，比如握手、接吻、喝酒、擁抱等等。

谷歌希望通過(guò)開(kāi)放這個(gè)數據庫，進(jìn)一步改進(jìn)他們基于視頻識別的機器視覺(jué)能力。

最后，記得關(guān)注微信公眾號：鎂客網(wǎng)（im2maker），更多干貨在等你！

鎂客網(wǎng)

科技 | 人文 | 行業(yè)

微信ID：im2maker

長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

巫盼作者

心系人類(lèi)的未來(lái)。

巫盼作者

心系人類(lèi)的未來(lái)。

3540篇

文章總數

最新文章

Wandering Reels Casino slot games ? Play On line, 100 free

Totally buffalo slots online free Slots

Better No deposit Extra casino platinum play mobile Requirements The brand new Zealand

Pay By Cellular 120 free spins for real money no deposit Gambling establishment British

Greatest Real money Online slots games From 2023

janpanese日本护士tube_色欲久久久天天天_国产精品国产三级区别第一集_一色屋任你精品亚洲香蕉