搜索

文字直接轉視頻，科學(xué)家用機器學(xué)習算法實(shí)現這種操作

Lynn 7年前 (2018-02-27)

AAAI 2018大會(huì )上，研究團隊將對該研究進(jìn)行詳細的報告。

近日，《Science》雜志公布了一項新的機器學(xué)習算法，該算法可根據文本或者碎片式的信息來(lái)重建完整的視頻，如根據證人描述重現事故現場(chǎng)。

文字直接轉視頻，科學(xué)家用機器學(xué)習算法實(shí)現這種操作

據了解，該算法是一種小型神經(jīng)網(wǎng)絡(luò )，即一系列小型計算元素層。其主要的工作分為兩個(gè)階段：一是通過(guò)文本生成視頻的“主旨”，即一個(gè)模糊的背景圖片上加注一些重要的標注；二通過(guò)綜合“主旨”和文本內容產(chǎn)生一個(gè)短視頻。此外，在訓練過(guò)程中，第二部分的網(wǎng)絡(luò )會(huì )對新增加的視頻內容進(jìn)行反復的對比，以提升性能。

目前，研究人員采用了十種生活場(chǎng)景對其訓練，包括在草地上打高爾夫、在海上玩風(fēng)箏沖浪等，算法生成的圖像還比較粗糙，呈現VHS錄像的顆粒感畫(huà)面?，F在，可達到高準確率的視頻約為32幀，持續時(shí)間為1秒，大小為64×64像素。研究人員之一，杜克大學(xué)的計算機科學(xué)家Yitong Li解釋道，“更高的分辨率會(huì )降低其準確度。”

雖然當前算法生成的視頻尚十分粗糙，但是這項研究實(shí)現了文本直接轉視頻技術(shù)上的質(zhì)的飛躍。“這是一個(gè)非常難的問(wèn)題，而他們的方法非常有趣，只要兩個(gè)階段。所以，對于他們現在取得的成就和突破，我感到非常高興。”馬里蘭大學(xué)計算機科學(xué)家Hamed Pirsiavash評價(jià)道。

比利時(shí)魯汶大學(xué)計算機科學(xué)家Tinne Tuytelaars也對此贊不絕口：“這是我所知道的第一部如此棒的文字轉視頻作品，它不完美，但至少看起來(lái)像是真正的視頻。這真的很好。”

最后，記得關(guān)注微信公眾號：鎂客網(wǎng)（im2maker），更多干貨在等你！

鎂客網(wǎng)

科技 | 人文 | 行業(yè)

微信ID：im2maker

長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

Lynn作者

關(guān)注半導體產(chǎn)業(yè)

Lynn作者

關(guān)注半導體產(chǎn)業(yè)

928篇

文章總數

最新文章

工業(yè)AI落地，為什么選擇華為云EI工業(yè)智能體？

英漢思機器人朱瀚琦：30秒穿戴、價(jià)格低至千元，這樣的消費級輕量化外骨骼產(chǎn)品才有未來(lái)

回應與蘋(píng)果Mac的“分手”，Intel和Arm的PC生態(tài)之爭進(jìn)入白熱化

中芯國際再創(chuàng )上市記錄，22天成功提交注冊

馬斯克發(fā)推公布7座Model Y生產(chǎn)計劃，或將于年底交付

janpanese日本护士tube_色欲久久久天天天_国产精品国产三级区别第一集_一色屋任你精品亚洲香蕉