AI開(kāi)卷「視頻生成」!人人當導演的時(shí)代要來(lái)了?

jh 2年前 (2023-11-29)

AI一天,人間一年。

前不久,AI初創(chuàng )公司Runway在網(wǎng)上放出一段Demo視頻。

用戶(hù)只需對著(zhù)圖片隨便一抹,就能讓選中的目標直接動(dòng)起來(lái),逼真程度幾乎等于實(shí)拍。

這是Runway給AI視頻軟件Gen-2打造的新功能,而這個(gè)Gen-2堪稱(chēng)是生成式AI進(jìn)程中的里程碑產(chǎn)品,生成視頻的效果已經(jīng)讓人看不到AI的效果。

就當人們以為Runway會(huì )像OpenAI一樣霸榜AI視頻生成賽道的時(shí)候,一家名為Pika  Labs(以下簡(jiǎn)稱(chēng)Pika)的公司突然在今天公布了一款新產(chǎn)品,引來(lái)了一眾大佬的圍觀(guān)評價(jià)。

這究竟是怎么一回事呢?     

一出道即頂流,Pika 1.0是什么?

比起成立近5年的Runway,Pika非常年輕,今年4月才剛剛成立。

但在短短7個(gè)月時(shí)間里,Pika已經(jīng)連續完成三輪融資5500萬(wàn)美元,其中就包括今天剛官宣的,由Lightspeed Venture Partners領(lǐng)投的A輪融資,總共籌集到3500萬(wàn)美元。

這家名為L(cháng)ightspeed Venture Partners的投資公司同樣來(lái)頭不小,旗下明星項目包括Epic Games、Stability AI和Snap等大型企業(yè),這足以看出Pika的含金量。

就在宣布融資的同一天,Pika發(fā)布了名為Pika 1.0的AI模型,該模型能夠使用文本生成和編輯多種風(fēng)格的視頻,如3D動(dòng)畫(huà)、動(dòng)漫、卡通和電影等風(fēng)格。

此外,通過(guò)文本進(jìn)行修改,Pika 1.0還對還能對視頻內容進(jìn)行精準的控制和編輯,例如調整視頻的寬高比、更改視頻中人物的衣服等等。

在演示視頻里,我們可以看到Pika 1.0可以根據文字圖片,流暢地生成一段視頻,并且能隨意切換指定視頻中的任意元素。

從功能上看,Pika 1.0跟Gen-2效果幾乎沒(méi)什么區別,都是根據文字生成視頻,但畫(huà)質(zhì)顯然比不上可以生成4K視頻的Gen-2。

人人都能當導演

那為什么Pika 1.0還能受到如此多的關(guān)注呢?

我們都知道搞AI非常燒錢(qián),但Pika在Discord社區進(jìn)行測試時(shí),就主打“免費可用”,再靠著(zhù)出色的技術(shù)力,半年時(shí)間就吸引了近50萬(wàn)人用戶(hù)。

這里就不得不提Pika背后的創(chuàng )業(yè)團隊了。

目前,整個(gè)公司只有4個(gè)人,其中包括兩名華裔女性創(chuàng )始人——Demi Guo(CEO)與 Chenlin Meng(CTO)。

兩人均是斯坦福大學(xué)計算機科學(xué)博士生,研究的領(lǐng)域涵蓋了多個(gè)方面,包括圖像合成與編輯、擴散模型的簡(jiǎn)化、自回歸模型的改進(jìn)等。

在一次AI電影節的失敗后,兩人開(kāi)始退學(xué)創(chuàng )業(yè),希望打造一個(gè)更容易使用的人工智能視頻生成器。

其他兩個(gè)團隊成員也與電影相關(guān)。

雖然Pika成員少,但搞 AI 模型一點(diǎn)不含糊,目前正在使用幾百個(gè)GPU進(jìn)行訓練,以提供更好的性能和更精細的編輯功能。

除了免費好用以外,Pika 1.0的產(chǎn)品理念也更貼近普通人。

簡(jiǎn)單來(lái)說(shuō),就是靠幾個(gè)句子,就能讓普通人生成出效果堪比迪士尼動(dòng)畫(huà)的視頻,學(xué)習成本遠遠低于需要長(cháng)關(guān)鍵詞的Gen-2。

從Runway的定位來(lái)看,Gen-2還是屬于Photoshop這樣的專(zhuān)業(yè)軟件,即便是技術(shù)高超的博士,在缺少學(xué)習之前還是很難掌握。

而Pika 1.0要做的,就是讓有創(chuàng )意的外行人,也能輕松做出自己產(chǎn)品。

難怪有人在體驗后表示,這是「徹底改變了游戲規則」。

最后一點(diǎn),作為一家年輕的公司,Pika的潛力并不遜色“老大哥”Runway。

在受到Lightspeed Venture Partners投資前,Pika就已經(jīng)得到多位行業(yè)大佬的投資和技術(shù)指導,其中包括特斯拉前AI高級總監、OpenAI大神Andrej Karpathy。

據了解,隨著(zhù)新一輪融資的完成,Pika的團隊擴大到大約20人,主要是工程師和研究人員,Pika 1.0也將加入更多功能。

AI視頻,卷起來(lái)了

這不是Gen-2遇到的唯一勁敵。

短短一個(gè)月時(shí)間里,AI視頻迎來(lái)了一段“爆發(fā)期”。

簡(jiǎn)單統計下這一個(gè)月的明星產(chǎn)品:

首先是Runway發(fā)布的動(dòng)態(tài)筆刷Motion Brush,在任意圖片上一抹就能變成動(dòng)態(tài)視頻。

緊接著(zhù)Meta發(fā)布了視頻編輯工具Emu Video,可以根據純文本、純圖像或組合的文本和圖像輸入來(lái)生成視頻。

而AI繪畫(huà)領(lǐng)域巨頭Stable AI也來(lái)湊視頻的熱鬧,推出Stable Video Diffusion以及SDXL Turbo。雖然不如其他幾家效果好,但憑借出色的作畫(huà)能力,同樣有很大的潛力。

最后就是今天的主角——刷屏的Pika 1.0,堪稱(chēng)媲美Runway的技術(shù)力。

比起AI繪畫(huà)領(lǐng)域,AI視頻的內卷更為夸張,不僅要強調畫(huà)面的精美,還要考慮每個(gè)動(dòng)作的銜接。

因此從目前幾家公司的布局來(lái)看,AI視頻的投資更大,產(chǎn)品也各具特色。

如果我們結合投資機構的背景來(lái)看,AI視頻的應用場(chǎng)景更廣,包括游戲、動(dòng)畫(huà)等領(lǐng)域,都能借助模塊化的AI工具降低開(kāi)發(fā)難度,豐富產(chǎn)品的內容,實(shí)現開(kāi)發(fā)者與玩家之間的“雙贏(yíng)”。

當然,AI視頻的最大作用,或許正如Pika在官方博客寫(xiě)的那樣——“讓每個(gè)人都能成為自己故事的導演,并激發(fā)出我們每個(gè)人的創(chuàng )造力。”

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到