最懂中國傳統文化的AI繪畫(huà)生成模型——文瀾與繪畫(huà)模型的創(chuàng )新結合
盧志武教授團隊打造了一款最懂中國傳統文化的AI繪畫(huà)生成模型。
最近AI繪畫(huà)生成模型在國內外掀起了一波AI繪畫(huà)熱潮,在各種社交媒體上都能看見(jiàn)用戶(hù)分享的用AI工具生成的各種圖片,甚至AI生成的作品獲得了國際上的重要獎項。受此啟發(fā),中國人民大學(xué)盧志武教授團隊將文瀾模型與最新的圖像生成技術(shù)進(jìn)行創(chuàng )新結合,打造了一款最懂中國傳統文化的AI繪畫(huà)生成模型。
文瀾模型是中國人民大學(xué)高瓴人工智能學(xué)院執行院長(cháng)文繼榮教授牽頭研發(fā)的大規模中文多模態(tài)預訓練模型。文瀾模型經(jīng)過(guò)6.5億弱相關(guān)中文圖文對的預訓練,學(xué)習到獨特的中文語(yǔ)言理解能力并能很好地將中文語(yǔ)義與視覺(jué)信息聯(lián)系起來(lái),尤其擅長(cháng)理解中文獨有的含蓄語(yǔ)義與圖片中的抽象概念。相關(guān)研究成果“Towards artificial general intelligence via a multimodal foundation model”已經(jīng)發(fā)表在Nature Communications上,并初步形成了一定的影響力。
論文鏈接:https://www.nature.com/articles/s41467-022-30761-2
盧志武教授團隊進(jìn)一步挖掘文瀾模型的潛力,將其與最新的生成技術(shù)進(jìn)行創(chuàng )新性的結合,融合文瀾的抽象語(yǔ)義理解能力與生成模型的強大生成能力,確保得到的模型能夠出色地理解輸入文本的語(yǔ)義并生成具有對應語(yǔ)義的圖片。該研究團隊專(zhuān)注于挖掘文瀾對于中國傳統文化的理解,借用最新的生成模型架構,并在所搜集的國畫(huà)數據集上進(jìn)行訓練,得到的模型能根據中國傳統文學(xué)生成對應風(fēng)格的圖片。具體而言,該研究團隊在國畫(huà)數據集上訓練了一個(gè)無(wú)條件生成模型,并在生成過(guò)程中沿著(zhù)與輸入文本接近的方向不斷調整生成圖片的內容,使得最終的圖片內容與輸入文本在文瀾模型的隱空間中趨于一致,從而實(shí)現根據文本語(yǔ)義生成圖片的功能。該模型能夠根據輸入的中國古詩(shī)詞生成對應的圖片,從給出的下述例子中可以看出,生成的圖片與古詩(shī)詞的內容和意境都非常契合。
通過(guò)大量的測試驗證,盧志武教授團隊發(fā)現文瀾繪畫(huà)模型甚至對晦澀難懂的儒釋道思想也有獨到的理解,生成的繪畫(huà)作品開(kāi)始獲得相關(guān)領(lǐng)域專(zhuān)家的高度認可。為了更好地展現文瀾繪畫(huà)模型在解讀儒釋道思想上的特色,研究團隊挑選了國內外最熱門(mén)的AI繪畫(huà)模型進(jìn)行對比分析,包含盜夢(mèng)師、文心、Disco Diffusion、Midjourney和Stable Diffusion。對Disco Diffusion、Midjourney和Stable Diffusion而言,中文文本需要先經(jīng)過(guò)百度翻譯。詳細的分析結果如下。
儒家思想:
儒家思想方面,挑選了王陽(yáng)明心學(xué)的三句代表性話(huà)。通過(guò)生成的結果來(lái)看,盜夢(mèng)師、Disco Diffusion、Midjourney和Stable Diffusion偏向于生成句子中的一些具象物體,或者生成一些畫(huà)面較好但內容與句子并無(wú)太大關(guān)系的圖片。文心則是傾向于生成帶有人物的圖片,甚至將光明直接理解成點(diǎn)燃的蠟燭。這些方法均無(wú)法較好地理解輸入文本中的儒家思想。與之相反,文瀾繪畫(huà)模型能夠更好地理解整句話(huà)的意思以及其中蘊含的儒家思想,從而生成符合該思想的圖片。
釋家思想:
對于含有釋家思想的文本輸入,目前最火的繪畫(huà)生成模型均只能抓住其中的一些具象物體并進(jìn)行針對性的生成,有的繪畫(huà)模型甚至會(huì )錯誤地理解其中的思想。比如,文心就將“見(jiàn)道忘山者人間亦寂也,見(jiàn)山忘道者山中也喧也”理解成了道家的思想(生成了一個(gè)道士的形象)。反觀(guān)文瀾繪畫(huà)模型則是很好地理解了輸入文本的釋家思想并將之反映在生成的圖片中。
道家思想:
道家思想方面,主要挑選了道德經(jīng)中三句最核心的話(huà)。文心相對于盜夢(mèng)師、Disco Diffusion、Midjourney和Stable Diffusion,對道德經(jīng)有較好的理解。但是,整體來(lái)說(shuō),文瀾繪畫(huà)模型對道家思想理解得更為透徹,生成的圖片比文心更加具有道家的意境。
習近平總書(shū)記在二十大中提出“全面建設社會(huì )主義現代化國家,必須堅持中國特色社會(huì )主義文化發(fā)展道路,增強文化自信,圍繞舉旗幟、聚民心、育新人、興文化、展形象建設社會(huì )主義文化強國,發(fā)展面向現代化、面向世界、面向未來(lái)的,民族的科學(xué)的大眾的社會(huì )主義文化,激發(fā)全民族文化創(chuàng )新創(chuàng )造活力,增強實(shí)現中華民族偉大復興的精神力量”。盧志武教授團隊正是響應了這一號召,將最近大火的AI繪畫(huà)生成技術(shù)與中文多模態(tài)預訓練模型文瀾結合起來(lái),深度挖掘文瀾模型的中國傳統文化理解能力,并通過(guò)生成模型以圖片的形式展現出來(lái),讓普通老百姓對一些深奧的中國傳統文化思想有了更直觀(guān)的了解,從而為創(chuàng )新性地傳播中國傳統文化貢獻力量。該研究團隊將會(huì )繼續深挖文瀾模型對中華傳統文化的理解,并進(jìn)一步運用最新技術(shù)展現中國傳統文化在A(yíng)I時(shí)代的最新理解!
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
