第二屆騰訊“開(kāi)悟”AI大賽啟動(dòng),騰訊聯(lián)動(dòng)高校破局AI研究瓶頸

IM2Maker 4年前 (2021-08-19)

第二屆騰訊“開(kāi)悟”AI大賽啟動(dòng),騰訊聯(lián)動(dòng)高校破局AI研究瓶頸。

騰訊正在利用游戲的復雜環(huán)境,為攻克通用人工智能研究創(chuàng )造各種可能性。

8月18日,第二屆騰訊開(kāi)悟MOBA多智能體強化學(xué)習大賽”(下稱(chēng)“大賽”)宣布啟動(dòng)。該大賽由騰訊AI Lab、王者榮耀、騰訊高校合作、騰訊游戲學(xué)院等共同發(fā)起,由騰訊云計算提供底層資源支持。

“開(kāi)悟”AI開(kāi)放研究平臺依托于騰訊太極機器學(xué)習平臺,基于平臺擁有的算法、算力、脫敏數據等資源優(yōu)勢,為學(xué)術(shù)研究人員和算法開(kāi)發(fā)者開(kāi)放國際一流的研究與應用探索平臺。

第二屆騰訊“開(kāi)悟”AI大賽啟動(dòng),騰訊聯(lián)動(dòng)高校破局AI研究瓶頸

對于高校而言,AI研究的挑戰十分嚴峻:目前高校研究普遍面臨著(zhù)數據量較少、數據的多樣性不足、數據質(zhì)量參差不齊等問(wèn)題;同時(shí),隨著(zhù)高校強化學(xué)習算法研究的不斷深入,項目對計算資源的需求也水漲船高。而除了機器資源本身,也缺乏容易上手的AI開(kāi)放實(shí)驗平臺。

騰訊將自身的AI能力開(kāi)放成國內科研的助推器。本屆賽事沿用過(guò)往面向高校的邀請賽制,進(jìn)一步擴大了開(kāi)放規模,邀請20余所國內外知名高校參賽。參賽隊伍需要在指定的時(shí)間內,在給定的資源下訓練出最優(yōu)模型,并最終部署好使用最優(yōu)模型的AI服務(wù)器,提交系統完成1V1、3V3對局挑戰。

相比起第一屆賽事,本屆賽事重點(diǎn)實(shí)現了輕量化和易用化:在保證賽題研究?jì)r(jià)值的同時(shí),降低了參賽者理解游戲規則及研發(fā)操作的成本,使參賽者能更聚焦于A(yíng)I開(kāi)發(fā)本身。

與此同時(shí),開(kāi)悟攜手高校合作開(kāi)發(fā)課程,進(jìn)一步普及多智能體強化學(xué)習教育。2021年8月,騰訊宣布與四所國內一流高校共建教學(xué)內容和課程體系改革項目。北京大學(xué)李文新、電子科技大學(xué)謝寧、清華大學(xué)李秀、中國科學(xué)技術(shù)大學(xué)周文罡等四位教授將基于騰訊開(kāi)悟平臺,分別構建一門(mén)至少20學(xué)時(shí)的多智能體及強化學(xué)習平臺的專(zhuān)業(yè)課程,理論授課知識點(diǎn)包括但不限于機器學(xué)習、強化學(xué)習、多智能體決策等相關(guān)的知識點(diǎn)。

在算法框架和組件層面,騰訊太極機器學(xué)習平臺為開(kāi)悟平臺提供機器學(xué)習/深度學(xué)習等核心加速組件,結合騰訊內部業(yè)務(wù)的沉淀,經(jīng)過(guò)了萬(wàn)億級的數據訓練和流量訪(fǎng)問(wèn),為參賽者提供更有力的支持。

騰訊云計算作為本次大賽獨家算力支持平臺,將為參賽隊伍提供高性能的云服務(wù)器資源供數據建模與學(xué)習推理?;隍v訊云 GPU 云服務(wù)器超強的并行計算能力,可完成傳統計算資源無(wú)法處理的大規模部署AI 推理任務(wù),極大地提升運算效率,高度匹配了深度學(xué)習訓練,推理和科學(xué)計算場(chǎng)景下日益增長(cháng)的高精度高效率算力需求。

騰訊AI Lab總經(jīng)理楊巍指出,“開(kāi)悟平臺承載了技術(shù)、資源、人才等生態(tài)原料,始于又不止于競賽。開(kāi)悟將逐步發(fā)展為競賽-課程-科教聯(lián)盟-科創(chuàng )聯(lián)合體的生態(tài)聚集地,未來(lái)會(huì )進(jìn)一步延展平臺承載力,推進(jìn)AI與教育融合,提高學(xué)生的創(chuàng )造力與研究才能,為生態(tài)貢獻跨學(xué)科技術(shù)、跨界人才和多方資源。”

同時(shí),王者榮耀執行制作人、騰訊天美L1總經(jīng)理黃藍梟也表示:“我們開(kāi)放了《王者榮耀》的核心機制,提供標準接口、核心算法、脫敏的測試數據、評估工具和計算集群等,給高校老師和同學(xué)們進(jìn)行多智能體的機器學(xué)習算法研究、學(xué)習成果交流、對算法成果反復迭代升級。同時(shí),也期待這些研究成果,能夠落地到其他產(chǎn)業(yè)環(huán)境中,為工業(yè)機器人、救災機器人等提供助力。”

聚焦多智能體博弈騰訊“開(kāi)悟”聯(lián)動(dòng)高校破局AI研究瓶頸

下一個(gè)AI里程碑可能會(huì )在復雜策略游戲中誕生:現實(shí)世界中人類(lèi)決策時(shí)面對的環(huán)境更復雜、有更多不確定性和局限性。利用游戲的復雜環(huán)境,攻克多智能體強化學(xué)習方法,有望利用AI解決真實(shí)世界的復雜問(wèn)題,例如城市/空中交通管理、多機器人協(xié)調、能源分配等等。長(cháng)遠來(lái)看,“AI+游戲”研究將是騰訊攻克AI終極研究難題——通用人工智能(AGI)的關(guān)鍵一步。

AI學(xué)界持續面臨面四大挑戰:算法、數據、算力、場(chǎng)景。以強化學(xué)習為例,每個(gè)要素都有很多挑戰,比如研究場(chǎng)景稀缺,沒(méi)有數據,算法測試困難到算力昂貴等。

王者榮耀為高校AI研究提供了一種現實(shí)可用的場(chǎng)景。這款移動(dòng)端的5V5 MOBA類(lèi)游戲,具有高復雜度、高挑戰性、強協(xié)作性的特點(diǎn)。據統計,在王者對局中,玩家的動(dòng)作狀態(tài)空間高達10的20000次方,遠遠大于圍棋及其他簡(jiǎn)單游戲,甚至超過(guò)整個(gè)宇宙的原子總數(10的80次方)。

在2020年首屆“開(kāi)悟”高校大賽上,作為參賽隊伍指導老師,電子科技大學(xué)謝寧教授表示:“開(kāi)悟平臺提供游戲AI框架、強化學(xué)習算法框架及基礎算力等資源/服務(wù),解決了我們AI教育中面臨的AI應用與實(shí)訓平臺的缺口。在去年的賽事中,游戲環(huán)境有效提升了學(xué)生團隊對AI的興趣,幫助他們積累了深度強化學(xué)習模型設計與實(shí)現的經(jīng)驗。”

首屆賽事參賽學(xué)生代表,中國科學(xué)技術(shù)大學(xué)學(xué)生趙鑒在分享賽后感想時(shí)表示:“很高興有機會(huì )接觸如此大型游戲的AI設計,開(kāi)悟平臺讓團隊能將本身游戲愛(ài)好與專(zhuān)業(yè)相結合,提高了我們對人工智能領(lǐng)域的研究興趣。”

基于首屆比賽的成功經(jīng)驗,第二屆開(kāi)悟大賽進(jìn)行了易用性與輕量化升級,降低高校學(xué)生的研究門(mén)檻。

作為國內領(lǐng)先的公有云平臺,騰訊云在通用 CPU 和異構 GPU 豐富的實(shí)例配置與規格可以滿(mǎn)足不同業(yè)務(wù)算力需求。尤其是在 AI 訓練與推理場(chǎng)景下,引入騰訊云 GPU 異構計算對于效率的提升非??捎^(guān)。

在易用性上,開(kāi)悟對平臺操作進(jìn)行了多項優(yōu)化,幫助使用者更快上手,更高效地開(kāi)發(fā)。具體包括:進(jìn)一步完善說(shuō)明文檔,幫助參賽者快速接入平臺;開(kāi)放標準化環(huán)境接口代碼,允許參賽者在本地環(huán)境確認AI效果并進(jìn)行調試;提升訓練效率,大幅縮短模型訓練時(shí)間等。

在輕量化上,降低參賽者學(xué)習游戲規則及進(jìn)行基礎工作的成本,更聚焦于算法開(kāi)發(fā)工作。具體包括:統一開(kāi)發(fā)完備的環(huán)境信息,參賽者不需陷于特征工程;開(kāi)放基準算法,讓參賽者快速迭代等。

開(kāi)悟對AI產(chǎn)學(xué)研用全鏈條的推動(dòng)作用,也正受到社會(huì )各界關(guān)注。2021年4月8日,騰訊“開(kāi)悟”聯(lián)合高校成立了人工智能科教聯(lián)盟,并攜手高校、科研院所、產(chǎn)業(yè)園區、投資機構組建人工智能科創(chuàng )聯(lián)合體,共同在關(guān)鍵核心技術(shù)聯(lián)合攻關(guān)、人才培養聚集和促進(jìn)產(chǎn)業(yè)鏈上下游交流合作等方面共同努力。

助力產(chǎn)學(xué)研,共享AI+游戲新生態(tài)

若AI能在如此復雜的環(huán)境中,學(xué)會(huì )人一樣實(shí)時(shí)感知、分析、理解、推理、決策到行動(dòng),就可能在多變、復雜的真實(shí)環(huán)境中發(fā)揮更大作用。

自2018年起,騰訊 AI Lab 持續投入多類(lèi)“AI+游戲”研究,并與王者榮耀團隊合作打造策略協(xié)作型AI“王者絕悟”。三年來(lái),王者絕悟AI在對局中飛速成長(cháng),得到了學(xué)術(shù)界認可,相關(guān)論文已先后被 AAAI、NeurIPS 等 AI 頂級會(huì )議收錄。2021年,全英雄達到職業(yè)電競水平的“王者絕悟”亮相2021世界人工智能大會(huì ),受到社會(huì )廣泛關(guān)注。

騰訊 AI Lab 已在“AI+游戲”領(lǐng)域取得多項成果,策略協(xié)作型AI“絕悟”,取得4項世界大賽冠軍,現擔任中國國家圍棋隊訓練專(zhuān)用AI的圍棋 AI “絕藝”。同時(shí)探索AI在游戲產(chǎn)業(yè)全鏈路應用,用AI提高游戲開(kāi)發(fā)效率、打造新玩法、輔助游戲平衡性測試等。

借助開(kāi)悟平臺,騰訊AI Lab和王者榮耀希望聯(lián)動(dòng)更多有興趣的高校和學(xué)者參與,共同在游戲環(huán)境中探討和研究這些難題,并尋找AI新技術(shù)覆蓋更多場(chǎng)景的可能性,如醫療、工業(yè)、農業(yè)、交通等現實(shí)場(chǎng)景,及虛實(shí)結合的元宇宙世界(Metaverse)等。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到