構建未來(lái),共話(huà)AI基礎設施|2024WAIC“探索下一代大模型的基礎研究”論壇成功舉辦

zhouping 11個(gè)月前 (07-08)

上海,7月4日 —— 在2024世界人工智能大會(huì )論壇上,國內外院士、專(zhuān)家學(xué)者齊聚“超越邊界:探索下一代大模型的基礎研究”論壇

上海,7月4日 —— 在2024世界人工智能大會(huì )論壇上,國內外院士、專(zhuān)家學(xué)者齊聚“超越邊界:探索下一代大模型的基礎研究”論壇,共同探討“AI for Science 基礎設施建設”和“下一代通用人工智能方法”兩大前沿技術(shù)話(huà)題。本次論壇由世界人工智能大會(huì )組委會(huì )辦公室主辦,上海算法創(chuàng )新研究院和北京科學(xué)智能研究院承辦,上海市人工智能行業(yè)協(xié)會(huì )提供支持。論壇旨在搭建推動(dòng)下一代人工智能技術(shù)交流協(xié)作的平臺,推動(dòng)基礎設施建設,激發(fā)創(chuàng )新效能。

共建AI for Science基礎設施,邁向平臺科研時(shí)代

“AI for Science在材料、生命科學(xué)、能源化工等領(lǐng)域落地成果的不斷涌現,讓我們看到其帶來(lái)的巨大前景。但AI for Science帶來(lái)的不僅僅是點(diǎn)狀的突破,而是系統性地帶動(dòng)科學(xué)研究基礎設施的建設,推進(jìn)邁向“平臺科研”時(shí)代。”論壇伊始,中國科學(xué)院院士鄂維南為大會(huì )帶來(lái)了引導發(fā)言。他深入分析了AI for Science目前所處的發(fā)展階段,以及推動(dòng)AI for Science的基礎設施建設的重要性,并設計了“四梁N柱”架構,鄂院士提到,“回顧科學(xué)研究的基本資源和基本方法,無(wú)論哪個(gè)科研方向,都少不了基本原理、實(shí)驗、文獻、算力的支撐。因此,構建科學(xué)研究的通用基礎平臺,即基本原理和數據驅動(dòng)的模型算法與軟件、替代文獻的數據庫與知識庫、高效率、高精度的實(shí)驗表征方法、高度整合的算力平臺,可以推動(dòng)共性問(wèn)題的解決。

AI的方法大大提升了我們的科研能力,但是離真正解決問(wèn)題還有距離,這剩下的“最后一公里”該如何打通?在會(huì )上這場(chǎng)重磅嘉賓陣容的圓桌對話(huà)里,中國科學(xué)院院士鄂維南、龔新高、丁洪,美國國家工程院院士、香港大學(xué)工程學(xué)院院長(cháng)David J. Srolovitz,上??萍即髮W(xué)副教務(wù)長(cháng)劉志,上海大學(xué)教授劉軼,北京應用物理與計算數學(xué)研究所研究員王涵在圓桌對話(huà)中對此進(jìn)行了探討,從構建科學(xué)大模型、科學(xué)大裝置等基礎設施方面表達了看法,并共識了一個(gè)富有啟發(fā)性的觀(guān)點(diǎn):“AI for Science的基礎設施建設需要跨學(xué)科的合作,這是實(shí)現科學(xué)突破的關(guān)鍵。我們應聚焦產(chǎn)業(yè)關(guān)鍵問(wèn)題,賦能工業(yè)應用的實(shí)際場(chǎng)景。”那么,我們采取什么樣的道路才能實(shí)現真正的科學(xué)大模型呢?專(zhuān)家們指出,“在聚焦算力和算法的同時(shí),要重點(diǎn)關(guān)注數據,而這些數據不單單是計算數據,還有來(lái)自于實(shí)驗所產(chǎn)生的數據,從這些數據中誕生新的模型。而驗證這些數據的準確性,同樣需要AI的賦能。”

在共性平臺的基礎上,圍繞具體應用(如生物醫藥、新材料、電池等),可高效率地推動(dòng)對具體問(wèn)題的研究。材料是AI for Science的重要應用場(chǎng)景之一。“AI for Materials”(AI4M)已成為材料科學(xué)研究與開(kāi)發(fā)的重要組成部分,加深了我們對成分-結構-性能關(guān)系的理解,并促進(jìn)了具有目標性能的材料設計。“AI技術(shù)能夠在全周期加速材料研發(fā),提高材料研發(fā)的成功率”。會(huì )上,美國國家工程院院士、香港大學(xué)工程學(xué)院院長(cháng)David J. Srolovitz從AI與材料科學(xué)的結合與應用展開(kāi)了報告, “諸如深度勢能等AI for Science代表方法在材料研究方面的廣泛應用,已經(jīng)推動(dòng)實(shí)現了第一性原理精度的大規模模擬。”報告內容再次展示了人工智能應用在科學(xué)研究中的強大能力,以及AI賦能的原子間作用勢能研究,“整合了提示詞工程的大語(yǔ)言模型在材料發(fā)現和設計領(lǐng)域已經(jīng)展現了卓越的性能,它能夠解析并理解材料成分、結構、以及性質(zhì)之間的復雜關(guān)系。”

學(xué)科的交叉可以碰撞出新的火花,對 AI for Science基礎設施建設的創(chuàng )新思路也有新的啟迪。“AI智能體引入,將為科研人員賦能,激發(fā)創(chuàng )新靈感,大幅縮短研究周期,填補研發(fā)人員的短板,讓科學(xué)家有工程思維,工程師有產(chǎn)品思維。從而減少每個(gè)研發(fā)步驟之間的隔閡。同樣,材料科學(xué)也為AI帶來(lái)了新的挑戰,AI硬件問(wèn)題的解決也需要材料科學(xué)推動(dòng)。”中國科學(xué)院院士、北京大學(xué)副校長(cháng)、北京大學(xué)博雅講席教授張錦院士提到。

我們欣喜地看到,業(yè)內已經(jīng)有產(chǎn)品化與平臺化的成果產(chǎn)出,OpenLAM就是“平臺科研”與“開(kāi)源共建”的一個(gè)典型代表。“語(yǔ)言數據的爆炸性增長(cháng)孕育了大語(yǔ)言模型,同樣地,微觀(guān)尺度數據的累積也催生了一種創(chuàng )新的模型——大原子模型。”北京科學(xué)智能研究院院長(cháng)、深勢科技創(chuàng )始人張林峰表示“這一模型的誕生,將帶來(lái)仿真設計在時(shí)空尺度與覆蓋范圍的量級式提升,實(shí)驗表征信號將能被更好地解析,它將成為原子級生產(chǎn)制造的重要組成部分。”OpenLAM計劃已于2023年底正式發(fā)起,北京科學(xué)智能研究院協(xié)同DeepModeling開(kāi)源社區以及30多家共建單位,并邀請了原子級建模、表征、制造以及AI產(chǎn)業(yè)的多位院士、專(zhuān)家組成顧問(wèn)團,共同推動(dòng)構建大原子模型的“社區模式”。秉承“廣泛覆蓋、謹慎評估、開(kāi)源開(kāi)放、開(kāi)箱即用”的開(kāi)發(fā)理念,本論壇上最新發(fā)布了在合金、動(dòng)態(tài)催化、分子反應、藥物小分子、固態(tài)電池、半導體、高溫超導7個(gè)領(lǐng)域模型解決方案,這些模型均以開(kāi)放社區的形式發(fā)展而來(lái),并在科學(xué)智能廣場(chǎng)可下載。“實(shí)驗科學(xué)家的語(yǔ)言和視角還未與AI技術(shù)和數據庫形成有效的連接,為此我們開(kāi)發(fā)了‘晶體造句’APP,希望更多實(shí)驗科學(xué)家通過(guò)這個(gè)APP的窗口,來(lái)發(fā)現并合成更多人們尚未充分探索的材料。”

AI for Science的各項基礎設施正在全面落地建設,不僅僅是OpenLAM,本次論壇還同期發(fā)布了AI for Science的另一重要基礎設施,替代文獻的數據庫和知識庫的優(yōu)秀實(shí)踐產(chǎn)品——Science Navigator 1.0。當前,對學(xué)科交叉檢索、原文內容溯源、科研數據解讀的需求已經(jīng)遠遠超出了傳統文獻檢索工具的能力范圍,新一代科研文獻開(kāi)放平臺Science Navigator應運而生。“Science Navigator 強大的自然語(yǔ)言對話(huà)式檢索能力,能夠迅速定位到科研工作者所需的信息,且回答可溯源到文獻原文。”北京科學(xué)智能研究院副院長(cháng)李鑫宇介紹道,“AI向量數據庫疊加大語(yǔ)言模型讓訓練和推理成本大幅降低,等效實(shí)現3-6倍參數量模型效果。Science Navigator 1.0不僅僅是一個(gè)為科研工作者量身打造的AI平臺,它更是一個(gè)全新的科研生態(tài)系統。Science Navigator開(kāi)放了絕大部分能力的API接口,使用者可以在這個(gè)平臺的基礎上構建自己的應用和智能體,以滿(mǎn)足科研復雜的個(gè)性需求,釋放更多的時(shí)間精力在解決關(guān)鍵問(wèn)題與創(chuàng )新思考上。”

專(zhuān)家云集,共話(huà)下一代人工智能方法路在何方

從基礎理論到通用算法,AI技術(shù)的快速發(fā)展不僅改寫(xiě)了范式,也正在將萬(wàn)物智聯(lián)的未來(lái)視野變?yōu)楝F實(shí)。

“雖然目前人工智能算法、大模型已經(jīng)取得了突出的進(jìn)步,但是我們還需要繼續探索新的技術(shù)路線(xiàn),以適合我國的實(shí)際發(fā)展需要。”面向下一代通用人工智能方法這一話(huà)題,引發(fā)了參會(huì )嘉賓們的思考。為此,中國科學(xué)院院士鄂維南、中國人民大學(xué)高瓴人工智能學(xué)院執行院長(cháng)文繼榮、復旦大學(xué)教授邱錫鵬、華為云大數據與人工智能總裁尤鵬、墨奇科技聯(lián)合創(chuàng )始人/CTO湯林鵬、上海算法創(chuàng )新研究院研究員楊泓康展開(kāi)了激烈討論,參會(huì )嘉賓認為,“必須且亟需建立人工智能的底層能力,探索出一條更加可持續、能夠解決當前大規模能源資源消耗問(wèn)題的通用人工智能方法。也有嘉賓指出,“大模型的完善要從優(yōu)化知識存儲能力和提高知識使用效率雙管齊下,催生模型”慢思考“能力。當模型有了解決復雜問(wèn)題的能力,可能會(huì )帶來(lái)一系列的變化,比如在科研和技術(shù)的加速,新材料的發(fā)現等等,值得我們的持續關(guān)注。”與會(huì )嘉賓在此共識,“要實(shí)現下一代通用人工智能,需要在算力資源、數據資源、AI數據庫能力、下一代模型和人才資源等方面久久為功。”人工智能方法還是有很多沒(méi)有被探索,應該與場(chǎng)景去結合,從應用到底層技術(shù)進(jìn)行創(chuàng )新。

針對當下通用人工智能的技術(shù)熱點(diǎn)與未來(lái)人工智能發(fā)展的必然趨勢,論壇嘉賓分享了他們獨到的技術(shù)見(jiàn)解。“生成式AI或者擴散模型遠遠不只于生成視頻或者圖片,使其應用于生命科學(xué)和材料科學(xué),如蛋白質(zhì)結構,RNA序列研究,晶體結構的設計等。”普林斯頓大學(xué)教授、普林斯頓人工智能創(chuàng )新中心主任王夢(mèng)迪分享道。“不管是生成式AI,擴散模型,還是大語(yǔ)言模型,讓它變得更有用,更有意思,和人類(lèi)的價(jià)值對齊,我認為我們需要做到的事情是讓這些模型可控,這是通向AGI的必經(jīng)之路。”

我們當前正處在一波人工智能真實(shí)場(chǎng)景應用的浪潮之中,也為支持人工智能的硬件發(fā)展提出了多功耗,多場(chǎng)景覆蓋等更高的要求。在算力方面,未來(lái)我們期望的AI,不僅是解決特定問(wèn)題的工具,更是能夠跨領(lǐng)域學(xué)習和創(chuàng )新的合作伙伴。華為昇騰計算業(yè)務(wù)CTO周斌以“大模型算力基礎設施的挑戰和發(fā)展探討”為主線(xiàn)展開(kāi)報告,分享了他的觀(guān)點(diǎn)。“構建彈性靈活的算力基礎設施,并發(fā)展對應的數據軟件框架與優(yōu)化算法,是確保下一代人工智能發(fā)展至關(guān)重要的基礎環(huán)節。業(yè)界主流模型從千億稠密到萬(wàn)億稀疏,并逐步走向百萬(wàn)級超長(cháng)序列和多模態(tài),大規模算力成為支撐高質(zhì)量大模型創(chuàng )新落地的關(guān)鍵基礎。” 

那么下一代通用人工智能模型是什么樣的?論壇上的專(zhuān)家們也給出了各自的見(jiàn)解。其中之一是類(lèi)比人腦記憶與思考方式的記憶分層大模型。目前記憶分層的大模型已經(jīng)在上海算法創(chuàng )新研究院實(shí)現。會(huì )上,上海算法創(chuàng )新研究院大模型中心負責人熊飛宇發(fā)布了最新科研成果——憶³大模型(Memory³),該模型創(chuàng )新地引入了顯性記憶機制,顯著(zhù)提高了性能并降低了訓練與推理成本。憶³在傳統的模型參數(隱性記憶)與上下文鍵值(工作記憶)之外,增加了第三種形式的記憶——顯性記憶。模型無(wú)需訓練即可將文本轉換為顯性記憶,并在推理時(shí)快速且稀疏地使用記憶。通過(guò)外部化模型存儲的知識,顯性記憶減輕了模型參數的負擔,進(jìn)而提高了模型的參數效率與訓練效率,使基準測試上憶³能夠實(shí)現約3倍參數量模型的性能?;趹?sup3;架構的AI搜索引擎,利用顯性記憶的快速讀寫(xiě),使回答的時(shí)效性更強,準確率更高,內容更完整,還能夠根據用戶(hù)的反饋實(shí)時(shí)更新和優(yōu)化答案。隱性記憶使搜索引擎能夠理解復雜的上下文關(guān)系,提供更精準和個(gè)性化的搜索結果?;趹?sup3;的特性,這款AI搜索引擎不僅提高了用戶(hù)的搜索體驗,還在信息檢索領(lǐng)域樹(shù)立了新的標桿。此外,憶³已在金融、媒體等行業(yè)落地應用。

隨著(zhù)以深度學(xué)習、大模型為代表的 AI 技術(shù)迅速發(fā)展,圖像、視頻、文本、語(yǔ)音等的非結構化數據處理的需求和能力也有了爆發(fā)式的增長(cháng)。高維向量是非結構化數據的統一語(yǔ)義表征,但主流的向量數據庫存在通用數據管理能力不足,面對海量數據時(shí)性能、可擴展性不佳的問(wèn)題,難以應對大規模復雜 AI 應用的需求,而 MyScale 的初衷就是克服這些問(wèn)題并成為 AI 時(shí)代的數據底座。墨奇科技聯(lián)合創(chuàng )始人/CTO湯林鵬介紹道,“MyScale 是國際上首個(gè)專(zhuān)為大規模結構化和非結構化數據處理設計的 AI 數據庫,支持海量結構化、向量、文本等各類(lèi)異構數據的高效存儲和聯(lián)合查詢(xún),綜合性能比國內外其他產(chǎn)品提高 4-10 倍。在實(shí)際生產(chǎn)中,MyScale AI 數據庫成功扮演了大模型+大數據雙輪驅動(dòng)下的統一 AI 數據底座。在金融文檔分析、科研文獻智能問(wèn)答分析、企業(yè)私域知識管理、工業(yè)/制造業(yè)智能化、零售行業(yè)客戶(hù)服務(wù)、人力資源行業(yè)智能化、法律行業(yè)智能化等應用場(chǎng)景中均幫助客戶(hù)創(chuàng )造了巨大價(jià)值,加速了大模型和場(chǎng)景數據結合的技術(shù)創(chuàng )新和應用落地。”

此外,本次論壇嘉賓也在人工智能人才培養上提出了建議與期待。目前,我國人工智能領(lǐng)域的人才需求量巨大,亟需打造體系化、高層次的人工智能和基礎研究人才培養平臺,培養使用戰略科學(xué)家,支持青年科技人才挑大梁、擔重任,加快凝聚一批跨學(xué)科發(fā)展研發(fā)隊伍,鼓勵更多研究人員投身交叉科學(xué)研究和基礎研究。

未來(lái),從現在出發(fā)。在不斷探索人工智能邊界的道路上,培植下一代通用人工智能方法、完善AI for Science的基礎設施極為關(guān)鍵,它將推動(dòng)科技向前發(fā)展,解鎖以前難以想象的創(chuàng )新可能性。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到