CSDN「智研社-The Intelliger」共話(huà)大模型技術(shù)演進(jìn)與 AI Infra 創(chuàng )新

zhouping 10個(gè)月前 (08-01)

7 月 28 日下午,CSDN 高端技術(shù)領(lǐng)導者社群「智研社-The Intelliger」第三期活動(dòng)在北京鼎好超互聯(lián) AGI 科技生態(tài)創(chuàng )新空間成功舉辦。

7 月 28 日下午,CSDN 高端技術(shù)領(lǐng)導者社群「智研社-The Intelliger」第三期活動(dòng)在北京鼎好超互聯(lián) AGI 科技生態(tài)創(chuàng )新空間成功舉辦。

活動(dòng)特別邀請到 Stability AI 機器學(xué)習運維主管、知名 AI 開(kāi)源組織 LAION 工程負責人 & 創(chuàng )始人 Richard Vencu 和 CSDN 創(chuàng )始人 & 董事長(cháng)、中國開(kāi)源軟件推進(jìn)聯(lián)盟副主席蔣濤進(jìn)行深度對話(huà),CSDN 高級副總裁李建忠、Momenta 工程質(zhì)量負責人鄒欣、華為“天才少年”申博、白??萍紕?chuàng )始人盧億雷、榮耀首席專(zhuān)家張軼博等重磅嘉賓到場(chǎng),匯聚了大模型技術(shù)專(zhuān)家、大廠(chǎng)技術(shù)大牛、大模型公司 CXO、生態(tài)合作伙伴代表?,F場(chǎng)嘉賓一起交流思想、分享經(jīng)驗,進(jìn)行 AGI 相關(guān)前沿科技的深入探討。

第三期智研社-北京站活動(dòng)現場(chǎng)合影

「智研社-The Intelliger」由 CSDN CTO 俱樂(lè )部重磅升級而來(lái)。CSDN 高級副總裁李建忠在開(kāi)場(chǎng)中為大家介紹了智研社未來(lái)發(fā)展的三個(gè)方向:

一是為技術(shù)人提供充分溝通交流的平臺;

二是提供 AGI 技術(shù)發(fā)展與應用實(shí)踐的探討與合作空間;

三是帶領(lǐng)中國 AGI 技術(shù)人走向全球,參與國際 AGI 技術(shù)交流,抓住 AI 爆發(fā)帶來(lái)的機遇。

在當今快速發(fā)展的人工智能領(lǐng)域,大規模計算資源的管理成為了一個(gè)關(guān)鍵挑戰。Stability AI 機器學(xué)習運維主管、知名 AI 開(kāi)源組織 LAION 工程負責人 & 創(chuàng )始人 Richard Vencu 在現場(chǎng)帶來(lái)了《在 AWS 云上打造 Stability AI 超級計算機》的主題演講,深入闡述了在云環(huán)境中運行 5000 個(gè) GPU 的經(jīng)驗,揭示了這一規模計算所面臨的挑戰及其解決策略。

Richard Vencu,Stability AI 機器學(xué)習運維主管、LAION 工程負責人 & 創(chuàng )始人

核心挑戰在于:

機器學(xué)習訓練與推理的差異:Vencu 指出,機器學(xué)習訓練本質(zhì)上不是一個(gè)網(wǎng)絡(luò )問(wèn)題,而機器學(xué)習推理則是。這種區別源于推理需要通過(guò)標準化的網(wǎng)絡(luò )通道向全球用戶(hù)提供服務(wù)。

多團隊需求管理:不同 AI 團隊對規模和上市時(shí)間的要求各不相同,導致優(yōu)先級不斷變化。這要求資源管理系統具有高度的靈活性。

共享環(huán)境中的信任問(wèn)題:在共享的高性能計算(HPC)集群中,用戶(hù)通常無(wú)法獲得 root 訪(fǎng)問(wèn)權限,這限制了系統的靈活性。

大規模資源管理:主要目標是減少 GPU 的閑置時(shí)間,提高利用率,并減少因缺陷導致的停機時(shí)間。

使用追蹤:需要精確追蹤每個(gè)項目和用戶(hù)的資源使用情況,以便進(jìn)行報告、稅務(wù)處理和計費。

作為解決方案,Vencu 推薦使用 SLURM 作為資源調度器。SLURM 是一個(gè)有20多年歷史的開(kāi)源系統,維護良好,提供搶占和重新排隊機制(腳本需要意識到這一點(diǎn)并能夠自行恢復)、跨不同優(yōu)先級的優(yōu)先機制和公平共享機制。這些功能有效解決了最大的挑戰——最小化 GPU 閑置時(shí)間。

在現場(chǎng),Vencu 和到場(chǎng)嘉賓進(jìn)行了互動(dòng),為那些希望在云中部署大規模 AI 計算資源的開(kāi)發(fā)者提供了寶貴的見(jiàn)解和實(shí)踐指導。云環(huán)境中管理大規模 GPU 資源是一項復雜的任務(wù),涉及多個(gè)方面的挑戰。通過(guò)采用適當的資源調度策略、嚴格的安全措施、靈活的項目管理以及全面的監控系統,可以顯著(zhù)提高資源利用率,降低成本,同時(shí)滿(mǎn)足不同團隊的需求。

隨著(zhù)大模型的廣泛應用,AI 技術(shù)已經(jīng)在自然語(yǔ)言處理、計算機視覺(jué)、多模態(tài)理解等領(lǐng)域取得了顯著(zhù)的突破。大模型強大的生成能力和理解能力,還在各種領(lǐng)域的實(shí)際應用中展現了巨大的潛力。然而,大模型的訓練和推理需要龐大的計算資源,AI 基礎設施(AI Infra)的建設成為了當前技術(shù)發(fā)展的關(guān)鍵。

為了解答這一系列問(wèn)題,由 Momenta 工程質(zhì)量負責人、CSDN 《新程序員》內容顧問(wèn)鄒欣主持,Stability AI 機器學(xué)習運維主管、知名 AI 開(kāi)源組織 LAION 工程負責人 & 創(chuàng )始人 Richard Vencu 和 CSDN 創(chuàng )始人 & 董事長(cháng)、中國開(kāi)源軟件推進(jìn)聯(lián)盟副主席蔣濤展開(kāi)圓桌對話(huà),圍繞“2024 大模型技術(shù)演進(jìn)與 AI Infra 創(chuàng )新”的話(huà)題進(jìn)行了多個(gè)方面的探討。

以下是他們對每一方面內容的討論焦點(diǎn):

計算機系統的架構轉變

當前,我們正在從以 CPU 為中心向以 GPU 或其他 AI 加速器為中心的模式轉變。這種轉變意味著(zhù)計算任務(wù)將更多地依賴(lài)于專(zhuān)門(mén)化的硬件,以提高處理速度和效率。

未來(lái)可能進(jìn)入“軟件 2.0”時(shí)代,編程將不再僅僅依靠代碼,而是利用數據和神經(jīng)網(wǎng)絡(luò )來(lái)驅動(dòng)程序的執行。這表明軟件開(kāi)發(fā)的方式將發(fā)生根本性的變化,更加依賴(lài)算法和數據處理能力。

多家公司正在開(kāi)發(fā)專(zhuān)用 AI 芯片,競爭格局尚未明朗。這預示著(zhù)未來(lái)硬件市場(chǎng)的競爭將非常激烈,且可能會(huì )出現新的行業(yè)標準和生態(tài)系統。

大模型與小模型并存發(fā)展

超大規模集群支持的通用大模型將繼續發(fā)展。這些模型通常需要大量的計算資源,能夠處理復雜的任務(wù)和大規模的數據分析。

端側小模型也很重要,用于特定場(chǎng)景和保護隱私。這意味著(zhù)在設備端進(jìn)行高效且安全的數據處理將成為一個(gè)重要的研究方向,特別是在涉及敏感信息時(shí)。

兩種模型各有優(yōu)勢,將并行發(fā)展。這種多樣化的策略可以確保在不同的應用場(chǎng)景中都能找到合適的解決方案。

開(kāi)源 vs 閉源模型

結合 NVIDIA CEO 黃仁勛近日提出的“孿生地球”觀(guān)點(diǎn),具體分析 Linux 基金會(huì )和 Apache 基金會(huì )等典型的開(kāi)源項目案例,在場(chǎng)嘉賓討論了開(kāi)源模型未來(lái)的商業(yè)化和產(chǎn)業(yè)化問(wèn)題。如今像 OpenAI 這樣的領(lǐng)先公司仍缺少“護城河”,所以長(cháng)期來(lái)看,開(kāi)源模型可能會(huì )超過(guò)閉源模型。

開(kāi)源促進(jìn)了模型的快速迭代和改進(jìn),允許更多的開(kāi)發(fā)者參與到項目中,從而加速了技術(shù)的成熟和應用的廣泛性。

但在某些領(lǐng)域,閉源模型仍可能保持優(yōu)勢。閉源模型提供了更好的控制和安全性,對于某些對數據安全有極高要求的行業(yè)來(lái)說(shuō)尤為重要。

數據與訓練挑戰

高質(zhì)量訓練數據對模型至關(guān)重要。這意味著(zhù)獲取和標注大量高質(zhì)量的數據集將是未來(lái)發(fā)展的一個(gè)重點(diǎn)。

未來(lái)可能需要更多物理世界的數據。隨著(zhù)技術(shù)的進(jìn)步,如何有效地收集和利用現實(shí)世界中的數據將成為提升模型性能的關(guān)鍵因素之一。

數據開(kāi)源和共享可能成為一個(gè)重要話(huà)題。這不僅有助于提高數據的質(zhì)量和多樣性,還促進(jìn)了跨組織之間的合作和知識共享。

AGI 展望

當前,人工智能處于早期階段,業(yè)界對 AGI 實(shí)現的時(shí)間表和可能性存在不同看法。盡管人工智能已經(jīng)取得了顯著(zhù)進(jìn)展,但要達到真正的通用人工智能水平仍然充滿(mǎn)挑戰和不確定性。這需要持續的研究和技術(shù)突破。

在場(chǎng)嘉賓積極提問(wèn),就開(kāi)源閉源之爭、具體工程實(shí)現、未來(lái) AI 硬件問(wèn)題和 AGI 愿景等多個(gè)角度展開(kāi)精彩的交流互動(dòng)。

現場(chǎng)掠影,嘉賓互動(dòng)活躍

「智研社-The Intelliger」是由 CSDN 發(fā)起創(chuàng )立的高端技術(shù)領(lǐng)導者社群?!钢茄猩?The Intelliger」的前身為 CTO 俱樂(lè )部,自 2009 年由 CSDN 創(chuàng )辦以來(lái),是極具影響力的高端技術(shù)管理者分享與交流的平臺。隨著(zhù)大模型技術(shù)的迅猛發(fā)展,人工智能將成為未來(lái) 10 年最有影響力的技術(shù)力量,必將重塑行業(yè)格局并引領(lǐng)創(chuàng )新浪潮。CTO 俱樂(lè )部正式更名為「智研社 The-Intelliger」,意味著(zhù)其將以全新的面貌迎接 AGI 新紀元的到來(lái)。

活動(dòng)主辦方 CSDN 作為中文技術(shù)社區的領(lǐng)導者,通過(guò)打造「智研社-The Intelliger」在全球各大技術(shù)中心城市的系列活動(dòng),匯聚技術(shù)領(lǐng)導者與行業(yè)精英,洞察技術(shù)趨勢,站在 AGI 的新起點(diǎn)上,推動(dòng)技術(shù)革新和戰略思維的交融,引領(lǐng)技術(shù)領(lǐng)導者走向全球。

活動(dòng)聯(lián)合主辦方鼎好超互聯(lián)AGI科技生態(tài)創(chuàng )新空間,鼎好超互聯(lián)”AGI 科技生態(tài)創(chuàng )新空間”由世紀互聯(lián)與鼎好 DH3 共同打造??臻g持續吸納全國一線(xiàn) Al 企業(yè)與人才,匯聚市場(chǎng)智算資源、科研資源、資金資源、市場(chǎng)資源和社群資源,為各行各業(yè)面向 AGI 轉型提供從訓練到推理的新型基礎設施,致力于成為中國 AGI 發(fā)展的“助推器”和“加速器”。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到