IBM官宣全新光學(xué)技術(shù),用光也能訓練AI?

jh 6個(gè)月前 (12-10)

近日,IBM宣布了一項重大的光學(xué)技術(shù)突破,該技術(shù)可以以光速訓練AI模型,同時(shí)節省大量能源。 這篇IBM發(fā)布的技術(shù)論文顯示,這...

近日,IBM宣布了一項重大的光學(xué)技術(shù)突破,該技術(shù)可以以光速訓練AI模型,同時(shí)節省大量能源。

這篇IBM發(fā)布的技術(shù)論文顯示,這項技術(shù)是一種新型的共封裝光學(xué)技術(shù)(co-packaged optics),可以利用光速實(shí)現數據中心內部的連接,從而替代目前使用的銅電纜。

盡管光纖技術(shù)已在全球商業(yè)和通信中廣泛應用,但大多數數據中心內部仍依賴(lài)于銅電纜進(jìn)行短距離通訊。這導致 GPU 加速器在訓練過(guò)程中常常處于閑置狀態(tài),浪費大量的時(shí)間和能源。因此IBM的研究團隊展示了如何將光的速度和容量引入數據中心,顯著(zhù)提高數據中心的通信帶寬,減少 GPU 的閑置時(shí)間,從而加速 AI 模型的處理速度。

IBM高級副總裁兼研究總監Dario Gil在評論這一技術(shù)時(shí)表示:

“由于生成式AI需要更多的能源和處理能力,數據中心必須不斷發(fā)展——而同封裝光學(xué)器件可以使這些數據中心面向未來(lái)。有了這一突破,未來(lái)的芯片將像光纖電纜將數據傳入和傳出數據中心一樣進(jìn)行通信,開(kāi)啟一個(gè)更快、更可持續的通信新時(shí)代,可以處理未來(lái)的 AI 工作負載。”

至于效果如何,根據IBM計算出的結論表示,大型語(yǔ)言模型 (LLM) 的訓練時(shí)間可以從三個(gè)月縮短到三周。同時(shí),提高能源效率將減少能源使用量并降低與訓練 LLM 相關(guān)的成本。換算成發(fā)電量的話(huà),訓練 AI 模型時(shí)節省的能源相當于5000個(gè)美國家庭的年度能源使用量。

事實(shí)上,CPO并不是最近才有的新技術(shù)。早在一年前,臺積電就攜手博通、英偉達等大客戶(hù)共同推進(jìn)這項技術(shù)的研發(fā)進(jìn)度,制程技術(shù)從45nm延伸到7nm,原計劃2024年就開(kāi)始迎來(lái)大單,并在2025年左右達到放量階段。

這種所謂的“硅光芯片”,是在硅的平臺上,將傳統芯片中的電晶體替換成光電元件,進(jìn)行電與光訊號的傳導。對比傳統芯片會(huì )出現電訊號的丟失與耗損的情況,光訊號不僅損耗少,還實(shí)現更高頻寬和更快速度的數據處理。

原理上很簡(jiǎn)單,但實(shí)際推廣上難度并不小。

首先,硅光產(chǎn)品并沒(méi)有到大規模需求階段。雖說(shuō)有自動(dòng)駕駛和數據中心兩大領(lǐng)域的需求,但目前還沒(méi)有主流芯片廠(chǎng)商推出高性能芯片。

其次,硅光產(chǎn)品需要考慮相對高昂的成本問(wèn)題。受限于大量光學(xué)器件,一個(gè)硅光器件需要采用各種材料,在缺乏大規模需求的情況下,硅光產(chǎn)品成為一種“高價(jià)、低性?xún)r(jià)比”的產(chǎn)品。同時(shí),器件的性能與良品率難以得到保障。

最后,硅光芯片在打通各個(gè)環(huán)節還需要努力。例如設計環(huán)節,雖然已經(jīng)有EDA工具支持,但算不上專(zhuān)用;而在制造與封裝環(huán)節,類(lèi)似臺積電、三星等大型晶圓代工廠(chǎng)都沒(méi)有提供硅光工藝晶圓代工服務(wù)。即便是已經(jīng)推出COUPE技術(shù)的臺積電,短時(shí)間內會(huì )專(zhuān)注于封裝方案,很難勻出產(chǎn)能提供給硅光芯片。

另外,不同廠(chǎng)商對于硅光產(chǎn)品的理解也各不相同。目前作為硅光賽道真正的老大哥英特爾已經(jīng)陷入了低谷,很難抽出精力繼續硅光子技術(shù)。

因為這次IBM推出CPO技術(shù),大概率只是儲備新技術(shù),距離商用還有段時(shí)間。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到