不做大模型的AI芯片,清華大學(xué)“ACCEL”有何不同?
更快,更低功耗
提及人工智能AI相關(guān)的算力芯片,現在絕大多數人的第一反應都是英偉達NVIDIA的GPU,作為AI模型搭建的基礎,英偉達的A100/H100幾乎成為了一塊塊“金磚”,深受業(yè)界喜愛(ài)。
然而,一方面,外部管制在上月又一次收緊,國內人工智能行業(yè)很難再獲取高端算力的支持;另一方面,以GPU為首的傳統數字邏輯電路芯片在處理復雜的人工智能算法時(shí),也存在速度有限、功耗較大的困境。
面對這一挑戰,清華大學(xué)自動(dòng)化系戴瓊海院士、吳嘉敏助理教授與電子工程系方璐副教授、喬飛副研究員聯(lián)合攻關(guān),提出了一種全新的計算架構——“全模擬光電智能計算芯片”(ACCEL)。
這顆芯片的理論算力性能可以達到目前高性能商用芯片的3000余倍,成果發(fā)表在了《自然》雜志上。
用光計算,更迅速
今年10月的2023諾貝爾物理學(xué)獎,授予了阿秒激光技術(shù),光速作為人類(lèi)已知的宇宙中最快速度擁有著(zhù)很多獨特的特性,在物理學(xué)中有很多應用。
“如何用光做計算”是業(yè)界、學(xué)界的重要課題之一。
根據清華大學(xué)發(fā)表的項目論文所述,“全模擬光電計算芯片”(all-analog chip combining electronic and light computing,ACCEL)主要是針對人工智能領(lǐng)域計算機視覺(jué)相關(guān)任務(wù)的芯片。
傳統的計算機視覺(jué)處理方案,是外界光線(xiàn)投射到如相機CMOS這樣的芯片上,經(jīng)過(guò)光電轉換后輸出的數字電信號,再加以處理。
而ACCEL的處理方式完全不同,其輸入的圖像并非是一個(gè)以數字形式存在的“圖片”,而是物理意義上的“光”,相當于給計算機加了一雙人眼,而非攝像頭。
(圖源:清華大學(xué))
輸入的圖像從光學(xué)計算部分(optical analog computing,OAC)進(jìn)入,經(jīng)過(guò)數據壓縮處理之后,投射到光電二極管陣列上(論文中稱(chēng)為電子模擬計算electronic analog computing,EAC),EAC通過(guò)OAC反饋的信息產(chǎn)生相應的輸出,表現為“有或無(wú)”的“1或0”,從而實(shí)現從模擬信號到數字信號的轉變,達成結果。
從技術(shù)層面看,光線(xiàn)在OAC部分僅僅是照射通過(guò)了一塊類(lèi)似光刻機掩膜版的組件,就完成了信號壓縮和處理,省略了光信號到電信號的轉換,理論上沒(méi)有功耗,而且處理速度為光速。加上后續EAC的信號轉換輸出一共需要約4.4nJ能量和2ns時(shí)間,即可實(shí)現一次計算。
由于光子的高速特性,在處理信息時(shí)具有極高的速度和效率,同時(shí)功耗很低。根據論文提供的實(shí)驗數據,在相同計算精度下以串行方式處理圖像時(shí),ACCEL在實(shí)驗中實(shí)現了每幀72納秒的計算延遲和每幀4.38納焦耳的能耗,遠小于英偉達A100 GPU的每幀0.26毫秒延遲和每幀18.5毫焦能耗數據。
(圖源:《自然》)
ACCEL的等效算力4600TOP/s,能效比74800TOP/s/W,是英偉達A100 GPU的3000倍以上。
摩爾定律已致極限
傳統的集成電路技術(shù)進(jìn)步在近些年開(kāi)始逐步陷入瓶頸。影響了半導體行業(yè)半個(gè)多世紀的“摩爾定律”已經(jīng)逐漸放緩,甚至有些失效的預兆。從近兩年消費電子領(lǐng)域的困境可以窺見(jiàn)一二。
(圖源:Freeimages)
近幾年,手機、PC類(lèi)處理器的性能提升速度已經(jīng)放緩,現今最為先進(jìn)的3nm工藝產(chǎn)量與良率都面臨困境,即便是已經(jīng)發(fā)布的產(chǎn)品,性能提升也比較有限,并且,隨著(zhù)晶體管尺寸一再逼近物理極限,密度大增的芯片帶來(lái)了功耗與發(fā)熱的雙重考驗。
用光替代電作為信息傳輸的新載體,是其中一條探索道路。
清華大學(xué)此次發(fā)布的這顆ACCEL只是一顆32×32陣列的小型芯片,工藝上用的是可以稱(chēng)之為“落后”的180nm工藝,更多是為了概念驗證。如果換用相對成熟的28nm,甚至是7nm這樣的先進(jìn)工藝,都有望實(shí)現更高的處理速度,以及更大的神經(jīng)網(wǎng)絡(luò )以支持更復雜的任務(wù)。
另一方面,傳統的集成電路芯片處理AI這樣的復雜任務(wù)時(shí),除了需要芯片本身的算力以外,還需要配合存儲器來(lái)實(shí)現數據存取,比如現在的GPU一般都會(huì )搭配高帶寬的HBM內存,這會(huì )造成能量的極大消耗。
清華大學(xué)電子工程系副教授方璐表示:除算力優(yōu)勢外,在智能視覺(jué)目標識別任務(wù)和無(wú)人系統(如自動(dòng)駕駛)場(chǎng)景計算中,ACCEL的系統級能效(單位能量可進(jìn)行的運算數)經(jīng)實(shí)測是現有高性能芯片的400萬(wàn)余倍,這一超低功耗的優(yōu)勢將有助于改善限制芯片集成的芯片發(fā)熱問(wèn)題,有望為未來(lái)芯片設計帶來(lái)突破。
有什么用?
恰如前文所說(shuō),ACCEL主要是針對人工智能領(lǐng)域計算機視覺(jué)相關(guān)任務(wù)的芯片,應用場(chǎng)景也是集中在如圖像識別、高通量篩選、自動(dòng)駕駛等。尤其在自動(dòng)駕駛這種需要低延遲和低功耗的應用中可能會(huì )有優(yōu)秀的表現。
在終端上,主要應用可能會(huì )是超低功耗的生物識別等等。
必須說(shuō)明的是,ACCEL對目前發(fā)展火熱的“大模型”訓練幾乎沒(méi)有幫助,無(wú)法取代通用AI算力芯片。
但伴隨著(zhù)AI芯片競爭日趨激烈,如Intel、AMD、微軟、谷歌等廠(chǎng)商都在積極布局,清華大學(xué)的研究者們也在努力將光電芯片向著(zhù)通用計算應用的方向發(fā)展,算是為國產(chǎn)AI算力芯片的設計提供了一個(gè)新思路。
本文作者:Visssom,觀(guān)點(diǎn)僅代表個(gè)人,題圖源:清華大學(xué)
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
