對話(huà)紫光云:“芯片設計上云”已成共識, 云計算有望助力國產(chǎn)EDA彎道超車(chē)
紫光云公司CTO辦公室主任鄧世友表示,芯片上云的本質(zhì),就是用算力換時(shí)間,用云端CAD工具解放生產(chǎn)力。
圖 | 紫光云公司CTO辦公室主任鄧世友
整個(gè)芯片設計環(huán)節中,仿真驗證不僅復雜,還是最耗時(shí)的。不夸張地說(shuō),在部分芯片設計中,這一過(guò)程耗費時(shí)間的整體占比更是高達70%。
如果是一家資金充足、人員團隊上規模的IC公司,他們大可以采購服務(wù)器自建算力中心,自建團隊運維CAD研發(fā)環(huán)境。反之,如果一家資金和團隊規模均有限,時(shí)間人力成本的消耗和響應速度快慢就成為了一道“攔路虎”。
而現實(shí)情況是,截至2020年底,國內共有2218家芯片設計企業(yè),其中高達87.9%都是人員規模不足100人的。在芯片性能迭代速度不斷加快的當下,他們可以怎么做?
帶著(zhù)這個(gè)問(wèn)題,在6月10日由鎂客網(wǎng)承辦的IC設計開(kāi)發(fā)者大會(huì )上,我們對紫光云公司CTO辦公室主任鄧世友先生進(jìn)行了采訪(fǎng)。
一場(chǎng)時(shí)間與算力的博弈
芯片迭代速度加快的另一面,是摩爾定律被打破,這背后不僅存在技術(shù)的進(jìn)步,也有著(zhù)市場(chǎng)需求的“倒逼”。
針對這一事實(shí),有一個(gè)數據已經(jīng)被多次拿出來(lái)討論,那就是OpenAI于3年前發(fā)布的一份報告,里面提到,從2012年到2018年,AI算力需求增長(cháng)超過(guò)了30萬(wàn)倍,平均每3.43個(gè)月就會(huì )翻一倍,這已經(jīng)遠遠超過(guò)了摩爾定律。
反過(guò)來(lái),正是市場(chǎng)對算力需求的急切需求,逼迫著(zhù)芯片設計者們不斷提高性能、加快芯片迭代速度。顯然,摩爾定律中時(shí)間與算力之間的平衡已經(jīng)被打破,企業(yè)需要找到一條新路徑,在保證性能穩定提升的前提下,進(jìn)一步縮短時(shí)間成本。
而說(shuō)到芯片設計,這其中有五大核心要素,分別是IP、PDK、EDA、IT和CAD,這對于芯片設計公司而言,從自主性角度出發(fā),考慮到仿真驗證過(guò)程的耗時(shí)之長(cháng),從IT處下手增加算力支持算是一個(gè)見(jiàn)效最快的方法。
“我們發(fā)現,隨著(zhù)芯片設計工藝制程越來(lái)越先進(jìn),規模越來(lái)越大,諸如紫光集團內部的紫光展銳、新華三半導體,對于算力的需求是非常龐大的,為了支撐新的芯片研發(fā)投片,每年都會(huì )投入大量的服務(wù)器、存儲等相關(guān)IT設備。”鄧世友表示。
但同時(shí)他也表示,芯片設計業(yè)務(wù)本身對于算力的需求都不是恒定變化的,而是呈現出一條波動(dòng)性很強的曲線(xiàn),尤其是投片前3個(gè)月,對算力的需求是“無(wú)限”的。
“面對這種波動(dòng)性很強的業(yè)務(wù)需求,IT團隊很難通過(guò)自購設備來(lái)滿(mǎn)足。若是買(mǎi)多了,可能會(huì )出現設備閑置,若是買(mǎi)少了,可能算力又不能完全滿(mǎn)足,不管是哪一種,都是成本在無(wú)謂消耗。”
這么一來(lái),芯片設計企業(yè)在采購IT設備的時(shí)候,既需要考慮到項目算力的需求,又要避免無(wú)謂的時(shí)間消耗,該如何做?
云,或者說(shuō)“讓芯片設計上云”,似乎是當下的最優(yōu)解。鄧世友解釋?zhuān)?ldquo;云,天然具備彈性特征,能夠滿(mǎn)足算力需求的波動(dòng)性,且是非常契合的。”
芯片上云=用算力換時(shí)間
簡(jiǎn)單來(lái)講,“芯片上云”的背后,就是用算力換時(shí)間。
云服務(wù)的商業(yè)模式是按時(shí)長(cháng)付費,這意味著(zhù)在云端用1臺服務(wù)器運轉100小時(shí)的成本,和100臺服務(wù)器運轉1小時(shí)的成本相差無(wú)幾,但這對于芯片設計的工作任務(wù)來(lái)講,效率提升的是100倍。
當然了,上云也并不意味著(zhù)將本地設備全部搬到云上。以紫光芯片云為例,鄧世友指出,“我們眼下主推混合云模式,建議將本地設備、資源作為一個(gè)常備算力進(jìn)行儲備,再輔以云上算力資源的彈性補充,兩者協(xié)同,才是一個(gè)最優(yōu)的性?xún)r(jià)比方案。”
但是回到幫助企業(yè)縮短芯片設計周期這個(gè)問(wèn)題,僅僅在云端提供算力支持只是基礎服務(wù)。因為缺乏專(zhuān)職IT人員、CAD工程師等人才,致使一些企業(yè)即便拿到了云端算力資源,也很難快速地搭建芯片設計環(huán)境。
針對這個(gè)問(wèn)題,紫光芯片云也交出了自己的成果。就在今年4月新發(fā)布的2.0版本中,算力之外,紫光芯片云開(kāi)始注重起芯片設計環(huán)境。
具體來(lái)看,紫光芯片云提供的U-Imp/U-Chip芯片設計工作流執行平臺,將EDA工具、工藝技術(shù)文件、集群作業(yè)調度、項目管理和數據管理等模塊集成在此平臺之上,IC研發(fā)工程師可以通過(guò)圖形化GUI界面,直觀(guān)快速的進(jìn)行PPA(Performance, Power, Area/Cost)評估和完備嚴苛的物理實(shí)現過(guò)程控制。U-Imp/U-Chip支持多模塊并發(fā)執行、自動(dòng)化RTL-GDSOUT流程、自動(dòng)化的Checklist檢查和QOR報告收集,大幅縮短IC設計項目實(shí)施中的Syn綜合/FV形式化驗證/ STA靜態(tài)時(shí)序分析/物理設計/Sign Off等流程時(shí)間,提高芯片設計效率、節約成本,并為芯片投片一次性成功進(jìn)行流程上的保障。
此外,紫光芯片云還融入了紫光集團旗下新華三半導體、紫光國芯等企業(yè)的芯片設計服務(wù)能力,也與EDA、IP、Foundry等生態(tài)合作伙伴對接,為IC企業(yè)提供一站式的設計服務(wù)+云服務(wù)打包Turnkey方案交付。
上云之前,先聊聊這兩個(gè)問(wèn)題
國內芯片上云領(lǐng)域中,紫光是領(lǐng)先者。而從紫光芯片云2.0版本來(lái)看,其更為強調的是一種“生態(tài)”,這也是當前芯片上云的重點(diǎn)工作之一。
只是在這之前,有兩個(gè)問(wèn)題我們必須得提出來(lái),一個(gè)是安全,另一個(gè)是帶寬與時(shí)延。
· 安全
眾所周知,芯片設計是一個(gè)高門(mén)檻行業(yè),面對數據信息等牽一發(fā)而動(dòng)全身的核心資產(chǎn),芯片云該如何做,才能讓客戶(hù)放心地在云上部署芯片設計等工作?
目前在行業(yè)中,這一問(wèn)題的解決方案主要有兩類(lèi),一類(lèi)是直接對設備作物理隔斷,另一類(lèi)則是在虛擬層面進(jìn)行加密。
這兩種方式也是紫光芯片云所采用的。鄧世友表示,物理隔斷方面,除了物理機房間的隔斷,在為客戶(hù)提供的芯片云服務(wù)設備,與通用公有云資源池物理隔斷,同時(shí)與互聯(lián)網(wǎng)Internet物理隔離。
至于加密,這也是各類(lèi)型云服務(wù)廠(chǎng)商的“慣有手段”了。只不過(guò)鄧世友向鎂客網(wǎng)指出,將數據進(jìn)行加密存儲雖然保證了安全性,但傳統的加密會(huì )導致性能下降。芯片上云的本質(zhì)是用算力換時(shí)間,但如果加密后,導致性能下降而使得算力大打折扣,最終延長(cháng)芯片設計任務(wù)時(shí)間,這就有點(diǎn)得不償失了。
圖 | 紫光芯片云芯片仿真統一解決方案
針對這一點(diǎn),紫光芯片云選擇采用CPU加密指令集加速等底層技術(shù),進(jìn)而對啟用加密后的性能做出優(yōu)化,“目前,我們已經(jīng)做到在滿(mǎn)載運行的情況下,將性能損失縮小至10%以?xún)取?/strong>”
此外,同樣是加密,鄧世友告訴鎂客網(wǎng),紫光芯片云還做了一個(gè)創(chuàng )新,所瞄準的是加密的核心——密鑰。
“一般云廠(chǎng)商的做法,是將密鑰管理放在云端,由云服務(wù)端為客戶(hù)分發(fā)鑰匙,相當于配鑰匙的機器掌握在云廠(chǎng)商手中,這樣一來(lái),客戶(hù)肯定是不放心的。”他介紹到,“紫光的方案與之不同,是將配鑰匙的機器打造成一個(gè)物理設備,并且放置在用戶(hù)端,或他們自己的機房中,由客戶(hù)自己管理、分發(fā)密鑰。”
· 帶寬與時(shí)延
提及云服務(wù),安全和帶寬基礎性能,也是客戶(hù)最先關(guān)心的兩個(gè)問(wèn)題。
在云服務(wù)上,帶寬小、時(shí)延長(cháng)意味著(zhù)卡頓,而一旦出現卡頓現象,留給芯片工程師的的體驗會(huì )大打折扣。
針對這一點(diǎn),紫光芯片云的做法是將云節點(diǎn)建設在離用戶(hù)最近的地方,在芯片設計企業(yè)頗多的北京和上海部署兩個(gè)節點(diǎn)資源池,將云駐地化,實(shí)現數據不出城,同城裸光纖網(wǎng)絡(luò )接入。
“以上海為例,如若是上海本地的企業(yè),我們可以做到萬(wàn)兆裸光纖直接接入云端,時(shí)延控制在5ms以?xún)取?/strong>”
“芯片上云”已成業(yè)內共識,也是“彎道超車(chē)”的機會(huì )
嚴格向前追溯,國內芯片上云的開(kāi)端始于2019年,但是更早的,在2017年,國外三大EDA巨頭(Synopsys、Cadence、Mentor),以及亞馬遜、微軟和谷歌三大云服務(wù)廠(chǎng)商就開(kāi)始部署相應方案,并相當成熟,也有了相關(guān)成果與案例。
“雖然起步較晚,但是現在,包括很多芯片設計企業(yè)、其他云服務(wù)廠(chǎng)商在內,都已經(jīng)達成了一個(gè)共識——EDA上云是大勢所趨。”鄧世友表示。
大家都認同了這一趨勢,且國外的案例也證明了這一模式的可行,隨著(zhù)國內云服務(wù)模式的不斷推廣,越來(lái)越多的企業(yè)開(kāi)始嘗試在云端進(jìn)行芯片設計驗證。在助力國產(chǎn)芯片設計這條道路上,云、AI等技術(shù)的參與比重正不斷增加,且方法上也是各有特色。
比如紫光云,充分利用云服務(wù)的特性,滿(mǎn)足計算彈性、存儲彈性和訪(fǎng)問(wèn)便捷性的同時(shí),也通過(guò)接入第三方設計公司的能力,全方位地為芯片設計企業(yè)打造一個(gè)完整的芯片設計環(huán)境,從算力、CAD工具等關(guān)鍵環(huán)節出發(fā),達到降本增效的效果。
另外,我們還看到一些企業(yè)也在嘗試搭建平臺,只不過(guò)這類(lèi)平臺旨在利用AI技術(shù),來(lái)幫助芯片設計企業(yè)優(yōu)化IC設計,力求在最優(yōu)模式下設計出性能最優(yōu)的芯片。
而眾所周知,在芯片設計環(huán)節,國產(chǎn)芯片最為“卡脖子”的環(huán)節在于EDA軟件。數據統計,2020年的國內EDA市場(chǎng)中,三大巨頭就占去了85%,國產(chǎn)廠(chǎng)商市場(chǎng)份額雖在近兩年內有所增長(cháng),但也僅有14%。
看到這里,我們不禁發(fā)問(wèn),隨著(zhù)云計算、AI等技術(shù)以一種創(chuàng )新方式參與到EDA等關(guān)鍵領(lǐng)域中,能夠助力國產(chǎn)EDA等實(shí)現“彎道超車(chē)”嗎?
當鎂客網(wǎng)問(wèn)及此,鄧世友認可道,云計算、AI在各行業(yè)的滲透率越來(lái)越高,對于EDA也不例外。“云計算與AI帶給EDA軟件不僅僅是技術(shù)上的輔助與加速,同時(shí)也是商業(yè)模式上的創(chuàng )新與變革。”
他進(jìn)一步表示,雖然在全流程上,國產(chǎn)EDA軟件依舊與三大巨頭存在不少差距,但在不少EDA點(diǎn)工具上,國內卻也是存在不少優(yōu)秀產(chǎn)品的。
而以云服務(wù)對國產(chǎn)EDA的助力為例,“基于云平臺,可以融合國內多家優(yōu)秀的EDA點(diǎn)工具,組合成全流程EDA,實(shí)現優(yōu)勢互補,進(jìn)而推廣給芯片企業(yè)。只有讓更多的芯片企業(yè)用起國產(chǎn)EDA工具,才能幫助國產(chǎn)EDA工具實(shí)現迭代優(yōu)化,達到更好的良性發(fā)展。”
與此同時(shí),鄧世友也指出,EDA工具云化,一方面可以降低芯片企業(yè)使用正版EDA工具的門(mén)檻,另一方面也可以從根本上解決軟件授權問(wèn)題。
不過(guò),我們也可以看到,近年來(lái),已經(jīng)有不少三巨頭的高管選擇離職創(chuàng )業(yè),同時(shí)國內的利好政策以及國產(chǎn)化需求,也在推動(dòng)EDA行業(yè)走向突破。這一點(diǎn)上,國產(chǎn)EDA軟件國內市占率從5%到14%的增長(cháng)事實(shí)就是一個(gè)有力證明。
而如同國產(chǎn)EDA軟件的發(fā)展與突破,在其他關(guān)鍵領(lǐng)域如IP等,隨著(zhù)智能芯片的出現也正產(chǎn)生有別于傳統IP的新需求。
可以確定,云計算、AI等前沿技術(shù)的深度參與,給國產(chǎn)芯片“卡脖子”的現狀撕開(kāi)了一個(gè)小口,帶來(lái)了一線(xiàn)生機。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
