數據中心智能化,華為憑什么做到一騎絕塵?
數據中心智能化,華為憑什么做到一騎絕塵?
6月21日,這段時(shí)間如果你途經(jīng)深圳或北京機場(chǎng),可能會(huì )被華為的巨幅平面廣告所吸引。不是手機,也不是云,華為這一次秀的,是隸屬于企業(yè)BG的數據中心系列產(chǎn)品。率先登場(chǎng)的,是華為數據中心交換機CloudEngine系列——號稱(chēng)業(yè)界首個(gè)面向AI時(shí)代的數據中心交換機。
從廣告主視覺(jué)到文案,滿(mǎn)眼都是AI的身影——華為昇騰AI芯片、iLossless算法,以及重復出現四次的AI字眼——似乎要非常明確地表明身份,“不同于傳統數據中心交換機,我是AI加持的劃時(shí)代產(chǎn)品。”有多不同,小字部分給出了直觀(guān)的“跑分”答案:在三大場(chǎng)景性能上比友商均提升了30%左右。
見(jiàn)慣了手機“跑分”的人可能對此有些麻木,但IT業(yè)內人士當能看到關(guān)鍵場(chǎng)景性能提升30%的價(jià)值和意義。仔細看你會(huì )發(fā)現這個(gè)數據出自國際權威評測機構Tolly Group,公信力不在話(huà)下;而密切關(guān)注IT行業(yè)動(dòng)向的業(yè)內人可能已經(jīng)知道,廣告中未點(diǎn)名的被Tolly對比測評的業(yè)界產(chǎn)品,正是思科頂級的Nexus交換機。
如此一來(lái)問(wèn)題就變得有趣了:在A(yíng)I方興未艾的當下,華為真的有“九陽(yáng)神功”護體學(xué)什么武功都很快,而且都很能打嗎?眾所周知,華為已經(jīng)用AI手機在消費市場(chǎng)創(chuàng )下新高度,難道僅僅引入AI,就能讓華為在企業(yè)數據中心領(lǐng)域走完別人行走多年的路,實(shí)現彎道超車(chē)嗎?
帶著(zhù)這些問(wèn)題,筆者日前代表極客網(wǎng)與國內一眾IT網(wǎng)絡(luò )資深媒體人走進(jìn)華為企業(yè)業(yè)務(wù)展廳實(shí)地參觀(guān)體驗,并與華為企業(yè)BG全球Marketing總裁邱恒做了深度的交流,特將所見(jiàn)所聞所感與大家分享。
AI貫穿一切,打造端到端智能數據中心
華為身上的標簽很多,其中之一是“端到端”,指的是華為能夠提供端到端全面而完善的產(chǎn)品及解決方案。數據中心也不例外,除了開(kāi)篇提到的機場(chǎng)廣告中的主角數據中心網(wǎng)絡(luò )外,位于深圳坂田的華為企業(yè)業(yè)務(wù)展廳還展出了包括計算、存儲、傳輸、電源、散熱在內的數據中心產(chǎn)品及方案。
一個(gè)顯著(zhù)的特征是:AI不僅被華為應用到其中的計算或網(wǎng)絡(luò )等單一環(huán)節,而是貫穿整個(gè)數據中心的每一環(huán)。也就是說(shuō),基于全面的技術(shù)和產(chǎn)品能力,華為打造的是端到端的智能數據中心。這或許可以解釋為什么華為敢于喊出智能數據中心的口號,并切實(shí)做出讓傳統數據中心黯然失色的劃時(shí)代產(chǎn)品。
比如在數據中心交換機環(huán)節,邱恒介紹到,華為CloudEngine系列最新產(chǎn)品CloudEngine 16800通過(guò)華為自研的昇騰310高性能AI芯片和獨創(chuàng )的iLossless智能無(wú)損交換算法,可實(shí)現流量模型自適應自?xún)?yōu)化,大幅降低故障識別和故障定位所需的時(shí)間,在零丟包基礎上獲得更低時(shí)延和更高吞吐的網(wǎng)絡(luò )性能,克服傳統以太網(wǎng)丟包導致的算力損失,將AI訓練效率提升40%,數據存儲IOPS性能提升30%。
又如在存儲環(huán)節,華為的OceanStor Dorado V3全閃存存儲系統采用智能芯片、NVMe架構和FlashLink智能算法,可提供0.3ms的穩定時(shí)延,實(shí)現端到端加速,業(yè)務(wù)性能提升3倍。
再如在電源、散熱及管理環(huán)節,華為的FusionModule2000智能模塊化數據中心實(shí)現了業(yè)界唯一的智能化管理,提出了基于iCooling、iPower、iManager的i3解決方案,能在典型場(chǎng)景(100kW數據中心,負載率50%)中每年省出13萬(wàn)度電。
端到端的智能帶來(lái)的好處是十分顯著(zhù)的,邱恒在分享中列舉了一個(gè)銀行客戶(hù)做數據中心故障排查演練的案例,以前用傳統的方法要76分鐘才能找到故障,現在8分鐘就能把故障定位。這意味著(zhù),有了智能算法、智能芯片的幫助之后,數據中心的智能水平有了飛躍性的進(jìn)步;從76分鐘到8分鐘,這是一個(gè)數量級的提升!
綜上可見(jiàn),不囿于一招鮮單點(diǎn)發(fā)力,AI已經(jīng)被華為融入到數據中心的每一個(gè)環(huán)節,并且在關(guān)鍵場(chǎng)景性能提升和運維管理的降本增效層面均取得顯著(zhù)突破??深A見(jiàn),機場(chǎng)秀肌肉的CloudEngine系列交換機還只是個(gè)開(kāi)始,接下來(lái)華為還將展示智能數據中心更多維度的躍升。
核心能力全上陣,不斷突破產(chǎn)品極致性能
除了無(wú)處不在的AI外,華為數據中心全線(xiàn)產(chǎn)品展現出來(lái)的另一個(gè)姿態(tài)是“死磕”性能——核心能力全部上陣,不斷突破各類(lèi)產(chǎn)品的行業(yè)極限,積極應對AI時(shí)代正在爆發(fā)或即將爆發(fā)的分布式存儲、高性能計算(HPC)和AI應用等場(chǎng)景對數據中心資源需求的爆發(fā)式增長(cháng)。
華為用于數據中心的核心能力首先表現在芯片層面。近期“備胎”轉正的新聞一直伴隨著(zhù)華為,特別是在芯片層面。此番參觀(guān)遍歷華為數據中心產(chǎn)品,才發(fā)現原來(lái)華為自研芯片已經(jīng)廣泛應用于數據中心網(wǎng)絡(luò )、計算、存儲的每一個(gè)核心環(huán)節。
比如在CloudEngine系列數據中心網(wǎng)絡(luò )產(chǎn)品中,除了上面提到的昇騰310高性能AI芯片,核心的網(wǎng)絡(luò )芯片(NP)也是華為自研的Solar系列。又如在華為T(mén)aiShan服務(wù)器中,不僅搭載了華為自研的CPU芯片鯤鵬920,還配置了智能網(wǎng)絡(luò )融合芯片、智能管理芯片、智能SSD控制芯片等自研芯片。再如在華為OceanStor系列存儲中,也有華為自研的SSD控制芯片、BMC管理芯片、智能多協(xié)議接口芯片等。此外在異地災備數據中心互聯(lián)方案中,同樣用到了昇騰310,以及華為最傳統的強項oDSP光傳輸芯片。
有自研高性能芯片的加持,產(chǎn)品性能的提升立竿見(jiàn)影。邱恒以計算環(huán)節為例,指出華為數據中心在采用了新型的處理芯片之后,跟傳統的數據中心相比AI訓練的算力提升了2倍;跟業(yè)界頂級水平的公司相比,也能提升2倍的算力水平。如今,集鯤鵬920、昇騰310等眾多芯片于一身的華為的TaiShan服務(wù)器,正在將高效能計算帶入每一個(gè)數據中心。
除自主可控、創(chuàng )新靈活的芯片外,華為用于數據中心的核心能力還表現在ICT技術(shù)融會(huì )貫通后強大的產(chǎn)品設計能力,其中涉及到架構、材料等方方面面。以網(wǎng)絡(luò )產(chǎn)品CloudEngine 16800為例,其全面升級了硬件交換平臺,在正交架構、無(wú)背板基礎上突破超高速信號傳輸、高效供電、超強散熱等多項技術(shù)難題,使得單槽位可提供業(yè)界最高密度48端口400GE線(xiàn)卡(單機提供業(yè)界最大的768端口400GE交換容量),交換能力高達業(yè)界平均水平的5倍(一臺頂5臺),很好滿(mǎn)足了AI時(shí)代流量倍增的需求。
其中,信號傳輸采用新型亞微米無(wú)損材料,使得電信號的傳輸效率提高了30%,確保了高性能板卡的實(shí)現;供電采用磁吹滅弧和大勵磁技術(shù)實(shí)現單個(gè)電源模塊獨立雙路輸入的ms級快速切換,大幅節省機房空間,使單位空間的供電效率提升95%;散熱采用新型碳納米導熱墊和VC相變散熱器,使得散熱效率較業(yè)界平均提升4倍,整機可靠性提升20%。
總之,無(wú)論是微觀(guān)的芯片設計,還是宏觀(guān)的產(chǎn)品設計,華為都傾其ICT核心能力發(fā)揮到極致,為數據中心全線(xiàn)產(chǎn)品帶來(lái)了極致性能。如此一來(lái),當產(chǎn)品本身強大的基礎性能遇上AI效率倍增的能力,就會(huì )進(jìn)一步爆發(fā)出巨大的能量了。
以客戶(hù)需求為中心,多維度實(shí)現超低TCO
當然,強勁的AI能力,極致的產(chǎn)品性能,都不一定是企業(yè)客戶(hù)選擇升級數據中心的必然理由。很多時(shí)候,TCO因素在企業(yè)的IT投資考量中會(huì )占據更大的比重,特別是在當前的經(jīng)濟大環(huán)境下。但是,科學(xué)技術(shù)是第一生產(chǎn)力,在面向AI時(shí)代的轉型中,企業(yè)如果不能抓住以數據高效處理、AI助力決策為特色的智能經(jīng)濟浪潮,則極有可能會(huì )被時(shí)代拋棄。
如何平衡?通常情況下,新技術(shù)的加入和產(chǎn)品性能的升級通常都意味著(zhù)客戶(hù)擁有成本的增加,但華為智能數據中心展示了強大的TCO控制能力,多維度發(fā)力為客戶(hù)實(shí)現了超低TCO。同邱恒的交流中我們發(fā)現,為獲取超低TCO,華為數據中心解決方案考慮的不僅是單個(gè)設備怎么樣,而且要思謀如何端到端實(shí)現整體最低成本。
邱恒指出,在擁有智能化能力和保障高性能的前提下,數據中心運營(yíng)者其實(shí)第一就是想省電,第二是想省空間,第三是想省運維。對此華為智能數據中心拿出了專(zhuān)門(mén)的供電智能、散熱智能和管理智能解決方案,通過(guò)AI算法自適應和架構設計優(yōu)化(比如上面提到的FusionModule2000智能模塊化數據中心方案),達成超低TCO。
具體的數據表現上,從單一環(huán)節產(chǎn)品看,華為智能數據中心各產(chǎn)品都實(shí)現超低TCO。比如,整機滿(mǎn)配的CloudEngine 16800一年能省出32萬(wàn)度電,同時(shí)機柜只占傳統方案1/5的空間。OceanStor Dorado V3能達到75%的OPEX節省和5:1的數據縮減率,同時(shí)無(wú)損性能。而如果采用集電源、散熱及管理于一體的FusionModule2000智能模塊化數據中心方案,則能在100kW數據中心、負載率50%的典型場(chǎng)景中一年省下13萬(wàn)度電!
總之,單品+系統級的極致節省,是華為智能數據中心能夠獲得超低TCO的法寶。當然必須意識到,以AI為首的智能技術(shù)的引入,不僅僅能提升數據中心各環(huán)節的業(yè)務(wù)效率,本身也是降低端到端TCO的關(guān)鍵,十分值得注意。
綜上,筆者此行參觀(guān)體驗的最大的感受是,華為數據中心的每個(gè)產(chǎn)品都在努力做到智能、極致性能和超低TCO,同時(shí)產(chǎn)品與產(chǎn)品之間還有協(xié)同,以達成端到端的智能、極致性能和超低TCO。如此很明顯,華為數據中心的智能化水平,不是每一個(gè)單點(diǎn)設備提升的匯總相加,還有各部分之間的乘法效應。這大概就是華為智能數據中心能夠一騎絕塵的原因吧!
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
