頂配12999元的RTX 40系列、算力2000 TOPS的自動(dòng)駕駛芯片……英偉達「狂秀肌肉」

韓璐 3年前 (2022-09-21)

“親兒子”背刺,汽車(chē)客戶(hù)著(zhù)手自研,以太坊合并……面對諸多外部因素,英偉達之后會(huì )如何呢?

昨日夜間11點(diǎn),依舊一身皮衣的黃仁勛亮相發(fā)布會(huì ),一連發(fā)布多款新產(chǎn)品,帶來(lái)了兩年一大升級的GeForce RTX 40系列,也帶來(lái)了自動(dòng)駕駛領(lǐng)域的最新之作。

其中,如同此前網(wǎng)上所傳聞的,RTX 40系列首發(fā)產(chǎn)品包含GeForce RTX 4090和GeForce RTX 4080兩個(gè)型號三款產(chǎn)品,至于其性能如何,我們接下來(lái)慢慢看。

RTX 4090:新架構、DLSS 3與臺積電4nm工藝

在首發(fā)的三款產(chǎn)品中,RTX 4090 GPU為旗艦產(chǎn)品,采用了臺積電4nm工藝,擁有760億個(gè)晶體管、超18000個(gè)CUDA核心和美光24GB GDDR6X顯存,能夠在4K分辨率的游戲中持續以超過(guò)100 FPS運行。

而取代過(guò)往的Ampere架構,此次RTX 40系列首次采用了新架構——Ada Lovelace,這是一位女性的名字,她被許多人認為是世界上第一個(gè)計算機程序員。

依據黃仁勛介紹,基于A(yíng)da Lovelace架構,RTX 40系列在SM多單元處理器等方面都進(jìn)行了換代升級。

頂配12999元的RTX 40系列、算力2000 TOPS的自動(dòng)駕駛芯片……英偉達「狂秀肌肉」

比如SM多單元處理器,性能最高達到90 TFLOPS,吞吐量是上一代Ampere架構的2倍。其中英偉達全新引入了Shader Execution Reordering(著(zhù)色器執行重排序技術(shù)),通過(guò)即時(shí)重新安排著(zhù)色器負載來(lái)提高執行效率,從而更好地利用GPU資源。依據老黃現場(chǎng)介紹,基于這一改變,RTX 40系列可獲得2-3倍的光線(xiàn)追蹤性能提升,整體游戲性能提升可高達25%。

再來(lái)看RT Core,其擁有了兩個(gè)全新硬件單元,分別是Opacity Micromap和Micro-Mesh引擎,前者將光線(xiàn)追蹤的Alpha-Test幾何性能提升2倍,后者可動(dòng)態(tài)生成微網(wǎng)格,在不犧牲性能和存儲的前提下產(chǎn)生額外的幾何圖形以提升豐富度?;谶@一升級,RTX 40系列擁有2倍的射線(xiàn)三角形相交吞吐量,有效光線(xiàn)追蹤計算能力達到191 TFLOPS,是上一代產(chǎn)品的2.8倍。

此外,黃仁勛還重點(diǎn)介紹了RTX 40系列新引入的DLSS 3.0技術(shù),它包含四項組件,其中最為關(guān)鍵的是新加入的AI幀生成器,可分析兩幀連續的游戲圖像,并計算幀到幀中物體和元素的運動(dòng)矢量數據。舉個(gè)例子,DLSS 3.0可以使原本開(kāi)啟光線(xiàn)追蹤后僅為23幀/秒的《賽博朋克2077》以101幀/秒呈現(DLSS 2.0的效果為提升到62幀/秒)。

頂配12999元的RTX 40系列、算力2000 TOPS的自動(dòng)駕駛芯片……英偉達「狂秀肌肉」

除了RTX 4090,英偉達在這場(chǎng)發(fā)布會(huì )上還帶來(lái)了兩個(gè)版本RTX 4080,即RTX 4080 16GB和 RTX 4080 12GB,除了內存不同外,16GB版本擁有9728個(gè)CUDA核心,12GB版本則是擁有7680個(gè)CUDA核心。

至于發(fā)布時(shí)間與價(jià)格:

RTX 4090將于10月12日上市,售價(jià)12999元起;

RTX 4080 16GB將于11月上市,售價(jià)9499元起;

RTX 4080 12GB將于11月上市,售價(jià)7199元起。

是的,相比上一代,漲價(jià)了。

Thor:全新自動(dòng)駕駛芯片,還身兼多職

RTX 40系列之后,老黃緊接著(zhù)帶來(lái)的是全新自動(dòng)駕駛旗艦級芯片“Thor(雷神)”,用黃仁勛的話(huà)來(lái)說(shuō):“Atlan不再是第一了……它將被Thor取代”。

頂配12999元的RTX 40系列、算力2000 TOPS的自動(dòng)駕駛芯片……英偉達「狂秀肌肉」

依照英偉達原先規劃,單顆算力達到1000 TOPS的Atlan將于2023年向開(kāi)發(fā)者提供樣品,并于2025年大規模量產(chǎn)上車(chē)。如今來(lái)看,Atlan似乎是被砍了,并且主角也由Atlan換成了Thor。

依據介紹,Thor搭載了770億晶體管,可實(shí)現算力2000 TOPS和2000 TFLOPs。而之所以能夠做到這點(diǎn),黃仁勛歸納為三點(diǎn)升級:CPU(Grace)、GPU(Ada Lovelace)和處理Transformer模型的引擎(Hopper)。

其中,Grace是英偉達首款數據中心CPU,主要面向大型數據密集型HPC和AI應用,擁有非常好的單線(xiàn)程性能;Ada Lovelace是英偉達最新的GPU產(chǎn)品,有助于車(chē)載計算資源集中化的同時(shí),也將成本降低數百美元;Hopper則提供了Transformer引擎和Vision Transformer的快速變革,可以將深度神經(jīng)網(wǎng)絡(luò )的推理性能提高9倍。

值得注意的是,除了性能上的提升,Thor更為令人驚嘆的是能夠做到“身兼多職”,基于多域計算,不僅能單獨負責自動(dòng)駕駛系統的計算需求,還能將2000 TOPS和2000 TFLOPs分開(kāi)配置使用,一部分用于駕駛艙AI和信息娛樂(lè )系統,另一部分用于自動(dòng)駕駛。這意味著(zhù),你可以在一臺計算機上同時(shí)運行汽車(chē)底層的Linux,輔助駕駛的QNX,智能座艙的安卓等多個(gè)操作系統,真正做到了1顆芯片當6顆用。

頂配12999元的RTX 40系列、算力2000 TOPS的自動(dòng)駕駛芯片……英偉達「狂秀肌肉」

而為了加快芯片之間的數據傳輸,英偉達也在Thor中集成了最初為數據中心應用開(kāi)發(fā)的NVLINK連接。

Jetson Orin Nano:微型機器人系統級模塊,速度提升80倍

硬件方面,除了最新消費級GPU RTX 40系列、全新自動(dòng)駕駛芯Thor,英偉達還帶來(lái)了一款微型機器人系統級模塊芯片Jetson Orin Nano。

頂配12999元的RTX 40系列、算力2000 TOPS的自動(dòng)駕駛芯片……英偉達「狂秀肌肉」

依據介紹,相較于3月份發(fā)布的Jetson Nano,Jetson Orin Nano的性能大幅提升了約80倍,但是價(jià)格相對較低,很可能成為入門(mén)級AI邊緣設備和機器人開(kāi)發(fā)的新標準。

Orin Nano能夠以迄今為止最小的 Jetson 外形尺寸提供高達40 TOPS,采用與英偉達先前宣布的Orin NX兼容的模塊,支持具有Ampere架構GPU的AI應用程序管道。

該產(chǎn)品共提供2個(gè)版本,售價(jià)199美元起:

Orin Nano 8GB,提供高達 40 TOPS 的功率,功率可配置為 7W 至 15W;

Orin Nano 4GB,提供高達 20 TOPS 的功率選項,功率選項低至 5W 至 10W。

最后

整場(chǎng)發(fā)布會(huì ),英偉達在產(chǎn)品展示上依舊是穩定輸出,也再一次向外界告知,英偉達已經(jīng)不僅僅是一家GPU公司,其業(yè)務(wù)早已遍布多個(gè)領(lǐng)域,并在其中的多個(gè)站到了頭部的位置。

只不過(guò)近一段時(shí)間以來(lái),圍繞英偉達也是壞消息不斷,比如自動(dòng)駕駛頭部企業(yè)Cruise宣布著(zhù)手自研自動(dòng)駕駛芯片,更是一口氣開(kāi)發(fā)四種,背后原因,則是為了降低外購芯片的成本。對于英偉達來(lái)說(shuō),這并不是一個(gè)好消息。

與此同時(shí),曾經(jīng)親密的合作伙伴、被外界視為英偉達“親兒子”的EVGA宣布與其終止合作,不再生產(chǎn)新顯卡,又比如以太坊合并,終結了大規模顯卡挖礦時(shí)代,這一波攻勢下,新顯卡的銷(xiāo)量有待后面市場(chǎng)的考驗。其漲價(jià)的背后,不知是不是也有著(zhù)想消耗舊顯卡庫存的考量。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到