英偉達發(fā)布新一代自動(dòng)駕駛芯片Orin、深度學(xué)習推理引擎TensorRT 7,GPU已賣(mài)15億塊

巫盼 6年前 (2019-12-18)

今年的英偉達GTC,黃仁勛都說(shuō)了啥?

今天,英偉達GTC大會(huì )在蘇州召開(kāi),黃仁勛再次一身皮衣亮相,口頭禪從去年的買(mǎi)買(mǎi)買(mǎi),變?yōu)?ldquo;The more you buy,The more you save”,兩個(gè)多小時(shí)的主題演講中,“推銷(xiāo)”了從云端到邊緣各個(gè)不同場(chǎng)景下的軟硬件產(chǎn)品。

現場(chǎng),黃仁勛系統地介紹了各個(gè)軟件平臺的新進(jìn)展,并發(fā)布了面向自動(dòng)駕駛的新一代處理器Orin,以及“實(shí)現最大飛躍”的深度學(xué)習編譯器TensorRT 7。

從云到邊緣,英偉達的新重點(diǎn)

從AlexNet到BERT,計算機實(shí)現從圖像到自然語(yǔ)言處理上的突破。而AI也正在從云端擴展到邊緣計算端。

從云到邊緣,英偉達正在為了每個(gè)場(chǎng)景打造一個(gè)平臺,包括用于訓練的DGX,用于超大規模云的HGX,用于邊緣的EGX,以及用于終端的AGX。

以面向終端的AGX為例,自動(dòng)駕駛和機器人是英偉達的兩個(gè)重點(diǎn)。

· 自動(dòng)駕駛:發(fā)布DRIVE AGX Orin

現場(chǎng),英偉達發(fā)布了用于自動(dòng)駕駛和機器人的軟件定義平臺——NVIDIA DRIVE AGX Orin。該平臺內置全新Orin系統級芯片,Orin由170億個(gè)晶體管組成,集成了NVIDIA新一代GPU架構和Arm Hercules CPU內核以及全新深度學(xué)習和計算機視覺(jué)加速器,每秒可運行200萬(wàn)億次計算,是上一代Xavier系統級芯片性能的7倍。

Orin可處理在自動(dòng)駕駛汽車(chē)和機器人中同時(shí)運行的大量應用和深度神經(jīng)網(wǎng)絡(luò ),并且達到了ISO 26262 ASIL-D等系統安全標準。

值得注意的是,Orin支持可編程,并且有豐富的工具和軟件庫支持,與之前的Xavier處理器兼容,支持從L2到L5級別的自動(dòng)駕駛。

而且由于Orin和Xavier均可通過(guò)開(kāi)放的CUDA、TensorRT API及各類(lèi)庫進(jìn)行編程,因此開(kāi)發(fā)者能夠在一次性投資后使用跨多代的產(chǎn)品。

英偉達創(chuàng )始人兼首席執行官黃仁勛表示:“打造安全的自動(dòng)駕駛汽車(chē),也許是當今社會(huì )所面臨的最大計算挑戰。實(shí)現自動(dòng)駕駛汽車(chē)所需的投入呈指數級增長(cháng),面對復雜的開(kāi)發(fā)任務(wù),像Orin這樣的可擴展、可編程、軟件定義的AI平臺不可或缺。”

硬件之外,英偉達還發(fā)布了一套使用主動(dòng)學(xué)習、聯(lián)邦學(xué)習和遷移學(xué)習來(lái)訓練深度神經(jīng)網(wǎng)絡(luò )的工具。以聯(lián)邦學(xué)習為例,可以讓多個(gè)組織和公司在不移動(dòng)或共享數據的情況下進(jìn)行合作,英偉達將訓練模型發(fā)送給各個(gè)合作伙伴,每個(gè)合作伙伴在自己的數據上訓練模型。

現場(chǎng),英偉達宣布和滴滴達成合作,滴滴將使用NVIDIA GPU和其他技術(shù)開(kāi)發(fā)自動(dòng)駕駛和云計算解決方案。

· 機器人:發(fā)布全新Isaac SDK

今年3月的GTC會(huì )議上,英偉達就著(zhù)重強調了機器人業(yè)務(wù)。今天,黃仁勛在現場(chǎng)發(fā)布了全新版本Isaac軟件開(kāi)發(fā)套件(SDK),為機器人提供更新的AI感知和仿真功能。

Isaac SDK包括Isaac Robotics Engine(提供應用程序框架),Isaac GEM(預先構建的深度神經(jīng)網(wǎng)絡(luò )模型、算法、庫、驅動(dòng)程序和API),用于室內物流的參考應用程序以及訓練機器人Isaac Sim的第一個(gè)版本(提供導航功能)。

為了加快AI機器人的開(kāi)發(fā)速度,全新Isaac SDK包括各種基于攝像頭的感知深度神經(jīng)網(wǎng)絡(luò ),包括:

對象檢測——識別用于導航、交互或操控的對象;

自由空間分割——檢測和分割外部世界,例如確定人行道在哪里,以及機器人可以在哪里行駛;

3D姿態(tài)估計——了解目標的位置和方向,從而實(shí)現諸如機械臂拾取物體的任務(wù);

2D人體姿態(tài)估計——將姿態(tài)估計應用于人,這對于與人互動(dòng)的機器人(例如配送機器人)和協(xié)作機器人(專(zhuān)門(mén)設計用于與人合作)非常重要。

以新推出Isaac Sim機器人為例,它可以將所生成的軟件部署到在現實(shí)世界中運行的真實(shí)機器人中。通過(guò)仿真,開(kāi)發(fā)人員可以在極端情況下(即困難或異常情況下)對機器人進(jìn)行測試,以進(jìn)一步加強對它的訓練。這有望大大加快機器人的開(kāi)發(fā)速度,從而實(shí)現綜合數據的訓練。

另外,Isaac SDK還支持多機器人仿真。這使開(kāi)發(fā)人員可以將多個(gè)機器人放入仿真環(huán)境中進(jìn)行測試,以便它們學(xué)會(huì )彼此相關(guān)的工作。

發(fā)布TensorRT 7,減少會(huì )話(huà)AI推理延遲

英偉達在去年的GTC China上發(fā)布了支持自動(dòng)低精度推理的TensorRT 5,今天英偉達發(fā)布了TensorRT 7,內置新型深度學(xué)習編譯器,支持各種類(lèi)型的RNN、CNN和Transformer,相較于TRT 5只支持30種變換,TRT 7可以支持1000多種不同的計算變換和優(yōu)化。

TRT 7可為開(kāi)發(fā)者設計的大量RNN配置自動(dòng)生成代碼,逐點(diǎn)融合LSTM單元,甚至可跨多個(gè)時(shí)間步長(cháng)進(jìn)行融合,并且盡可能做自動(dòng)低精度推理。

借助TRT 7,全球各地的開(kāi)發(fā)者都可以實(shí)現會(huì )話(huà)式AI應用,大幅減少推理延遲。舉個(gè)例子,通常情況下,一套端到端的自然語(yǔ)言理解流程可能由幾十種模型構成,比如RNN、CNN、自編碼器等等,TRT 7可對所有模型進(jìn)行編譯,使其在英偉達GPU上運行?;谟ミ_T4的推理會(huì )話(huà)AI只需要0.3秒,而CPU的推理延遲卻高達3秒。

GPU加CUDA,從火星著(zhù)陸到基因測序,無(wú)所不能

如今,英偉達已經(jīng)售出了15億塊GPU,在使用的每塊GPU都兼容CUDA。英偉達的CUDA平臺具有豐富的庫、工具和應用程序。僅在去年,英偉達發(fā)布了500多個(gè)SDK和庫,通過(guò)優(yōu)化軟件棧,英偉達提高了GPU的性能,讓深度學(xué)習訓練在三年內提高了4倍,深度學(xué)習推理在一年內提高了2倍。

HPC應用方面,NASA在英偉達GPU上通過(guò)FUN3D軟件運行火星著(zhù)陸情景模擬,產(chǎn)生高達150TB的數據,英偉達借助DGX-2上運行的Magnum IO GPU Direct Storage技術(shù),可“實(shí)時(shí)”對這些數據進(jìn)行可視化處理。

另外,由于GPU的訓練成本只有傳統CPU的十分之一,并且可支持更大規模的模型訓練,英偉達發(fā)布了深度推薦系統,百度以及阿里均有采用。

CUDA方面,英偉達發(fā)布了由CUDA加速的Parabricks基因組分析工具包,可實(shí)現30到50倍的加速,目前華大基因已經(jīng)采用Parabricks來(lái)進(jìn)行基因變異檢測,除此之外,CUDA新增加了對5G vRAN應用的支持。

和騰訊合作,推出云游戲服務(wù)

在游戲方面,微軟出品的游戲《我的世界》支持RTX,可以實(shí)時(shí)完成預烘焙全局光線(xiàn)和一般反射的燈光效果。同時(shí),黃仁勛還宣布了其他6款GeForce RTX 游戲。

隨著(zhù)谷歌、微軟入局云游戲,英偉達也將眼光投向了云游戲,現場(chǎng)英偉達宣布與騰訊合作推出START云游戲服務(wù),由英偉達提供GPU支持。

硬件方面,英偉達為PC筆記本提供的Max-Q設計,可將高性能GPU集成到輕薄筆記本中,數據顯示,今年,GeForce RTX MAX 筆記本電腦是增長(cháng)速度最快的游戲平臺。

3D內容創(chuàng )作上,黃仁勛介紹了英偉達的OMNIVERSE的進(jìn)展,發(fā)布面向建筑行業(yè)(AEC)的OMNIVERSE,在工作流中增加實(shí)時(shí)協(xié)作功能。

最后:

這一年,英偉達也明顯越來(lái)越重視邊緣以及端側產(chǎn)品,也一改以往售賣(mài)硬件“又貴又大”的規則,推出了性?xún)r(jià)比超高、便宜好用的小型嵌入式芯片產(chǎn)品。

曾經(jīng)主導云端AI芯片市場(chǎng)的英偉達,在面對競爭對手的突圍后,正在用云端加邊緣一體化的解決方案吸引更多客戶(hù),并且愈加強調他們在軟硬件上的優(yōu)勢。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到