推理芯片蓄勢待發(fā),瀚博半導體發(fā)布首款高性能超低延時(shí)通用云端推理AI芯片 | WAIC 2021

IM2Maker 4年前 (2021-07-07)

瀚博半導體于今日在2021世界人工智能大會(huì )期間發(fā)布其首款云端通用AI推理芯片SV100系列及VA1通用推理加速卡。

今年上半年國家發(fā)布“十四五規劃”,特別指出要“瞄準人工智能、量子信息、集成電路等前沿領(lǐng)域。作為新一輪產(chǎn)業(yè)變革的核心驅動(dòng)力,人工智能相關(guān)技術(shù)和應用正呈現快速發(fā)展的趨勢。

聚焦到人工智能芯片,數據顯示,2021年開(kāi)始,數據中心對于人工智能推理芯片的需求逐漸超越對于訓練芯片的需求,整個(gè)推理市場(chǎng)蓄勢待發(fā)。而且,隨著(zhù)模型訓練逐漸成熟,AI應用逐漸落地,市場(chǎng)差距還會(huì )越來(lái)越大。

在此背景之下,瀚博半導體于今日在2021世界人工智能大會(huì )期間發(fā)布其首款云端通用AI推理芯片SV100系列及VA1通用推理加速卡,可實(shí)現深度學(xué)習應用超高性能、超低延時(shí)的推理性能,可顯著(zhù)降低數據中心與邊緣智能應用的部署成本。

云端通用AI推理芯片SV100系列

據介紹,此次發(fā)布的瀚博SV100系列芯片,單芯片INT8峰值算力超200 TOPS,深度學(xué)習推理性能指標數倍于現有主流數據中心GPU,具有超高吞吐率、超低延時(shí)的特性。

SV100系列芯片支持FP16, BF16和INT8等數據格式,并可以實(shí)現眾多主流神經(jīng)網(wǎng)絡(luò )的快速部署及計算機視覺(jué)、視頻處理、自然語(yǔ)言處理和搜索推薦等多樣化推理應用場(chǎng)景。

同時(shí)集成高達64路以上H.264/H.265/AVS2的1080p視頻解碼,廣泛適用于云端與邊緣智能應用場(chǎng)景,提升客戶(hù)的設備資產(chǎn)效益、降低運營(yíng)成本。

VA1推理加速卡

與此同時(shí),瀚博同步推出的基于SV100系列芯片的VA1推理加速卡,為單寬半高半長(cháng)75瓦PCIe x16卡,支持32GB內存和PCIe 4.0高速接口協(xié)議,無(wú)需額外供電,即可適用于所有廠(chǎng)商的人工智能服務(wù)器,實(shí)現數據中心高密度高算力部署。

關(guān)于為什么要聚焦于視頻方向,瀚博半導體創(chuàng )始人兼CEO錢(qián)軍表示:“計算機視覺(jué)占了AI市場(chǎng)的大半壁的江山,視頻流占整個(gè)數據流的70%,對于視頻提供的龐大數據,需要強大的AI算力支持。”

如何判斷AI的性能?可以從LTE三個(gè)方面來(lái)看,分別是指Latency延時(shí)、Throughput吞吐量和Energy Efficiency低功耗。

對此,錢(qián)軍表示:“瀚博通過(guò)前期核心技術(shù)積累和前瞻性布局,正式發(fā)布我們性能優(yōu)異的SV100系列云端通用AI推理芯片和VA1推理卡,可有效應對低延時(shí)、通用性和視頻處理等方面的行業(yè)痛點(diǎn),推進(jìn)云端與邊緣的智能應用落地。”

據悉,SV100系列及VA1通用推理加速卡預計將于今年四季度量產(chǎn)上市。

關(guān)于瀚博半導體

瀚博半導體2018年12月成立于上海,在北京、深圳和多倫多均有研發(fā)分部。公司核心員工來(lái)自世界頂級的高科技公司,平均擁有15年以上的相關(guān)芯片與軟件設計經(jīng)驗。公司目前擁有200人以上的資深團隊,且規模還在快速增長(cháng)中。瀚博半導體致力于成為驅動(dòng)云邊計算的算力源泉、中國芯片設計企業(yè)的標桿和世界芯片設計的領(lǐng)導者之一。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到