特斯拉FSD即將入華,新版本強在哪里? | 研報推薦
注:原文為太平洋證券《特斯拉的FSD時(shí)刻》,分析師:劉虹辰
在智能駕駛領(lǐng)域,特斯拉FSD基本代表著(zhù)全球的最先進(jìn)水平。隨著(zhù)FSD在國內的解禁,國內廠(chǎng)商們將迎來(lái)一次新的挑戰。
本月初,特斯拉長(cháng)達三年的 FSD Beta 測試計劃似乎已經(jīng)結束,這一變化體現在其最新版本更新說(shuō)明中,其將原先的“FSD Beta”更名為了“FSD (Supervised)”。
Supervised 是“監督”的意思,而這正是FSD的核心。
那么從測試版轉正,新版本的FSD究竟強在哪里?
在名為《特斯拉的FSD時(shí)刻》的行業(yè)深度報告里,分析師從三個(gè)核心邏輯的角度介紹了FSD新版本更新內容。
以下為研報內容節選:
特斯拉如何迎來(lái)FSD時(shí)刻?
1、端對端NN重塑FSD
2024年3月,特斯拉先后推出FSD(Beta)12.3.2、12.3.2.1以及最新的FSD(Supervised)12.3.3版本。
相比較于FSD 11,FSD v12創(chuàng )新性地采用了端對端的神經(jīng)網(wǎng)絡(luò )技術(shù)(端對端NN),可以更好地理解和處理復雜駕駛環(huán)境,減少駕駛人員的干預,提高自動(dòng)駕駛的精確度和自動(dòng)化度。
感知-決策-執行是FSD的基本流程,在v11中,感知階段需要通過(guò)視覺(jué)方式/雷達方式獲取周?chē)矬w信息并識別和標識分類(lèi),決策階段則依賴(lài)于事先認為編寫(xiě)好的控制規則。
但是v12采用了端對端NN技術(shù),感知階段不再需要識別和標識,決策階段也不需要事先人為編寫(xiě)控制規則,只需要輸入大量視頻交給NN學(xué)習,就能分辨出在不同情況下需要做什么,這使得特斯拉在FSD V12中減少了100倍代碼,使其更輕便、更靈活,同時(shí)在沒(méi)有網(wǎng)絡(luò )連接的情況下仍能在不熟悉的地形上工作。
目前,v12在北美的已經(jīng)適配裝備HW4.0的modelS、3、X和Y,在中國地區目前只有Model Y可以升級到HW4.0。
Y可以升級到HW4.0。相比HW3.0,HW4.0在算力、攝像頭數量和清晰度等方面具有大幅度的提升。攝像頭為8個(gè),算力提升5倍,素有攝像頭像素由120萬(wàn)提升至500萬(wàn)。
目前,特斯拉FSD累計里程指數級增長(cháng)超10億英里,劍指百億公里。
2、新版Autopark不依賴(lài)USS
新版的Autopark(泊車(chē)功能)基于與FSD v12相同的NN技術(shù),不再依賴(lài)USS(超音波雷達):自2022年特斯拉放棄USS而改用攝像頭以來(lái),未裝備USS的新特斯拉的Autopark和Summon功能給用戶(hù)帶來(lái)的體驗感遠不如裝備USS的車(chē)輛。
之前版本的Autopark具有兩大主要缺陷:1)很難檢測停車(chē)位并將其顯示在屏幕上,而且一次只能顯示一個(gè)停車(chē)位。2)停車(chē)速度通常非常慢,如果周?chē)衅渌?chē)輛,幾乎很難完成自動(dòng)泊車(chē)。
而新的Autopark基于NN技術(shù),顯著(zhù)改善了這兩個(gè)問(wèn)題,停車(chē)速度更快,不僅可以在顯示屏上勾勒出停車(chē)位,還可以同時(shí)顯示各種停車(chē)位-包括平行空間。此外,這次升級,特斯拉真正實(shí)現了一鍵泊車(chē)(TaptoPark),當駕駛員選擇好停車(chē)位后,點(diǎn)擊“開(kāi)始按鈕”,特斯拉的車(chē)輛能夠安全地倒車(chē)進(jìn)入停車(chē)位,駕駛人員只需要保持關(guān)注并隨時(shí)準備在必要時(shí)取消自動(dòng)停車(chē)操作即可,大幅度降低了人為干預需要、提升用戶(hù)體驗。
3、HW4.0芯片算力大幅提升
芯片改用更先進(jìn)制程:HW4.0 FSD芯片采用三星7nm工藝,HW3.0為三星14nm工藝,新的自動(dòng)駕駛芯片性能將是現款自動(dòng)駕駛芯片的5倍左右。
攝像頭或升級:攝像頭數量或從9個(gè)減少到8個(gè),但是攝像頭的清晰度從120萬(wàn)像素提升到500像素,這使得HW4.0具有比3.0更強的感知能力,最遠探測距離可達424米,掃除盲區和死角。
預留雷達接口:HW4.0預留了裝備雷達的空間,但是modelY在出廠(chǎng)時(shí)并不具備雷達功能,這可能與特斯拉更加偏好視覺(jué)方案、降低車(chē)輛出廠(chǎng)成本等因素有關(guān),同時(shí)也為用戶(hù)提供了一定的選擇空間。
CPU內核數量提升66.67%,FSD Computer2數量增加到3個(gè):CPU方面,HW4.0由3.0的12核,提升到了20核,內核數量提升66.67%。計算平臺方面,雖然HW4.0仍然采用的是FSDComputer2,但是數量卻增加到了3個(gè)。
背后的核心邏輯
1、特斯拉引領(lǐng)技術(shù)路徑收斂
1)特斯拉引領(lǐng)BEV+Transformer
2021年7月AI DAY,特斯拉首次展示基于Transformer的BEV感知方案,是大模型首次用于自動(dòng)駕駛,實(shí)時(shí)感知生成向量空間。
2)特斯拉Occupancy感知引領(lǐng)華為、理想跟隨
2022年10月AI DAY,特斯拉Occupancy感知進(jìn)化,不識別類(lèi)別也能判斷物體運動(dòng)狀態(tài),引領(lǐng)華為GOD、理想Occupancy跟隨。
3)TeslaLane感知車(chē)道拓撲,理想提前提取復雜路口特征
4)大模型自動(dòng)標注效率是人工的1000-45000倍
5)特斯拉Dojo投產(chǎn),國內廠(chǎng)商建設超算中心
2、大模型催化FSD時(shí)刻
1)大模型蒸餾有望解決車(chē)端算力不足帶來(lái)效果欠佳問(wèn)題
車(chē)端計算資源有限難以部署大模型,導致推理效果和泛化性能欠佳:通常來(lái)說(shuō),規模較大的模型預測效果更好,但訓練時(shí)間長(cháng)、推理速度慢的問(wèn)題使得模型難以實(shí)時(shí)部署,尤其在自動(dòng)駕駛汽車(chē)等計算資源有限的設備上,響應速度顯然不夠用。規模較小的模型雖然推理速度較快,但是因為參數量不足,推理效果和泛化性能沒(méi)那么好。
大模型知識蒸餾給小模型,可以實(shí)現更優(yōu)的性能:知識蒸餾(knowledgedistillation)是模型壓縮的一種常用方法,通過(guò)構建一個(gè)輕量化的小模型,利用性能更好的大模型的監督信息來(lái)訓練這個(gè)小模型,以期達到更好的性能和精度。目標檢測是計算機視覺(jué)中的一個(gè)重要任務(wù),知識蒸餾可以在不增加其計算消耗的前提下提升其表現。
2)生成式AI有望高效低價(jià)提供高質(zhì)量訓練數據
生成式AI可以生成廉價(jià)的海量訓練數據和極端駕駛場(chǎng)景,高效地批量生產(chǎn)自動(dòng)駕駛模型訓練開(kāi)發(fā)所需的海量數據。
3)大模型賦能智駕GPT:“語(yǔ)言+視覺(jué)+雷達+地圖+定位”或將賦能多模態(tài)感知
3)BOM成本下降
1)特斯拉FSD引領(lǐng)無(wú)圖城市NOA重新定義智能汽車(chē)。
特斯拉率先定義,引領(lǐng)國內新勢力布局不依賴(lài)高精地圖的城市NOA,當前量產(chǎn)方案處于有圖向無(wú)圖的過(guò)渡期。
特斯拉率先推送高速NOA:特斯拉于2016年10月率先推出高速NOA(Navigate on Autopilot)功能,定義了高級自動(dòng)駕駛的進(jìn)階方向。2020年末起,蔚來(lái)、小鵬、理想相繼向客戶(hù)推送高速NOA。
城市NOA重新定義智能汽車(chē):特斯拉于2020年10月,首次向早期訪(fǎng)問(wèn)程序測試人員發(fā)布了其FSDBETA測試版,支持在城市道路使用NOA,標志著(zhù)汽車(chē)智能水平的重新定義。
2)成本下探:24/25年L2+/L3智能駕駛BOM成本有望下降50%
分析師認為,自動(dòng)駕駛BOM成本有望大幅降低。
一是從華為ADAS系統的變化可見(jiàn)(v1.0 vs v2.0),傳感器配置從3顆激光雷達減至1顆激光雷達,前視攝像頭減少2顆,毫米波雷達從6顆減至3顆,未來(lái)車(chē)企有望從依賴(lài)多顆激光雷達轉換至“純視覺(jué)感知+1顆激光雷達監督”。二是車(chē)企從依賴(lài)高成本的高精地圖轉變到依托邊際成本低的感知模型。
根據何小鵬,2024年小鵬自動(dòng)駕駛Bom成本將下降一半。
大疆車(chē)載認為L(cháng)2+智能駕駛系統的總成本(軟件+硬件)占整車(chē)售價(jià)在3%~5%是合理的,認為未來(lái)合理L2+智能駕駛系統成本區間在5000元到15000元。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新