在剛結(jié)束的CES上,,車載計算芯片成為了展會的重頭戲,,汽車自動駕駛成為了行業(yè)巨頭爭奪的熱門市場,。安霸也發(fā)布了其搭載最新一代CVflow架構(gòu)的汽車域控制器芯片——CV3系列,。本文從CV3出發(fā),,看到當(dāng)前汽車域控制器的市場需求和走向,;以及如何在市場發(fā)展前期多樣化的局面下,把握車載計算芯片的專用性和通用性的平衡,。
從L2+到L4:多路徑,、百花齊放
當(dāng)前的智能汽車的ADAS處在蓬勃發(fā)展的階段,正在實現(xiàn)從L2+到L4的邁進,。SAE將L0~L2級定義為駕駛輔助類,,L3~L5級定義為自動駕駛類。在當(dāng)前的自動駕駛發(fā)展階段,,目前既有特斯拉蔚來這種新勢力車廠,、也有谷歌百度這種大型IT公司、也有亞馬遜阿里這樣的云服務(wù)商,、也有福特大眾傳統(tǒng)車企,、也有小米蘋果這樣的消費類廠商。從不同的定位,、不同的落地場景和不同的技術(shù)儲備出發(fā),,也就有著不同的考量,,所以ADAS當(dāng)前的技術(shù)路線也呈現(xiàn)多樣性。到車載計算芯片的定義上,,PPA雖然是一致的追求,,但具體的架構(gòu)、片上接口資源和特性等也就各不相同,。不同的芯片廠商例如高通,、TI、英偉達等,,結(jié)合自己對于ADAS應(yīng)用的理解,,也就開發(fā)出了不一樣的產(chǎn)品。
圖:SAE給出的六個自動駕駛級別
“關(guān)于自動駕駛的產(chǎn)業(yè)生態(tài),,尤其是在中國,,會有多種發(fā)展路徑。很多家公司因為它落地場景不一樣,,對成本要求不一樣,,會采取非常不一樣的路徑?!卑舶灾袊鴧^(qū)總經(jīng)理馮羽濤分享到,,“有非常多的公司采取了不同的發(fā)展路徑,有一些是直接進入全自動駕駛的方向,,它會跳過前面部分,。大家常用的自動駕駛L1、L2的分級,,后面直接研發(fā)到全自動駕駛,,但是也有很多公司會采取逐漸發(fā)展的方式,多種路徑在國內(nèi)都會存在,,而且在快速發(fā)展期會非常多樣化,。”所以,,在這個蓬勃發(fā)展的初期過程,,各個公司的智能駕駛方案的會從其落地場景出發(fā),平衡其傳感器配置以及系統(tǒng)整體成本,。
圖源:Yole
在市場和行業(yè)的當(dāng)前發(fā)展階段,,沒有強合作綁定關(guān)系的汽車計算芯片的廠商,在進行自己的產(chǎn)品定義的時候,,需要在ADAS專用的前提下,,架構(gòu)上有一定的張力,也就是通用性,,保證能夠適應(yīng)各種不同的技術(shù)路線,,不同的ADAS處理算法,。這也就是安霸最新的CV3系列芯片的定義出發(fā)點,馮羽濤表示,,“ 安霸作為芯片供應(yīng)商,,我是希望能夠服務(wù)于所有的這些自動駕駛廠商。所以我們對自動駕駛的判斷就像我開篇說的,,我覺得會多種發(fā)展路徑,,多傳感器感知融合,這也是CV3的設(shè)計思路,?!?/p>
汽車計算芯片——算法為先優(yōu)化架構(gòu)
在ADAS興起之前,汽車上對于圖像和視頻的采集最終都是需要人來觀看處理,,ISP相關(guān)技術(shù)是關(guān)鍵,。所以安霸最初涉足汽車電子領(lǐng)域,專注行車記錄儀和電子后視鏡等圖像和視頻處理芯片,,當(dāng)時的“算法優(yōu)先”考慮于處理好顏色,、對比度和清晰度等細節(jié)。在這個階段,,安霸就開始奉行“算法優(yōu)先”的理念,,A12、H22和H32芯片架構(gòu)非常適合這些圖像處理的算法需求,,這也是其在這一領(lǐng)域首先取得成功的關(guān)鍵原因,。
而后隨著駕駛輔助應(yīng)用的興起,AI視覺感知技術(shù)成為了關(guān)鍵,。AI視覺感知對于算法的依賴程度更高,,為了實現(xiàn)更高的計算效率,需要架構(gòu)與算法實現(xiàn)更緊密的耦合,。安霸于2015年收購了有著25年自動駕駛經(jīng)驗的VisLab公司,深入了解自動駕駛汽車的算法對于芯片的需求,,做出適應(yīng)更多算法和自動駕駛的AI加速硬件架構(gòu)CVflow,,這一架構(gòu)下的產(chǎn)品有CV2x系列、CV2FS系列和CV5系列,。而后又在2021年收購了傲酷,,這是一家全球領(lǐng)先的4D成像雷達算法公司,可以用較少的硬件資源達到非常清晰的雷達成像,。通過對傲酷的算法吸收,,安霸在雷達感知與視覺融合算法有了更深入的理解。通過這些一系列的在視覺,、雷達等傳感器數(shù)據(jù)處理算法上的積累和沉淀,,安霸在此次CES上推出了搭載新一代CVflow架構(gòu)的CV3系列,,實現(xiàn)ADAS專用的同時又保證了算法的通用性,布局汽車AI域控制器領(lǐng)域,。
因為是專門為算法優(yōu)化的架構(gòu),,所以不能單純的看TOPS這一參數(shù),安霸的芯片在算力表達上有所不同,,從CV2x系列產(chǎn)品開始就用“eTOPS”來表示,。e代表著Equivalent,也就是等效TOPS的意思,。將同一個神經(jīng)網(wǎng)絡(luò)運算,,跑在CVflow架構(gòu)的芯片上和跑在GPU上來進行對比。如果能把相同的神經(jīng)網(wǎng)絡(luò)算法跑到等效的這么快,,就叫做Equivalent TOPS,,簡稱eTOPS。這是源自專用的CVflow更接近系統(tǒng)表現(xiàn)的算力的一種表達,。
單芯片域控制器CV3:高算力,、雷達和視覺原始數(shù)據(jù)融合
新一代的CV3為單芯片域控制器,首發(fā)的型號為最高性能的旗艦版,,后續(xù)會在旗艦版的基礎(chǔ)上陸續(xù)推出新的低成本型號,。CV3采用了和CV5相同的5nm 低功耗制程,內(nèi)置了16個Arm Cortex-A78AE內(nèi)核,,搭載了新一代的CVflow架構(gòu),,AI算力高達500 eTOPS,比CV2 系列提高了42 倍,,每瓦性能比提高了4倍,。單芯片集成多傳感器進行集中化AI 感知處理(包括高像素視覺處理、毫米波雷達,、激光雷達和超聲波雷達),、多傳感器深度融合以及自動駕駛車的路徑規(guī)劃。
新一代的CVflow中包含NVP和GVP兩個向量處理器,,從命名就可以看出,,一個是專門做神經(jīng)網(wǎng)絡(luò)的向量處理,一個是通用的向量處理,。NVP針對4bit,、8bit、16bit這種定點運算有著專門的優(yōu)化,。GVP對16bit,、32bit浮點運算的支持比較好。據(jù)馮羽濤分享,,新一代CVflow的設(shè)計思路來自于和當(dāng)前行業(yè)客戶的深入溝通,。目前很多客戶的算法是混合的,,既有傳統(tǒng)算法,也有神經(jīng)網(wǎng)絡(luò)的算法,。定點運算和浮點運算需求混合存在,,所以針對不同的需求設(shè)計了不同的向量處理資源,來實現(xiàn)更高效率的處理,。例如最近非常流行的Transformer網(wǎng)絡(luò),,需要的運算就是直接的多維向量矩陣乘法,這種計算需求在NVP上處理的效率就會高很多,,安霸也在NVP中對這一網(wǎng)絡(luò)進行了專門的硬件支持,。此外,CVflow的靈活性不僅僅體現(xiàn)在針對不同計算需求的處理上,,在整個CV3的產(chǎn)品map里,, 也可以通過調(diào)整CVflow中NVP和GVP的數(shù)量,來調(diào)整芯片的計算資源,,結(jié)合其他的芯片資源的調(diào)整,,實現(xiàn)產(chǎn)品型號由高到低的布局。
CV3的另一個特點在于可以將雷達數(shù)據(jù)和視頻數(shù)據(jù)在原始的數(shù)據(jù)集上進行處理,,實現(xiàn)傳感器數(shù)據(jù)的深度融合計算,。這也是行業(yè)內(nèi)傳感器融合的一個發(fā)展趨勢,在前端完成原始數(shù)據(jù)的分析,、學(xué)習(xí)和融合處理,。
據(jù)安霸中國區(qū)市場營銷副總裁郄建軍分享,在視頻和雷達的融合方面,,一般的做法都是“后融合”或目標級融合,。而在CV3芯片里就可以做“前融合”,也就是視頻的像素和雷達的點云做原始數(shù)據(jù)級的融合,。這種融合的挑戰(zhàn)在于處理的數(shù)據(jù)量很大,,處理的實時性要求更高。需要保證點云和像素對位準確,,時空同步做的非常好,。CV3上的這種“前融合”會使感知的整體性能包括置信度大幅度提升,誤檢率,、漏檢率大幅度下降。CV3中結(jié)合了傲酷的4D成像雷達算法,,在和視頻做前融合以后,,整體性能可以做到類似低線束激光雷達的效果,在某種程度上可以取代低線束激光雷達,。
從CV2的4核A53到CV3的16核A78AE(4個集群),,是跟進Arm架構(gòu)的升級,,響應(yīng)某些用戶對于傳統(tǒng)算法和算力提升的需求。采用四個集群的設(shè)計,,也是從系統(tǒng)開發(fā)的角度出發(fā),,可以分別在不同的集群上部署不同的功能,實現(xiàn)更為獨立的軟件開發(fā),。結(jié)合CV3支持20個攝像頭的接入,,這些特性對于有“硬件預(yù)埋”需求的廠商而言,也是非常必要的,,保證一定的硬件資源冗余,。
總結(jié)
當(dāng)安霸在2015年收購VisLab的時候,VisLab自己做的自動駕駛demo車里,,后備箱里滿滿的PC處理器,。當(dāng)時安霸就想到,下一代能夠用一顆芯片取代這滿滿一后備箱的PC處理器,,達到同樣的計算能力?,F(xiàn)在CV3的出現(xiàn),單芯片高算力,、前置雷達和視覺原始數(shù)據(jù)融合,、靈活的CVflow架構(gòu)、4集群16核的通用計算能力…已經(jīng)將這一愿景達成,。
在當(dāng)前百舸爭流的ADAS賽道上,,既要做ADAS算法專用的芯片,架構(gòu)上優(yōu)化算法 ,,堅持算法優(yōu)先策略,;又要考慮各家不同算法的需求、不同傳感器的需求,、實現(xiàn)一定的通用性,。CV3的出現(xiàn),可以幫助不同類型的玩家,,讓ADAS從L2+到L4的發(fā)展更加精彩,。