說到AI芯片領(lǐng)域,,最近的一件大事是,,10月13日地平線和大眾旗下軟件公司CARIAD官宣合作。雙方成立合資企業(yè),,CARIAD控股60%,,投資約24億歐元,預(yù)計會在2023年上半年完成,。
這算是地平線迄今為止最重磅的一個合作,。而一個插曲是,半年前地平線才宣布第三代產(chǎn)品征程5芯片首個定點合作,,花落比亞迪,,上車時間2023年。不過,,有意思的是,,比亞迪同時也將投產(chǎn)搭載英偉達(dá)DRIVE Orin計算平臺的車型,。
而公社C次元最近一篇文章《英偉達(dá)不要的,地平線都要》,,對地平線和英偉達(dá)在汽車領(lǐng)域AI芯片應(yīng)用的競爭情況也做了介紹,,所以,這篇我們就科普科普,,到底這兩家企業(yè)競爭些什么,,以及車企的選擇背后是怎樣的考慮?
都是AI芯片,,有啥不一樣,?
論及雙方,他們的產(chǎn)品都是用于自動駕駛領(lǐng)域的AI芯片,。但是區(qū)別還是很大的,。
AI芯片的應(yīng)用場景,主要分為云端和終端,,還有邊緣端,。目前,云端應(yīng)用的更多,,相對成熟,。此外,云端應(yīng)用又可分為訓(xùn)練和推理兩種,,其中訓(xùn)練的市場規(guī)模占比較高,。
云端應(yīng)用的霸主,就是英偉達(dá),。而云端(服務(wù)器,、數(shù)字中心)和終端(手機(jī)、智能汽車等移動端)應(yīng)用場景中,,AI芯片的運算方式有著本質(zhì)性的差別,。
比如,云端處理大批量一次性到達(dá)的累積數(shù)據(jù)(擴(kuò)大批處理量,,batch size),,可以“等”數(shù)據(jù)“夠了”再開始處理。但車端芯片則需要處理流數(shù)據(jù),,隨著行駛(時間)陸續(xù)到來的數(shù)據(jù),;需要實時完成計算,盡可能得降低延遲,。
對于交互性,,終端要求更高。云端任務(wù)本身是限定在虛擬世界,,無需考慮與現(xiàn)實世界的交互,。終端則身處現(xiàn)實世界,,每一個任務(wù)都需要考慮交互性。
此外,,功耗和成本在車端AI芯片的考量中也占據(jù)更重的分量,。可見,,對于汽車終端來講,,AI芯片除了須保證計算能效,還有低功耗,、低延遲,、低成本的要求,。
目前,,AI芯片主要有三種,分別是通用型的GPU,,可定制的FPGA,,以及專用的ASIC。英偉達(dá)的Orin芯片,,是基于通用GPU,。而地平線的征程5芯片,既是ASIC芯片,,也是DSA(Domain Specific Architecture 特定領(lǐng)域架構(gòu))芯片,。值得注意的是,Orin芯片的核心GPU架構(gòu)仍是云端架構(gòu),。
不過,,對車企來說,芯片的兼容性越強(qiáng)越好,,因為車企可以一步到位,,而且無需再從頭做驗證,用一個芯片就能實現(xiàn)未來高階智能駕駛的硬件預(yù)埋,,為未來更高階的智能駕駛做好準(zhǔn)備,。這也是很多品牌愿意選擇英偉達(dá)Orin芯片的原因。
而地平線采用面向特定場景的軟硬結(jié)合方法論來設(shè)計芯片,,也就是DSA芯片的做法,,極大提升了芯片的有效算力。但是,,我們的疑問是,,征程5芯片的極限到達(dá)后,更高級別的自動駕駛需求就要換用征程6,,那么,,這個換裝的綜合成本,,誰來買單承受呢?
除了算力,,還有FPS
除了通用和定制的區(qū)別,,目前業(yè)內(nèi)存在“唯算力論”,好像芯片算力越高覺得越好,。其實,,這有失偏頗。實際上,,還是要看FPS(每秒傳輸幀數(shù))才行,。
FPS通俗來講就是指動畫或視頻的每秒畫面數(shù)。FPS是測量用于保存,、顯示動態(tài)視頻的信息數(shù)量,。簡單來說,F(xiàn)PS數(shù)值越大,,性能越好,。對于自動駕駛所有應(yīng)用的計算平臺來說,F(xiàn)PS被認(rèn)為是衡量先進(jìn)算法運行效率的評價標(biāo)準(zhǔn)之一,。
比如,,在芯片算力上,單片英偉達(dá)Orin和征程5的算力分別為254TOPS(每秒萬億次計算)和128TOPS,,功率為45W和30W,,功耗比分別為4.6TOPS/W和4.2TOPS/W。征程5只有英偉達(dá)Orin的一半,。
但是,,征程5的FPS(每秒傳輸幀數(shù))卻為1283。比Orin的1001FPS(基于同安培架構(gòu)的英偉達(dá)RTX3090進(jìn)行調(diào)整后測算得出)高出不少,。地平線征程5畫面?zhèn)魉鸵曨l的流暢度明顯要好于英偉達(dá)Orin,。怪不得地平線BPU算法負(fù)責(zé)人羅恒要說,“能效上來看,,我們(征程5相比Orin)有6倍多的提升,。”
其實,,不僅是地平線以FPS來算帳,。2017年發(fā)布自研的FSD芯片時,特斯拉創(chuàng)始人馬斯克便以此前應(yīng)用的英偉達(dá)Drive PX2作比,,從算力來看FSD是Drive PX2的3倍,,但FPS是Drive PX2的21倍。
此外,低延遲性能也是衡量AI芯片性能的關(guān)鍵指標(biāo),。因為,,延遲問題直接關(guān)乎駕駛證安全。比如,,在緊急制動場景下,,100毫秒意味著近1.7~3.3米的剎車距離。
而按照地平線的說法,,征程5的8M單目前視感知結(jié)構(gòu)化輸出延遲小于60毫秒,,比英偉達(dá)ORIN的延遲性能更好。而Orin芯片的低延遲數(shù)據(jù)未知,。
所以,,從FPS和低延遲、低成本來說,,地平線在汽車領(lǐng)域的發(fā)展機(jī)會還是很大的,,目前有超過20家車企的70多款車型應(yīng)用了征程系列芯片,這也是地平線通過定制路線的“奇兵”收獲的成果,。
架構(gòu),,決勝
而在第五波計算浪潮之下,決定芯片的核心,,當(dāng)然是架構(gòu)。因為,,架構(gòu)是芯片企業(yè)最底層的核心技術(shù),,迭代成本巨大,也是最值錢的技術(shù),。
作為提出DSA架構(gòu)的泰山北斗,,John Hennessy與David Patterson在獲得2017年圖靈獎時的獲獎演說中指出:“未來十年,將是計算機(jī)體系結(jié)構(gòu)的黃金年代”,。這是一個很好的注腳,。
而地平線的征程系列芯片,從其架構(gòu)來說,,經(jīng)歷了名為高斯,、伯努利和貝葉斯的三代BPU(Brain Processing Unit, 地平線自主設(shè)計研發(fā)的高效的人工智能處理器架構(gòu))架構(gòu),。
從低到高,,高斯架構(gòu)主要處理感知,就是圖像識別,,識別攝像頭,,雷達(dá),傳感器等的圖像,,采用40nm工藝,。而伯努利架構(gòu)加入了深度學(xué)習(xí),,20nm工藝。貝葉斯架構(gòu)則是加入貝葉斯網(wǎng)絡(luò),,結(jié)合深度學(xué)習(xí)來提高AI的準(zhǔn)確率,,16nm工藝。
再來看英偉達(dá),。創(chuàng)立于1993年的英偉達(dá)厲害之處在于,,1999年發(fā)明GPU(圖形處理器),2006年發(fā)布CUDA?通用并行計算架構(gòu),,實現(xiàn)了軟硬解耦,。開發(fā)者不必再使用高難度的GPU專用開發(fā)語言,而能使用通用性的編程語言調(diào)用GPU算力,。
通過軟硬解耦,,將圖形處理的專用芯片GPU變?yōu)檫m用于大規(guī)模并行計算的通用型芯片,英偉達(dá)站上AI時代的C位,。對于地平線以及其他芯片企業(yè)來說,,也是高山仰止、拼命追趕的對象,。
而英偉達(dá)的Orin是基于Ampere(安培)架構(gòu),,這也是推動英偉達(dá)數(shù)據(jù)中心業(yè)務(wù)增長近9成的主力產(chǎn)品架構(gòu)。換句話說,,面向高級別自動駕駛場景的Orin,,用的還是魔改的通用架構(gòu)。這就像,,今年大熱的高通8155芯片,,是從消費電子芯片魔改而來。
通用架構(gòu)的好處是“上手容易”,,拿來就能用,,而且工具豐富。不過,,缺點是,,很多硬件性能前期是浪費的,暫時用不上的,。
那么,,為什么站在云端的英偉達(dá)仍然在用通用架構(gòu)?看看汽車業(yè)務(wù)占比就明白,。
5月26日,,英偉達(dá)發(fā)布2023財年Q1財報(截至2022年3月),本季營收82.9億美元,同比增長46%,。其中,,由超大規(guī)模計算、云端和AI業(yè)務(wù)推動的數(shù)據(jù)中心業(yè)務(wù)占比45.23%,;顯卡支撐的游戲業(yè)務(wù)占比43.67%,。汽車業(yè)務(wù)呢?微不足道,,占比2.1%,。
地平線的營收情況,沒有公開的披露,。不過,,2020年《晚點LatePost》曾報道,地平線2020年營收為2~2.3億元,,其中70%來自向車廠提供芯片等產(chǎn)品的收入,,客戶包括長安、一汽和理想汽車等,。
從營收來看,,地平線和英偉達(dá)的差距還不是一個數(shù)量級的,還根本無法威脅到英偉達(dá)的地位,,是海洋界鯨魚和海豚的關(guān)系,。所以,英偉達(dá)沒什么動力去做面向車企的ASIC芯片,。這也給了地平線和其他芯片企業(yè)巨大的機(jī)會,。
當(dāng)然,地平線還處于發(fā)展初期也就是要不斷砸錢的階段,。根據(jù)企查查的數(shù)據(jù),如果不計算未披露的融資金額,,地平線累計融資超34億美元(約合人民幣243.3億元),。最近一筆,是奇瑞汽車的,。
地平線目前的核心業(yè)務(wù)只有端側(cè)的汽車領(lǐng)域,。市場方面,地平線征程系列芯片目前累計出貨超過150萬片,。而通過針對自動駕駛場景算法和需求專門設(shè)計的專用芯片,,實現(xiàn)在效率上的更高效,只是地平線追趕英偉達(dá)的第一步,。
就像前面說的,,比亞迪并不是唯一一個同時部署英偉達(dá)和地平線的車企。理想在2021理想ONE以及后續(xù)的理想L8 Pro上搭載了征程5,而在理想L8 MAX和L9上則使用的是英偉達(dá)Orin,。
所以,,地平線更難的是構(gòu)建出好用的軟件體系,以及能支撐持續(xù)演進(jìn)迭代的用戶生態(tài),,而這正是英偉達(dá)CUDA體系的王牌所在,。地平線的天工開物還有很長的路要走。不過,,無論怎樣,,地平線給中國汽車企業(yè)帶來了一個DSA芯片的可選項,都是件“極好的”事,。
更多信息可以來這里獲取==>>電子技術(shù)應(yīng)用-AET<<