說到AI芯片領(lǐng)域,,最近的一件大事是,10月13日地平線和大眾旗下軟件公司CARIAD官宣合作,。雙方成立合資企業(yè),,CARIAD控股60%,投資約24億歐元,,預(yù)計(jì)會(huì)在2023年上半年完成,。
這算是地平線迄今為止最重磅的一個(gè)合作。而一個(gè)插曲是,,半年前地平線才宣布第三代產(chǎn)品征程5芯片首個(gè)定點(diǎn)合作,,花落比亞迪,上車時(shí)間2023年,。不過,,有意思的是,比亞迪同時(shí)也將投產(chǎn)搭載英偉達(dá)DRIVE Orin計(jì)算平臺(tái)的車型,。
而公社C次元最近一篇文章《英偉達(dá)不要的,,地平線都要》,,對(duì)地平線和英偉達(dá)在汽車領(lǐng)域AI芯片應(yīng)用的競(jìng)爭(zhēng)情況也做了介紹,所以,,這篇我們就科普科普,,到底這兩家企業(yè)競(jìng)爭(zhēng)些什么,以及車企的選擇背后是怎樣的考慮,?
都是AI芯片,,有啥不一樣?
論及雙方,,他們的產(chǎn)品都是用于自動(dòng)駕駛領(lǐng)域的AI芯片,。但是區(qū)別還是很大的。
AI芯片的應(yīng)用場(chǎng)景,,主要分為云端和終端,,還有邊緣端。目前,,云端應(yīng)用的更多,,相對(duì)成熟。此外,,云端應(yīng)用又可分為訓(xùn)練和推理兩種,,其中訓(xùn)練的市場(chǎng)規(guī)模占比較高。
云端應(yīng)用的霸主,,就是英偉達(dá),。而云端(服務(wù)器、數(shù)字中心)和終端(手機(jī),、智能汽車等移動(dòng)端)應(yīng)用場(chǎng)景中,,AI芯片的運(yùn)算方式有著本質(zhì)性的差別。
比如,,云端處理大批量一次性到達(dá)的累積數(shù)據(jù)(擴(kuò)大批處理量,,batch size),可以“等”數(shù)據(jù)“夠了”再開始處理,。但車端芯片則需要處理流數(shù)據(jù),,隨著行駛(時(shí)間)陸續(xù)到來(lái)的數(shù)據(jù);需要實(shí)時(shí)完成計(jì)算,,盡可能得降低延遲,。
對(duì)于交互性,終端要求更高,。云端任務(wù)本身是限定在虛擬世界,,無(wú)需考慮與現(xiàn)實(shí)世界的交互。終端則身處現(xiàn)實(shí)世界,,每一個(gè)任務(wù)都需要考慮交互性,。
此外,,功耗和成本在車端AI芯片的考量中也占據(jù)更重的分量??梢?,對(duì)于汽車終端來(lái)講,AI芯片除了須保證計(jì)算能效,,還有低功耗,、低延遲、低成本的要求,。
目前,,AI芯片主要有三種,分別是通用型的GPU,,可定制的FPGA,,以及專用的ASIC。英偉達(dá)的Orin芯片,,是基于通用GPU,。而地平線的征程5芯片,既是ASIC芯片,,也是DSA(Domain Specific Architecture 特定領(lǐng)域架構(gòu))芯片。值得注意的是,,Orin芯片的核心GPU架構(gòu)仍是云端架構(gòu),。
不過,對(duì)車企來(lái)說,,芯片的兼容性越強(qiáng)越好,,因?yàn)檐嚻罂梢砸徊降轿唬覠o(wú)需再?gòu)念^做驗(yàn)證,,用一個(gè)芯片就能實(shí)現(xiàn)未來(lái)高階智能駕駛的硬件預(yù)埋,,為未來(lái)更高階的智能駕駛做好準(zhǔn)備。這也是很多品牌愿意選擇英偉達(dá)Orin芯片的原因,。
而地平線采用面向特定場(chǎng)景的軟硬結(jié)合方法論來(lái)設(shè)計(jì)芯片,,也就是DSA芯片的做法,極大提升了芯片的有效算力,。但是,,我們的疑問是,征程5芯片的極限到達(dá)后,,更高級(jí)別的自動(dòng)駕駛需求就要換用征程6,,那么,這個(gè)換裝的綜合成本,,誰(shuí)來(lái)買單承受呢,?
除了算力,,還有FPS
除了通用和定制的區(qū)別,目前業(yè)內(nèi)存在“唯算力論”,,好像芯片算力越高覺得越好,。其實(shí),這有失偏頗,。實(shí)際上,,還是要看FPS(每秒傳輸幀數(shù))才行。
FPS通俗來(lái)講就是指動(dòng)畫或視頻的每秒畫面數(shù),。FPS是測(cè)量用于保存,、顯示動(dòng)態(tài)視頻的信息數(shù)量。簡(jiǎn)單來(lái)說,,F(xiàn)PS數(shù)值越大,,性能越好。對(duì)于自動(dòng)駕駛所有應(yīng)用的計(jì)算平臺(tái)來(lái)說,,F(xiàn)PS被認(rèn)為是衡量先進(jìn)算法運(yùn)行效率的評(píng)價(jià)標(biāo)準(zhǔn)之一,。
比如,在芯片算力上,,單片英偉達(dá)Orin和征程5的算力分別為254TOPS(每秒萬(wàn)億次計(jì)算)和128TOPS,,功率為45W和30W,功耗比分別為4.6TOPS/W和4.2TOPS/W,。征程5只有英偉達(dá)Orin的一半,。
但是,征程5的FPS(每秒傳輸幀數(shù))卻為1283,。比Orin的1001FPS(基于同安培架構(gòu)的英偉達(dá)RTX3090進(jìn)行調(diào)整后測(cè)算得出)高出不少,。地平線征程5畫面?zhèn)魉鸵曨l的流暢度明顯要好于英偉達(dá)Orin。怪不得地平線BPU算法負(fù)責(zé)人羅恒要說,,“能效上來(lái)看,,我們(征程5相比Orin)有6倍多的提升?!?/p>
其實(shí),,不僅是地平線以FPS來(lái)算帳。2017年發(fā)布自研的FSD芯片時(shí),,特斯拉創(chuàng)始人馬斯克便以此前應(yīng)用的英偉達(dá)Drive PX2作比,,從算力來(lái)看FSD是Drive PX2的3倍,但FPS是Drive PX2的21倍,。
此外,,低延遲性能也是衡量AI芯片性能的關(guān)鍵指標(biāo)。因?yàn)椋舆t問題直接關(guān)乎駕駛證安全,。比如,,在緊急制動(dòng)場(chǎng)景下,100毫秒意味著近1.7~3.3米的剎車距離,。
而按照地平線的說法,,征程5的8M單目前視感知結(jié)構(gòu)化輸出延遲小于60毫秒,比英偉達(dá)ORIN的延遲性能更好,。而Orin芯片的低延遲數(shù)據(jù)未知,。
所以,從FPS和低延遲,、低成本來(lái)說,,地平線在汽車領(lǐng)域的發(fā)展機(jī)會(huì)還是很大的,目前有超過20家車企的70多款車型應(yīng)用了征程系列芯片,,這也是地平線通過定制路線的“奇兵”收獲的成果,。
架構(gòu),決勝
而在第五波計(jì)算浪潮之下,,決定芯片的核心,,當(dāng)然是架構(gòu)。因?yàn)?,架?gòu)是芯片企業(yè)最底層的核心技術(shù),,迭代成本巨大,也是最值錢的技術(shù),。
作為提出DSA架構(gòu)的泰山北斗,,John Hennessy與David Patterson在獲得2017年圖靈獎(jiǎng)時(shí)的獲獎(jiǎng)演說中指出:“未來(lái)十年,將是計(jì)算機(jī)體系結(jié)構(gòu)的黃金年代”,。這是一個(gè)很好的注腳。
而地平線的征程系列芯片,,從其架構(gòu)來(lái)說,,經(jīng)歷了名為高斯、伯努利和貝葉斯的三代BPU(Brain Processing Unit,, 地平線自主設(shè)計(jì)研發(fā)的高效的人工智能處理器架構(gòu))架構(gòu),。
從低到高,高斯架構(gòu)主要處理感知,,就是圖像識(shí)別,,識(shí)別攝像頭,雷達(dá),,傳感器等的圖像,,采用40nm工藝。而伯努利架構(gòu)加入了深度學(xué)習(xí),,20nm工藝,。貝葉斯架構(gòu)則是加入貝葉斯網(wǎng)絡(luò),,結(jié)合深度學(xué)習(xí)來(lái)提高AI的準(zhǔn)確率,16nm工藝,。
再來(lái)看英偉達(dá),。創(chuàng)立于1993年的英偉達(dá)厲害之處在于,1999年發(fā)明GPU(圖形處理器),,2006年發(fā)布CUDA?通用并行計(jì)算架構(gòu),,實(shí)現(xiàn)了軟硬解耦。開發(fā)者不必再使用高難度的GPU專用開發(fā)語(yǔ)言,,而能使用通用性的編程語(yǔ)言調(diào)用GPU算力,。
通過軟硬解耦,將圖形處理的專用芯片GPU變?yōu)檫m用于大規(guī)模并行計(jì)算的通用型芯片,,英偉達(dá)站上AI時(shí)代的C位,。對(duì)于地平線以及其他芯片企業(yè)來(lái)說,也是高山仰止,、拼命追趕的對(duì)象,。
而英偉達(dá)的Orin是基于Ampere(安培)架構(gòu),這也是推動(dòng)英偉達(dá)數(shù)據(jù)中心業(yè)務(wù)增長(zhǎng)近9成的主力產(chǎn)品架構(gòu),。換句話說,,面向高級(jí)別自動(dòng)駕駛場(chǎng)景的Orin,用的還是魔改的通用架構(gòu),。這就像,,今年大熱的高通8155芯片,是從消費(fèi)電子芯片魔改而來(lái),。
通用架構(gòu)的好處是“上手容易”,,拿來(lái)就能用,而且工具豐富,。不過,,缺點(diǎn)是,很多硬件性能前期是浪費(fèi)的,,暫時(shí)用不上的,。
那么,為什么站在云端的英偉達(dá)仍然在用通用架構(gòu),?看看汽車業(yè)務(wù)占比就明白,。
5月26日,英偉達(dá)發(fā)布2023財(cái)年Q1財(cái)報(bào)(截至2022年3月),,本季營(yíng)收82.9億美元,,同比增長(zhǎng)46%。其中,由超大規(guī)模計(jì)算,、云端和AI業(yè)務(wù)推動(dòng)的數(shù)據(jù)中心業(yè)務(wù)占比45.23%,;顯卡支撐的游戲業(yè)務(wù)占比43.67%。汽車業(yè)務(wù)呢,?微不足道,,占比2.1%。
地平線的營(yíng)收情況,,沒有公開的披露,。不過,2020年《晚點(diǎn)LatePost》曾報(bào)道,,地平線2020年?duì)I收為2~2.3億元,,其中70%來(lái)自向車廠提供芯片等產(chǎn)品的收入,客戶包括長(zhǎng)安,、一汽和理想汽車等,。
從營(yíng)收來(lái)看,地平線和英偉達(dá)的差距還不是一個(gè)數(shù)量級(jí)的,,還根本無(wú)法威脅到英偉達(dá)的地位,,是海洋界鯨魚和海豚的關(guān)系。所以,,英偉達(dá)沒什么動(dòng)力去做面向車企的ASIC芯片,。這也給了地平線和其他芯片企業(yè)巨大的機(jī)會(huì)。
當(dāng)然,,地平線還處于發(fā)展初期也就是要不斷砸錢的階段,。根據(jù)企查查的數(shù)據(jù),如果不計(jì)算未披露的融資金額,,地平線累計(jì)融資超34億美元(約合人民幣243.3億元),。最近一筆,是奇瑞汽車的,。
地平線目前的核心業(yè)務(wù)只有端側(cè)的汽車領(lǐng)域,。市場(chǎng)方面,地平線征程系列芯片目前累計(jì)出貨超過150萬(wàn)片,。而通過針對(duì)自動(dòng)駕駛場(chǎng)景算法和需求專門設(shè)計(jì)的專用芯片,實(shí)現(xiàn)在效率上的更高效,,只是地平線追趕英偉達(dá)的第一步,。
就像前面說的,比亞迪并不是唯一一個(gè)同時(shí)部署英偉達(dá)和地平線的車企,。理想在2021理想ONE以及后續(xù)的理想L8 Pro上搭載了征程5,,而在理想L8 MAX和L9上則使用的是英偉達(dá)Orin。
所以,地平線更難的是構(gòu)建出好用的軟件體系,,以及能支撐持續(xù)演進(jìn)迭代的用戶生態(tài),,而這正是英偉達(dá)CUDA體系的王牌所在。地平線的天工開物還有很長(zhǎng)的路要走,。不過,,無(wú)論怎樣,地平線給中國(guó)汽車企業(yè)帶來(lái)了一個(gè)DSA芯片的可選項(xiàng),,都是件“極好的”事,。
更多信息可以來(lái)這里獲取==>>電子技術(shù)應(yīng)用-AET<<