用存算一體創(chuàng)新架構(gòu),,重構(gòu)智能駕駛芯片,。后摩智能是國產(chǎn)AI大算力智駕芯片領(lǐng)域跑出的一匹黑馬,。
ChatGPT等人工智能應(yīng)用的爆火再次引發(fā)了行業(yè)對(duì)大算力的需求,。未來的計(jì)算系統(tǒng)相比現(xiàn)在的芯片,,至少需要有1000倍甚至更高的效率提升才能滿足無處不在的萬物智能,。AI芯片是AI算力的“心臟”,而高性能的AI芯片需要先進(jìn)的制程技術(shù)來實(shí)現(xiàn)更小的晶體管,、更高的集成度和更低的功耗,。隨著摩爾定律在逼近極限,如果繼續(xù)依靠先進(jìn)工藝的底層技術(shù)創(chuàng)新,,沿這個(gè)方向走下去,,能否達(dá)到未來所需的算力提升?不好說,。但無論如何,,行業(yè)正在為之努力。
與此同時(shí),行業(yè)內(nèi)也有人在另辟蹊徑,,利用底層架構(gòu)創(chuàng)新來實(shí)現(xiàn)算力的提升,。近幾年來,存算一體在作為一項(xiàng)有望突破算力瓶頸的先進(jìn)技術(shù),,正在被國內(nèi)外越來越多企業(yè)選擇,。存算一體這種創(chuàng)新的架構(gòu),通過將部分或全部的計(jì)算移到存儲(chǔ)中,,把計(jì)算單元和存儲(chǔ)單元集成在同一個(gè)芯片,,在存儲(chǔ)單元內(nèi)完成運(yùn)算,減少數(shù)據(jù)來回搬運(yùn)造成的數(shù)據(jù)傳輸延遲,、損耗等問題,以此來突破芯片性能瓶頸及提升能效比,。
而在存算一體大算力這一領(lǐng)域,,國內(nèi)芯片企業(yè)走在了前列。
從0到1,,國內(nèi)首款存算一體大算力芯片正式量產(chǎn)
2023年5月10日,,后摩智能正式發(fā)布首款存算一體智駕芯片——鴻途H30。僅用12nm工藝制程,,該芯片的物理算力實(shí)現(xiàn)了高達(dá)256TOPS,,在Int8全精度的計(jì)算提供下,計(jì)算延時(shí)只有1.5ns,,能效比為30-150 TOPS/W,,比業(yè)界同等精度計(jì)算條件下的水平提高了3倍以上。250TOPS可以說是目前國內(nèi)效率最高的大算力智能駕駛芯片,!35W的典型功耗也令人震驚,。這就是存算一體架構(gòu)技術(shù)的魅力。
除了大算力和低功耗之外,,它還具有全精度,、車規(guī)級(jí)、可量產(chǎn),、通用性的特性,。而透過這些突破性技術(shù)表現(xiàn),我們也嗅到了后摩智能濃濃的技術(shù)創(chuàng)新實(shí)力,。
首先是存算一體電路結(jié)構(gòu)的設(shè)計(jì),,后摩智能采用的是基于SRAM存儲(chǔ)介質(zhì)的存算一體架構(gòu),將定制化的乘加電路和傳統(tǒng)的SRAM Bit Cell電路完全融合在一起,。下圖中右圖是存算一體電路的架構(gòu)圖,,淺色部分是傳統(tǒng)的SRAM電路,深色部分是一些定制化的電路結(jié)構(gòu),,包括乘法器,、加法數(shù),、累加器等,做到數(shù)據(jù)讀取出來之后馬上可以在原地參與計(jì)算,。
其次,,H30芯片采用的是后摩智能自研的AI處理器架構(gòu)—IPU(Intelligence Processing Unit)。目前該IPU架構(gòu)規(guī)劃有三代:第一代是天樞架構(gòu),,面向智能駕駛,;第二代是天璇架構(gòu),它可以應(yīng)用于更多的場(chǎng)景,;第三代是天璣架構(gòu),,將面向通用人工智能。H30芯片采用的是第一代天樞架構(gòu)IPU,。
解決了存和算的問題,,在數(shù)據(jù)的傳輸方面:1)后摩智能專門設(shè)計(jì)了專用的數(shù)據(jù)傳輸總線,它能把各個(gè)Tile和各個(gè)IPU核連接起來,,在它們之間建立高速的,、直接的數(shù)據(jù)傳輸通道。2)在AI計(jì)算里,,數(shù)據(jù)復(fù)用是一個(gè)非常重要的特性,,因此,后摩智能為此設(shè)計(jì)了獨(dú)特的多波機(jī)制,,避免了數(shù)據(jù)重復(fù)的讀取和傳輸,。
通過存算電路底層技術(shù)的創(chuàng)新加上AI處理器架構(gòu)的創(chuàng)新,再加上出色的工程實(shí)現(xiàn)能力,,最終鴻途H30實(shí)現(xiàn)了多項(xiàng)芯片性能指標(biāo)的突破,。與某國際巨頭芯片對(duì)比,在工藝落后一代的情況下,,進(jìn)行完全相同的測(cè)試,,H30芯片的功耗減少了50%以上,性能卻有2倍以上的提升,。
為了幫助客戶更好的落地,,后摩智能同步推出了基于鴻途 H30芯片打造的智能駕駛硬件平臺(tái)——力馭(Sailing,寓意早日揚(yáng)帆起航),。僅依靠一顆H30芯片,,力馭平臺(tái)的CPU算力高達(dá)200 Kdmips,AI算力高 256Tops,,足夠支撐智能駕駛所有的傳感器,。而且力馭平臺(tái)的功耗僅為85W,可采用更加靈活的散熱方式,實(shí)現(xiàn)更低成本的便捷部署,。
基于鴻途H30芯片后摩智能自主研發(fā)了一款軟件開發(fā)工具鏈—后摩大道,,支持 PyTorch、TensorFlow,、ONNX等主流開源框架,,編程兼容CUDA前端語法,同時(shí)支持SIMD和SIMT 兩種編程模型,,兼顧運(yùn)行效率和開發(fā)效率,,進(jìn)一步實(shí)現(xiàn)了鴻途?H30 的高效、易用,。
目前后摩智能的鴻途H30芯片將于6月份開始給Alpha客戶送測(cè),。同時(shí),后摩智能的第二代產(chǎn)品鴻途H50 已經(jīng)在全力研發(fā)中,,將于2024年推出,,支持客戶 2025年的量產(chǎn)車型。
存算一體技術(shù)優(yōu)勢(shì)已然顯現(xiàn)
當(dāng)下,,在各國都在爭(zhēng)搶加速進(jìn)入人工智能時(shí)代的時(shí)間節(jié)點(diǎn)下,算力是AI技術(shù)角逐的源動(dòng)力,。然而持續(xù)緊張的地緣關(guān)系,,國內(nèi)在先進(jìn)工藝采用方面的掣肘,使得國產(chǎn)算力的提速面對(duì)著多方面的難題,,不僅是算力的需求,,功耗也是行業(yè)所面臨的挑戰(zhàn)。此次后摩智能率先在存算一體大算力芯片上的突破,,可以說用實(shí)際產(chǎn)品證明了存算一體技術(shù)的優(yōu)勢(shì)和潛力,。
計(jì)算效率高,工藝依賴度低:我們可以看到,,后摩智能鴻途H30芯片,,所采用的12nm的工藝并不是最先進(jìn)的,但卻能達(dá)到超過200TOPS的算力,??v觀全球AI芯片的算力發(fā)展情況,基于傳統(tǒng)路徑的芯片在算力提升方面需要很大程度上依賴先進(jìn)工藝,,行業(yè)內(nèi)達(dá)到200TOPS算力的AI芯片一般的工藝都要7nm甚至更先進(jìn)才行,,如英偉達(dá)的Orin芯片和國內(nèi)的一些200TOPS左右算力的芯片等大多都是在7nm。更甚之,,英偉達(dá)的Thor可以實(shí)現(xiàn)1000T以上的算力,,但是工藝要采用4nm。
與某國際巨頭的8nm智駕領(lǐng)域的某款旗艦芯片,以Resnet50網(wǎng)絡(luò)為例,,后摩智能H30的性能在等于1的配置條件下,,可以達(dá)到8700幀每秒;如果把它設(shè)成8,,可以突破1萬幀,,達(dá)到10300幀每秒的性能。整體來說后摩H30芯片的性能可以達(dá)到友商的2倍以上,。
低成本:因?yàn)閷?duì)工藝的依賴性不高,,所以可以實(shí)現(xiàn)低成本,更加普惠,。后摩智能聯(lián)合創(chuàng)始人兼產(chǎn)品副總裁信曉旭在發(fā)布會(huì)上透露到:“H30芯片在成本上會(huì)非常非常有競(jìng)爭(zhēng)力,。”
更低的能耗:由于數(shù)據(jù)傳輸?shù)母咝?,存算一體芯片在計(jì)算過程中需要消耗更少的能量,,從而可以實(shí)現(xiàn)更低的功耗,也更符合可持續(xù)和低碳環(huán)保的理念,。
計(jì)算延時(shí)低:由于存儲(chǔ)和計(jì)算任務(wù)在同一芯片內(nèi)部完成,,存算一體架構(gòu)芯片能夠更快地完成數(shù)據(jù)的讀寫和處理,從而提高數(shù)據(jù)處理的效率,。例如,,相比業(yè)界用5nm工藝的存算一體芯片,后摩智能的鴻途H30芯片在Int8全精度的計(jì)算提供下,,計(jì)算延時(shí)只有1.5ns,,降低了70%。
支持大規(guī)模并行計(jì)算:存算一體架構(gòu)芯片能夠支持大規(guī)模并行計(jì)算,,從而更好地滿足人工智能,、邊緣計(jì)算、高性能計(jì)算等應(yīng)用的需求,。
我們也可以看到,,后摩智能的鴻途H30存算一體大算力芯片落地的第一站是智能駕駛。單從市場(chǎng)應(yīng)用場(chǎng)景來看,,存算一體架構(gòu)的芯片也顯現(xiàn)出多個(gè)優(yōu)勢(shì):
1:存算一體架構(gòu)芯片的高效數(shù)據(jù)傳輸和計(jì)算能力可以幫助實(shí)現(xiàn)高效的圖像處理,;
2:智能駕駛的安全性是行業(yè)密切關(guān)注的一大問題,而存算一體架構(gòu)的芯片可以將敏感數(shù)據(jù)存儲(chǔ)在同一芯片中,,從而減少了數(shù)據(jù)傳輸?shù)娘L(fēng)險(xiǎn),,提高了數(shù)據(jù)的安全性;
3:智能駕駛需要支持多種算法和模型,,包括神經(jīng)網(wǎng)絡(luò),、深度學(xué)習(xí)等,。存算一體芯片可以根據(jù)不同的算法和模型進(jìn)行靈活配置,從而實(shí)現(xiàn)更高效的計(jì)算和存儲(chǔ),。在這方面,,鴻途H30芯片可以支持經(jīng)典的基礎(chǔ)網(wǎng)絡(luò)Resnet50,包括BEV網(wǎng)絡(luò)模型以及廣泛應(yīng)用于高階輔助駕駛領(lǐng)域的 Pointpillar網(wǎng)絡(luò)模型,。
后摩智能創(chuàng)始人吳強(qiáng)也表示,,從技術(shù)和產(chǎn)品需求匹配的角度來看,存算一體帶來的技術(shù)和產(chǎn)品的優(yōu)勢(shì),,和智能駕駛的關(guān)鍵需求是天然吻合的,。其原因主要有兩方面:一方面是算力功耗的需求;另一方面從終局的角度來看,,智能駕駛的終局是要代替人,,實(shí)現(xiàn)無人駕駛。所以智能駕駛芯片一定要無限接近人腦的效率,。而存算一體技術(shù)正是一個(gè)比傳統(tǒng)架構(gòu)更接近人腦的計(jì)算形式,,它也能夠達(dá)到比傳統(tǒng)架構(gòu)高許多的計(jì)算效率。
從1到100,,存算一體技術(shù)將走向更多應(yīng)用
對(duì)于市場(chǎng)空間如此大的智能駕駛,,如果后摩智能的鴻途H30芯片能夠真正走量并釋放出其優(yōu)勢(shì)。那么,,這將不僅為國產(chǎn)智能駕駛領(lǐng)域的客戶們提供一個(gè)差異化的新選擇,,也將為存算一體架構(gòu)的芯片的大規(guī)模發(fā)展奠定良好的基礎(chǔ)。許多機(jī)構(gòu)都預(yù)測(cè)2023年將是存算一體大規(guī)模商業(yè)落地的元年,,伴隨著此次鴻途H30芯片的量產(chǎn)發(fā)布,存算一體技術(shù)的商業(yè)化元年也即將正式開啟,。
作為一項(xiàng)通用技術(shù),,存算一體技術(shù)可以根據(jù)不同領(lǐng)域和應(yīng)用場(chǎng)景進(jìn)行優(yōu)化和應(yīng)用。智能駕駛只是存算一體技術(shù)應(yīng)用的冰山一角,,存算一體還有很大的應(yīng)用可能性和商業(yè)價(jià)值的潛力深埋于底下,。比如人形機(jī)器人,服務(wù)機(jī)器人,,以及對(duì)算力和能效有更高要求的場(chǎng)景如ChatGPT,、云端推理等等都將是存算一體技術(shù)能夠發(fā)揮所長(zhǎng)的應(yīng)用。
當(dāng)然,,存算一體技術(shù)的更大商用化還需要產(chǎn)業(yè)界上下游的共同努力,,讓存算一體技術(shù)的規(guī)模化應(yīng)用從1走向100,。后摩智能聯(lián)合創(chuàng)始人兼研發(fā)副總裁陳亮在會(huì)上透露:“在不久的將來,,我們會(huì)把我們的AI處理器硬件設(shè)計(jì)開源,,大家可以去下載到我們的IPU設(shè)計(jì)資料,做PPA的評(píng)估和軟件算法的開發(fā),,或者甚至將來用到自己的產(chǎn)品當(dāng)中去,。我們希望有更多的人和組織能夠參與進(jìn)來,相信以大家的智慧可以更好的讓這個(gè)方向落地,,大家可以共建生態(tài),,最終讓整個(gè)產(chǎn)業(yè)鏈?zhǔn)芤妗,!?/p>
寫在最后
2020年11月成立,,2022年5月驗(yàn)證芯片成功點(diǎn)亮,2023年5月量產(chǎn)芯片面世,,對(duì)于存算一體新架構(gòu)+大算力這樣一項(xiàng)顛覆性技術(shù)而言,,這個(gè)速度彰顯了后摩智能的產(chǎn)品落地能力。通過不斷突破技術(shù)瓶頸和持續(xù)的研發(fā)投入,,后摩智能成功地將存算一體的概念應(yīng)用于大算力AI芯片,,并實(shí)現(xiàn)了高性能計(jì)算與低能耗的平衡。后摩智能的存算一體AI芯片取名鴻途,,寓意是有鴻鵠之志,,但是又腳踏實(shí)地,走向漫漫征途,。
憑借這一芯片的落地,,后摩智能迅速成長(zhǎng)為國產(chǎn)AI芯片行業(yè)的重要?jiǎng)?chuàng)新力量。而且在當(dāng)下大算力AI芯片發(fā)展遭遇瓶頸之際,,作為國內(nèi)率先落地存算一體大算力AI芯片的公司,,后摩智能用實(shí)打?qū)嵉漠a(chǎn)品,為我國發(fā)展高算力,、低功耗和低成本的AI芯片注入新的發(fā)展動(dòng)能,。
更多精彩內(nèi)容歡迎點(diǎn)擊==>>電子技術(shù)應(yīng)用-AET<<