《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > EDA與制造 > 業(yè)界動(dòng)態(tài) > 存內(nèi)計(jì)算,,要爆發(fā)了,?

存內(nèi)計(jì)算,,要爆發(fā)了?

2021-10-29
來源:半導(dǎo)體行業(yè)觀察
關(guān)鍵詞: 存內(nèi)計(jì)算

  存算一體的基本概念最早可以追溯到上個(gè)世紀(jì)七十年代,,但是受限于芯片設(shè)計(jì)復(fù)雜度與制造成本問題,,以及缺少殺手級(jí)大數(shù)據(jù)應(yīng)用進(jìn)行驅(qū)動(dòng),存算一體一直不溫不火,,但最近幾年,,存算一體似乎已經(jīng)進(jìn)入爆發(fā)前夕。

  尤其是國(guó)內(nèi)一大批存算一體技術(shù)公司伴隨著融資信息浮出水面,,如知存科技,、蘋芯科技、九天睿芯,、后摩智能,、合肥恒爍、閃憶科技,、新憶科技,、杭州智芯科等,動(dòng)輒億元起的融資金額也充分證明了資本對(duì)存算一體這個(gè)賽道的青睞,。國(guó)外的三星和Myhtic也是該領(lǐng)域的潛心研究者,他們近來也動(dòng)作頻頻,,在最近的hotchips上,,三星就披露了他們的HBM-PIM方案,Myhtic的存算一體模擬AI芯片也有了新進(jìn)展,。一個(gè)新的存儲(chǔ)計(jì)算時(shí)代似乎將要來臨,。

  存內(nèi)計(jì)算市場(chǎng)為何被看好?

  今年5月Myhtic C輪融資了7000萬美元,,迄今為止已共計(jì)籌集了1.65億美元,;6月10日,知存科技宣布完成億元A3輪融資,,產(chǎn)品線擴(kuò)充及新的產(chǎn)品量產(chǎn),,加上此前的兩輪融資,截至目前,,知存科技已完成累計(jì)近3億元的A輪系列融資,;6月25日九天睿芯獲億元級(jí)A輪融資,用于新產(chǎn)品研發(fā)和人員擴(kuò)充的工作,;7月2日,,杭州智芯科完成近億元的天使輪融資,用于繼續(xù)搭建團(tuán)隊(duì),啟動(dòng)ACIM下一階段技術(shù)研發(fā)與市場(chǎng)拓展,;8月24日,,后摩智能宣布完成3億元人民幣Pre-A輪融資,將用于加速芯片產(chǎn)品技術(shù)研發(fā),、團(tuán)隊(duì)拓展,,早期市場(chǎng)布局及商業(yè)落地;8月24日,,蘋芯科技完成近千萬美元Pre-A輪融資,,據(jù)悉,本輪融資將主要用于芯片研發(fā)相關(guān)工作,。

  從融資金額的用途我們也可以窺見,,這些存算一體芯片公司有的處于團(tuán)隊(duì)搭建階段,有的是正在芯片研發(fā)階段,,還有的已經(jīng)到了產(chǎn)品線擴(kuò)充和量產(chǎn)階段,。前幾年(2019年左右)這個(gè)市場(chǎng)國(guó)內(nèi)也就僅有3-4家嶄露頭角的企業(yè),但現(xiàn)在存算一體這個(gè)賽道顯然已經(jīng)開始變得熱鬧起來了,。

  動(dòng)輒億元的資本涌入,,前仆后繼的玩家踴躍跳入。為何存算一體芯片市場(chǎng)會(huì)如此被看好,?

  存算一體技術(shù)(PIM :Processing in-memory)被視為人工智能創(chuàng)新的核心,。它將存儲(chǔ)和計(jì)算有機(jī)結(jié)合,直接利用存儲(chǔ)單元進(jìn)行計(jì)算,,極大地消除了數(shù)據(jù)搬移帶來的開銷,,解決了傳統(tǒng)芯片在運(yùn)行人工智能算法上的“存儲(chǔ)墻”與“功耗墻”問題,可以數(shù)十倍甚至百倍地提高人工智能運(yùn)算效率,,降低成本,。

  在知存科技CEO王紹迪的眼中,一直看好存算一體技術(shù)的原因有三:一是算力和運(yùn)算數(shù)據(jù)量每年都在指數(shù)級(jí)增加,,然而摩爾定律已經(jīng)接近于到極限,,每代芯片只有10-20%的性能提升。二是馮諾依曼架構(gòu)的算力已經(jīng)被內(nèi)存墻所限制,,只有解決內(nèi)存墻問題才能進(jìn)一步提高算力,。在各種解決方案中,存內(nèi)計(jì)算是最直接也是最高效的,。

  蘋芯科技CEO楊越則認(rèn)為,,萬物互聯(lián)+的人工智能的時(shí)代已經(jīng)到來。智能產(chǎn)品覆蓋面積越來越大,,產(chǎn)品形態(tài)的多樣性將迎來爆發(fā)式的增長(zhǎng),。我們可以預(yù)見,,由于傳輸延遲或數(shù)據(jù)安全考慮,很多數(shù)據(jù)處理及推理運(yùn)算將在端側(cè)發(fā)生,。通用性計(jì)算芯片在服務(wù)特定AI算法方面并不具備性價(jià)比優(yōu)勢(shì),,為AI定制的芯片將成為人工智能產(chǎn)業(yè)鏈條上的底層核心技術(shù)。存內(nèi)計(jì)算作為創(chuàng)新性極強(qiáng)的芯片架構(gòu)形式,,由于突破了困擾業(yè)界多年的存儲(chǔ)墻問題,,且與深度學(xué)習(xí)網(wǎng)絡(luò)運(yùn)算模型中的基本算子高度契合,使得基于存內(nèi)計(jì)算架構(gòu)的芯片相比于市場(chǎng)已有的AI加速芯片,,在計(jì)算效率(TOPS/Watt)方面有數(shù)量級(jí)上的提升,。在智能時(shí)代里,從可穿戴到自動(dòng)駕駛,,功耗約束下場(chǎng)景里的計(jì)算效率都是永恒的主題,,存內(nèi)計(jì)算是解放算力、提升能效比最強(qiáng)有力的武器之一,。

  而且與其他低功耗計(jì)算,,如低電壓亞閾值數(shù)字邏輯ASIC、神經(jīng)模態(tài)(Neuromorphics)計(jì)算和模擬計(jì)算比較,,存內(nèi)計(jì)算的優(yōu)勢(shì)也盡顯,。

  王紹迪表示,低功耗亞閾值計(jì)算是對(duì)現(xiàn)有邏輯計(jì)算的功耗優(yōu)化,,一般能效可以提升2-4倍,,但是算力相應(yīng)降低,只能進(jìn)行針對(duì)性的優(yōu)化,。而存內(nèi)計(jì)算是新型的運(yùn)算架構(gòu),,做的是二維和三維矩陣運(yùn)算,能效和算力可以提高100-1000倍,。神經(jīng)模態(tài)運(yùn)算是為類腦算法而設(shè)計(jì)的芯片,,有不同的實(shí)現(xiàn)方式,,如模擬計(jì)算,、數(shù)字計(jì)算、無時(shí)鐘計(jì)算,、或者存算一體的實(shí)現(xiàn)方式,。其實(shí)上述三種技術(shù)解決的問題是不一樣的,。后摩爾時(shí)代下,,無法通過工藝的提升來優(yōu)化整體算力,異構(gòu)計(jì)算和新架構(gòu)變得更為重要,。

  在楊越看來,,與亞閾值數(shù)字邏輯相比,,存內(nèi)計(jì)算仍工作在正常供電范圍,,可具有實(shí)現(xiàn)高算力的可能性。存內(nèi)計(jì)算的原理就是模擬計(jì)算,。存內(nèi)計(jì)算與神經(jīng)形態(tài)計(jì)算有交集,,就是用存內(nèi)計(jì)算的原理去實(shí)現(xiàn)synaptic connection,可提供高平行度,、高能效地synaptic weighting的計(jì)算,。

  存內(nèi)計(jì)算的三條主流技術(shù)路徑

  在認(rèn)準(zhǔn)了賽道之后,就是選擇存內(nèi)計(jì)算的技術(shù)路徑,。對(duì)于存算一體技術(shù)來說,,處于多種存儲(chǔ)介質(zhì)百花齊放的格局,如SRAM,,DRAM,,F(xiàn)lash等。目前選擇SRAM介質(zhì)陣營(yíng)的主要有蘋芯科技,、后摩智能,、九天睿芯。Flash陣營(yíng)的代表玩家有知存科技,、合肥恒爍,、美國(guó)的Mythic。DRAM陣營(yíng)的還相對(duì)偏少,。

  那么該如何選擇合適的技術(shù)路徑,,這些技術(shù)路徑又有何特點(diǎn)、壁壘和優(yōu)勢(shì)呢,?蘋芯CEO楊越認(rèn)為,,技術(shù)路線選擇的出發(fā)點(diǎn)有多個(gè),包括工藝成熟度,、加入計(jì)算功能的復(fù)雜度及結(jié)果精度,、向上對(duì)神經(jīng)網(wǎng)絡(luò)算法要求的支持程度、以及落地成本等方面的考慮,。

  從器件工藝成熟度來看,,知存科技認(rèn)為,SRAM,、DRAM和Flash都是成熟的存儲(chǔ)技術(shù),,其中SRAM可以在先進(jìn)工藝上如5nm上制造,DRAM和Flash可在10-20nm工藝上制造,。密度方面,,F(xiàn)lash最高,其次是DRAM,,再次是SRAM,。

  在電路設(shè)計(jì)難度上,,存內(nèi)計(jì)算的DRAM > 存內(nèi)計(jì)算SRAM > 存內(nèi)計(jì)算Flash ,在存內(nèi)計(jì)算方面,,SRAM和DRAM更難設(shè)計(jì),,它們是易失性存儲(chǔ)器,工藝偏差會(huì)大幅度增加模擬計(jì)算的設(shè)計(jì)難度,,尤其是當(dāng)容量增大到可實(shí)用的MB以上,,目前市面上還沒有SRAM和DRAM的存內(nèi)計(jì)算產(chǎn)品;Flash是非易失存儲(chǔ)器,,他的狀態(tài)是連續(xù)可編程的,,可以通過編程等方式來校準(zhǔn)工藝偏差,從而提高精度,。而近存計(jì)算的設(shè)計(jì)相對(duì)簡(jiǎn)單,,可采用成熟的存儲(chǔ)器技術(shù)和邏輯電路設(shè)計(jì)技術(shù)。

  而談到量產(chǎn)難度方面,,王紹迪給出的答案是DRAM> Flash >SRAM,。

  “我們過去做過多種存算一體介質(zhì)的流片,包括Flash,、SRAM,、RRAM和MRAM。最終發(fā)現(xiàn),,F(xiàn)lash是密度最高的存儲(chǔ)介質(zhì),,F(xiàn)lash的單個(gè)單元可以存儲(chǔ)的bit數(shù)最高(8-bit),這兩個(gè)特點(diǎn)都可以大幅度增加存內(nèi)計(jì)算的算力,?!蓖踅B迪告訴筆者,所以從密度,、可量產(chǎn)性,、能效層面多方面綜合考量,知存科技最終選擇了Flash介質(zhì),。

  楊越表示,,F(xiàn)lash和SRAM 路線各自具備優(yōu)勢(shì)。我們選擇SRAM方案出于幾個(gè)考慮:一,,SRAM的速度是所有memory類型中最快的,,且沒有寫次數(shù)的限制,,對(duì)于追求快響應(yīng)的場(chǎng)景幾乎是必選,。二,SRAM可以向先進(jìn)制程兼容,,從而達(dá)到更高的能效比,,更高的面效比等,。三,蘋芯現(xiàn)階段的研究工作可大幅提高SRAM相關(guān)計(jì)算精度,,從而降低了對(duì)相關(guān)上層算法補(bǔ)償?shù)囊?。四,相?duì)新型存儲(chǔ)器,,SRAM的工藝成熟度較高,,可以相對(duì)較快的實(shí)現(xiàn)技術(shù)落地與量產(chǎn)。

  存內(nèi)計(jì)算的最終產(chǎn)品形態(tài)

  在討論存內(nèi)計(jì)算最終的產(chǎn)品形態(tài)之前,,讓我們首先來看下存內(nèi)計(jì)算的賣點(diǎn)究竟是什么,?它應(yīng)該被認(rèn)為是一個(gè)有計(jì)算能力的存儲(chǔ)器,還是高能效比的計(jì)算模塊,。如果是前者,,則往往需要和臺(tái)積電等有志于推動(dòng)下一代存儲(chǔ)器的廠商一起合作。而后者則更傾向于以AI芯片的形式做design house,。

  蘋芯CEO楊越認(rèn)為,,存內(nèi)計(jì)算硬件的出現(xiàn),本身在催生一種編程觀念上的革命,,也就不能再套用傳統(tǒng)的功能上分離的思維去理解,。從功能上來說,存內(nèi)計(jì)算既可以存儲(chǔ)數(shù)據(jù),,又可以做特定的計(jì)算,,本身并不矛盾。從programmability的角度講,,面向AI 的存算一體技術(shù)的出現(xiàn)將會(huì)很大程度上影響人們?nèi)绾稳ゾ帉戃浖?,或者說為更有效率的去編寫軟件提供了一個(gè)非常好的基礎(chǔ)平臺(tái)和機(jī)會(huì)。

  知存科技王紹迪則表示,,兩種方案所需要解決的問題不一樣:1)有算力的存儲(chǔ)還是馮諾依曼架構(gòu)下的存儲(chǔ)器,,做一些加密類和低算力計(jì)算,從而節(jié)省存儲(chǔ)與CPU之間的帶寬,。存內(nèi)計(jì)算是非馮諾依曼架構(gòu),,它通過存儲(chǔ)單元完成二維和三維矩陣運(yùn)算(這類運(yùn)算占據(jù)了AI中95%以上的算力),提供大算力,,它存儲(chǔ)數(shù)據(jù)是為了高效完成運(yùn)算,,本質(zhì)不是做存儲(chǔ)器。

  對(duì)于存算產(chǎn)品,,有芯片和IP兩個(gè)選擇,。而目前我們觀察到,大多數(shù)企業(yè)也都是以芯片為主,。

  “存內(nèi)計(jì)算相關(guān)的IP是很難做的,,存內(nèi)計(jì)算針對(duì)的是運(yùn)算場(chǎng)景,,不是存儲(chǔ)標(biāo)品。需要針對(duì)不同場(chǎng)景的算力,、成本,、功耗需求提供更多種類的IP,并且針對(duì)不同的工藝去設(shè)計(jì),,需要投入的周期很長(zhǎng),。從測(cè)試方面,客戶集成存算IP的芯片需要增加特殊的測(cè)試步驟,。我個(gè)人覺得以單芯片和Chiplet形式提供存算一體算力是最佳的方式,。”王紹迪告訴筆者,。

  存內(nèi)計(jì)算的應(yīng)用市場(chǎng)廣闊,,但仍需時(shí)間的打磨

  關(guān)于存內(nèi)計(jì)算的具體應(yīng)用市場(chǎng)方向,王紹迪認(rèn)為,,存內(nèi)計(jì)算的發(fā)展類似于存儲(chǔ)器的發(fā)展路徑,,隨著設(shè)計(jì)能力不斷提升,工藝不斷成熟,、算力每年可以有5-10倍提升,,能效每年會(huì)有1-2倍提升,成本每年會(huì)有30-50%下降,,未來的存算產(chǎn)品可以用在大多數(shù)AI應(yīng)用場(chǎng)景,,因?yàn)樗杀舅懔δ苄Ф伎梢宰龅阶顑?yōu)。

  蘋芯CEO楊越的觀點(diǎn)是,,存內(nèi)計(jì)算的應(yīng)用方向及產(chǎn)品形態(tài)將隨著存算技術(shù)成熟度而演進(jìn),。中早期產(chǎn)品將更多的出現(xiàn)在端側(cè)對(duì)低功耗和高能效有強(qiáng)烈需求的場(chǎng)景下。值得強(qiáng)調(diào)的是,,隨著智能城市,、智能生態(tài)等應(yīng)用的普及,我們預(yù)測(cè)從邊緣端接入的智能設(shè)備的市場(chǎng)體量將快速增長(zhǎng),,應(yīng)用場(chǎng)景的多樣性也將不斷快速拓展,。長(zhǎng)遠(yuǎn)地看,存算產(chǎn)品的適用范圍也可能會(huì)延伸至超大算力領(lǐng)域,,我們將持續(xù)積極探索,,為未來的應(yīng)用場(chǎng)景做好技術(shù)儲(chǔ)備與戰(zhàn)略規(guī)劃。

  據(jù)了解,,目前蘋芯已開發(fā)實(shí)現(xiàn)了多款基于SRAM的存內(nèi)計(jì)算加速單元并已完成流片,,處于外部測(cè)試和demo階段,公司正與智慧穿戴、圖像物體識(shí)別領(lǐng)域的頭部客戶做技術(shù)驗(yàn)證,。

  “存內(nèi)計(jì)算技術(shù)的發(fā)展是一條追求高能效計(jì)算的重要技術(shù)路線,如何有效控制存內(nèi)計(jì)算接口是一個(gè)重要挑戰(zhàn),。誰擁有兼顧計(jì)算密度與存儲(chǔ)密度的存內(nèi)計(jì)算硬件架構(gòu),,誰就擁有了打開高能效計(jì)算的金鑰匙。未來的存內(nèi)計(jì)算一定會(huì)滲透到大大小小各種規(guī)模的應(yīng)用中去,,大大提高計(jì)算的能量效率,。”楊越坦言道,。

  在王紹迪看來,,存算一體面臨的挑戰(zhàn)就是時(shí)間,還有很多事情沒有做,,這些都需要通過不斷的實(shí)驗(yàn)去驗(yàn)證和解決,,需要時(shí)間,它還在發(fā)展初期,,有廣闊的提升空間,,這也是我最喜歡它的一點(diǎn)。距離存算一體的能力極限可能還有1000倍的空間,,每年我們都能把它提升2-5倍,,隨著算力提升和成本降低,它應(yīng)用場(chǎng)景會(huì)越來越廣,。

  寫在最后

  “存算一體”打破了運(yùn)行70年的馮諾依曼架構(gòu),,將成為AI時(shí)代主流的計(jì)算架構(gòu)。目前國(guó)內(nèi)外在存算一體方面都處于起步階段,,存算一體正處于學(xué)術(shù)界向工業(yè)界遷移的關(guān)鍵時(shí)期,,所以這可能是我們發(fā)展國(guó)產(chǎn)芯片的另一大重要方向。




電子技術(shù)圖片.png

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章,、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者,。如涉及作品內(nèi)容,、版權(quán)和其它問題,請(qǐng)及時(shí)通過電子郵件或電話通知我們,,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:[email protected],。