香蕉视频在线看91,日韩精品人妻中文字幕区二区三区

存內(nèi)計(jì)算,，要爆發(fā)了？

日期： 2021-10-29

來源：半導(dǎo)體行業(yè)觀察

關(guān)鍵詞： 存內(nèi)計(jì)算

　　存算一體的基本概念最早可以追溯到上個(gè)世紀(jì)七十年代,，但是受限于芯片設(shè)計(jì)復(fù)雜度與制造成本問題,，以及缺少殺手級(jí)大數(shù)據(jù)應(yīng)用進(jìn)行驅(qū)動(dòng)，存算一體一直不溫不火,，但最近幾年,，存算一體似乎已經(jīng)進(jìn)入爆發(fā)前夕。

　　尤其是國(guó)內(nèi)一大批存算一體技術(shù)公司伴隨著融資信息浮出水面,，如知存科技,、蘋芯科技、九天睿芯,、后摩智能,、合肥恒爍、閃憶科技,、新憶科技,、杭州智芯科等，動(dòng)輒億元起的融資金額也充分證明了資本對(duì)存算一體這個(gè)賽道的青睞,。國(guó)外的三星和Myhtic也是該領(lǐng)域的潛心研究者，他們近來也動(dòng)作頻頻,，在最近的hotchips上,，三星就披露了他們的HBM-PIM方案，Myhtic的存算一體模擬AI芯片也有了新進(jìn)展,。一個(gè)新的存儲(chǔ)計(jì)算時(shí)代似乎將要來臨,。

　　存內(nèi)計(jì)算市場(chǎng)為何被看好？

　　今年5月Myhtic C輪融資了7000萬美元,，迄今為止已共計(jì)籌集了1.65億美元,；6月10日，知存科技宣布完成億元A3輪融資,，產(chǎn)品線擴(kuò)充及新的產(chǎn)品量產(chǎn),，加上此前的兩輪融資，截至目前,，知存科技已完成累計(jì)近3億元的A輪系列融資,；6月25日九天睿芯獲億元級(jí)A輪融資，用于新產(chǎn)品研發(fā)和人員擴(kuò)充的工作,；7月2日,，杭州智芯科完成近億元的天使輪融資，用于繼續(xù)搭建團(tuán)隊(duì)，啟動(dòng)ACIM下一階段技術(shù)研發(fā)與市場(chǎng)拓展,；8月24日,，后摩智能宣布完成3億元人民幣Pre-A輪融資，將用于加速芯片產(chǎn)品技術(shù)研發(fā),、團(tuán)隊(duì)拓展,，早期市場(chǎng)布局及商業(yè)落地；8月24日,，蘋芯科技完成近千萬美元Pre-A輪融資,，據(jù)悉，本輪融資將主要用于芯片研發(fā)相關(guān)工作,。

　　從融資金額的用途我們也可以窺見,，這些存算一體芯片公司有的處于團(tuán)隊(duì)搭建階段，有的是正在芯片研發(fā)階段,，還有的已經(jīng)到了產(chǎn)品線擴(kuò)充和量產(chǎn)階段,。前幾年（2019年左右）這個(gè)市場(chǎng)國(guó)內(nèi)也就僅有3-4家嶄露頭角的企業(yè)，但現(xiàn)在存算一體這個(gè)賽道顯然已經(jīng)開始變得熱鬧起來了,。

　　動(dòng)輒億元的資本涌入,，前仆后繼的玩家踴躍跳入。為何存算一體芯片市場(chǎng)會(huì)如此被看好,？

　　存算一體技術(shù)（PIM ：Processing in-memory）被視為人工智能創(chuàng)新的核心,。它將存儲(chǔ)和計(jì)算有機(jī)結(jié)合，直接利用存儲(chǔ)單元進(jìn)行計(jì)算,，極大地消除了數(shù)據(jù)搬移帶來的開銷,，解決了傳統(tǒng)芯片在運(yùn)行人工智能算法上的“存儲(chǔ)墻”與“功耗墻”問題，可以數(shù)十倍甚至百倍地提高人工智能運(yùn)算效率,，降低成本,。

　　在知存科技CEO王紹迪的眼中，一直看好存算一體技術(shù)的原因有三：一是算力和運(yùn)算數(shù)據(jù)量每年都在指數(shù)級(jí)增加,，然而摩爾定律已經(jīng)接近于到極限,，每代芯片只有10-20%的性能提升。二是馮諾依曼架構(gòu)的算力已經(jīng)被內(nèi)存墻所限制,，只有解決內(nèi)存墻問題才能進(jìn)一步提高算力,。在各種解決方案中，存內(nèi)計(jì)算是最直接也是最高效的,。

　　蘋芯科技CEO楊越則認(rèn)為,，萬物互聯(lián)+的人工智能的時(shí)代已經(jīng)到來。智能產(chǎn)品覆蓋面積越來越大,，產(chǎn)品形態(tài)的多樣性將迎來爆發(fā)式的增長(zhǎng),。我們可以預(yù)見,，由于傳輸延遲或數(shù)據(jù)安全考慮，很多數(shù)據(jù)處理及推理運(yùn)算將在端側(cè)發(fā)生,。通用性計(jì)算芯片在服務(wù)特定AI算法方面并不具備性價(jià)比優(yōu)勢(shì),，為AI定制的芯片將成為人工智能產(chǎn)業(yè)鏈條上的底層核心技術(shù)。存內(nèi)計(jì)算作為創(chuàng)新性極強(qiáng)的芯片架構(gòu)形式,，由于突破了困擾業(yè)界多年的存儲(chǔ)墻問題,，且與深度學(xué)習(xí)網(wǎng)絡(luò)運(yùn)算模型中的基本算子高度契合，使得基于存內(nèi)計(jì)算架構(gòu)的芯片相比于市場(chǎng)已有的AI加速芯片,，在計(jì)算效率（TOPS/Watt）方面有數(shù)量級(jí)上的提升,。在智能時(shí)代里，從可穿戴到自動(dòng)駕駛,，功耗約束下場(chǎng)景里的計(jì)算效率都是永恒的主題,，存內(nèi)計(jì)算是解放算力、提升能效比最強(qiáng)有力的武器之一,。

　　而且與其他低功耗計(jì)算,，如低電壓亞閾值數(shù)字邏輯ASIC、神經(jīng)模態(tài)（Neuromorphics）計(jì)算和模擬計(jì)算比較,，存內(nèi)計(jì)算的優(yōu)勢(shì)也盡顯,。

　　王紹迪表示，低功耗亞閾值計(jì)算是對(duì)現(xiàn)有邏輯計(jì)算的功耗優(yōu)化,，一般能效可以提升2-4倍,，但是算力相應(yīng)降低，只能進(jìn)行針對(duì)性的優(yōu)化,。而存內(nèi)計(jì)算是新型的運(yùn)算架構(gòu),，做的是二維和三維矩陣運(yùn)算，能效和算力可以提高100-1000倍,。神經(jīng)模態(tài)運(yùn)算是為類腦算法而設(shè)計(jì)的芯片,，有不同的實(shí)現(xiàn)方式,，如模擬計(jì)算,、數(shù)字計(jì)算、無時(shí)鐘計(jì)算,、或者存算一體的實(shí)現(xiàn)方式,。其實(shí)上述三種技術(shù)解決的問題是不一樣的,。后摩爾時(shí)代下,，無法通過工藝的提升來優(yōu)化整體算力，異構(gòu)計(jì)算和新架構(gòu)變得更為重要,。

　　在楊越看來,，與亞閾值數(shù)字邏輯相比,，存內(nèi)計(jì)算仍工作在正常供電范圍,，可具有實(shí)現(xiàn)高算力的可能性。存內(nèi)計(jì)算的原理就是模擬計(jì)算,。存內(nèi)計(jì)算與神經(jīng)形態(tài)計(jì)算有交集,，就是用存內(nèi)計(jì)算的原理去實(shí)現(xiàn)synaptic connection，可提供高平行度,、高能效地synaptic weighting的計(jì)算,。

　　存內(nèi)計(jì)算的三條主流技術(shù)路徑

　　在認(rèn)準(zhǔn)了賽道之后，就是選擇存內(nèi)計(jì)算的技術(shù)路徑,。對(duì)于存算一體技術(shù)來說,，處于多種存儲(chǔ)介質(zhì)百花齊放的格局，如SRAM,，DRAM,，F(xiàn)lash等。目前選擇SRAM介質(zhì)陣營(yíng)的主要有蘋芯科技,、后摩智能,、九天睿芯。Flash陣營(yíng)的代表玩家有知存科技,、合肥恒爍,、美國(guó)的Mythic。DRAM陣營(yíng)的還相對(duì)偏少,。

　　那么該如何選擇合適的技術(shù)路徑,，這些技術(shù)路徑又有何特點(diǎn)、壁壘和優(yōu)勢(shì)呢,？蘋芯CEO楊越認(rèn)為,，技術(shù)路線選擇的出發(fā)點(diǎn)有多個(gè)，包括工藝成熟度,、加入計(jì)算功能的復(fù)雜度及結(jié)果精度,、向上對(duì)神經(jīng)網(wǎng)絡(luò)算法要求的支持程度、以及落地成本等方面的考慮,。

　　從器件工藝成熟度來看,，知存科技認(rèn)為，SRAM,、DRAM和Flash都是成熟的存儲(chǔ)技術(shù),，其中SRAM可以在先進(jìn)工藝上如5nm上制造，DRAM和Flash可在10-20nm工藝上制造,。密度方面,，F(xiàn)lash最高，其次是DRAM,，再次是SRAM,。

　　在電路設(shè)計(jì)難度上,，存內(nèi)計(jì)算的DRAM > 存內(nèi)計(jì)算SRAM > 存內(nèi)計(jì)算Flash ，在存內(nèi)計(jì)算方面,，SRAM和DRAM更難設(shè)計(jì),，它們是易失性存儲(chǔ)器，工藝偏差會(huì)大幅度增加模擬計(jì)算的設(shè)計(jì)難度,，尤其是當(dāng)容量增大到可實(shí)用的MB以上,，目前市面上還沒有SRAM和DRAM的存內(nèi)計(jì)算產(chǎn)品；Flash是非易失存儲(chǔ)器,，他的狀態(tài)是連續(xù)可編程的,，可以通過編程等方式來校準(zhǔn)工藝偏差，從而提高精度,。而近存計(jì)算的設(shè)計(jì)相對(duì)簡(jiǎn)單,，可采用成熟的存儲(chǔ)器技術(shù)和邏輯電路設(shè)計(jì)技術(shù)。

　　而談到量產(chǎn)難度方面,，王紹迪給出的答案是DRAM> Flash >SRAM,。

　　“我們過去做過多種存算一體介質(zhì)的流片，包括Flash,、SRAM,、RRAM和MRAM。最終發(fā)現(xiàn),，F(xiàn)lash是密度最高的存儲(chǔ)介質(zhì),，F(xiàn)lash的單個(gè)單元可以存儲(chǔ)的bit數(shù)最高（8-bit），這兩個(gè)特點(diǎn)都可以大幅度增加存內(nèi)計(jì)算的算力,?！蓖踅B迪告訴筆者，所以從密度,、可量產(chǎn)性,、能效層面多方面綜合考量，知存科技最終選擇了Flash介質(zhì),。

　　楊越表示,，F(xiàn)lash和SRAM 路線各自具備優(yōu)勢(shì)。我們選擇SRAM方案出于幾個(gè)考慮：一,，SRAM的速度是所有memory類型中最快的,，且沒有寫次數(shù)的限制,，對(duì)于追求快響應(yīng)的場(chǎng)景幾乎是必選,。二，SRAM可以向先進(jìn)制程兼容,，從而達(dá)到更高的能效比,，更高的面效比等,。三，蘋芯現(xiàn)階段的研究工作可大幅提高SRAM相關(guān)計(jì)算精度,，從而降低了對(duì)相關(guān)上層算法補(bǔ)償?shù)囊?。四，相?duì)新型存儲(chǔ)器,，SRAM的工藝成熟度較高,，可以相對(duì)較快的實(shí)現(xiàn)技術(shù)落地與量產(chǎn)。

　　存內(nèi)計(jì)算的最終產(chǎn)品形態(tài)

　　在討論存內(nèi)計(jì)算最終的產(chǎn)品形態(tài)之前,，讓我們首先來看下存內(nèi)計(jì)算的賣點(diǎn)究竟是什么,？它應(yīng)該被認(rèn)為是一個(gè)有計(jì)算能力的存儲(chǔ)器，還是高能效比的計(jì)算模塊,。如果是前者,，則往往需要和臺(tái)積電等有志于推動(dòng)下一代存儲(chǔ)器的廠商一起合作。而后者則更傾向于以AI芯片的形式做design house,。

　　蘋芯CEO楊越認(rèn)為,，存內(nèi)計(jì)算硬件的出現(xiàn)，本身在催生一種編程觀念上的革命,，也就不能再套用傳統(tǒng)的功能上分離的思維去理解,。從功能上來說，存內(nèi)計(jì)算既可以存儲(chǔ)數(shù)據(jù),，又可以做特定的計(jì)算,，本身并不矛盾。從programmability的角度講,，面向AI 的存算一體技術(shù)的出現(xiàn)將會(huì)很大程度上影響人們?nèi)绾稳ゾ帉戃浖?，或者說為更有效率的去編寫軟件提供了一個(gè)非常好的基礎(chǔ)平臺(tái)和機(jī)會(huì)。

　　知存科技王紹迪則表示,，兩種方案所需要解決的問題不一樣：1）有算力的存儲(chǔ)還是馮諾依曼架構(gòu)下的存儲(chǔ)器,，做一些加密類和低算力計(jì)算，從而節(jié)省存儲(chǔ)與CPU之間的帶寬,。存內(nèi)計(jì)算是非馮諾依曼架構(gòu),，它通過存儲(chǔ)單元完成二維和三維矩陣運(yùn)算（這類運(yùn)算占據(jù)了AI中95%以上的算力），提供大算力,，它存儲(chǔ)數(shù)據(jù)是為了高效完成運(yùn)算,，本質(zhì)不是做存儲(chǔ)器。

　　對(duì)于存算產(chǎn)品,，有芯片和IP兩個(gè)選擇,。而目前我們觀察到，大多數(shù)企業(yè)也都是以芯片為主,。

　　“存內(nèi)計(jì)算相關(guān)的IP是很難做的,，存內(nèi)計(jì)算針對(duì)的是運(yùn)算場(chǎng)景,，不是存儲(chǔ)標(biāo)品。需要針對(duì)不同場(chǎng)景的算力,、成本,、功耗需求提供更多種類的IP，并且針對(duì)不同的工藝去設(shè)計(jì),，需要投入的周期很長(zhǎng),。從測(cè)試方面，客戶集成存算IP的芯片需要增加特殊的測(cè)試步驟,。我個(gè)人覺得以單芯片和Chiplet形式提供存算一體算力是最佳的方式,。”王紹迪告訴筆者,。

　　存內(nèi)計(jì)算的應(yīng)用市場(chǎng)廣闊,，但仍需時(shí)間的打磨

　　關(guān)于存內(nèi)計(jì)算的具體應(yīng)用市場(chǎng)方向，王紹迪認(rèn)為,，存內(nèi)計(jì)算的發(fā)展類似于存儲(chǔ)器的發(fā)展路徑,，隨著設(shè)計(jì)能力不斷提升，工藝不斷成熟,、算力每年可以有5-10倍提升,，能效每年會(huì)有1-2倍提升，成本每年會(huì)有30-50%下降,，未來的存算產(chǎn)品可以用在大多數(shù)AI應(yīng)用場(chǎng)景,，因?yàn)樗杀舅懔δ苄Ф伎梢宰龅阶顑?yōu)。

　　蘋芯CEO楊越的觀點(diǎn)是,，存內(nèi)計(jì)算的應(yīng)用方向及產(chǎn)品形態(tài)將隨著存算技術(shù)成熟度而演進(jìn),。中早期產(chǎn)品將更多的出現(xiàn)在端側(cè)對(duì)低功耗和高能效有強(qiáng)烈需求的場(chǎng)景下。值得強(qiáng)調(diào)的是,，隨著智能城市,、智能生態(tài)等應(yīng)用的普及，我們預(yù)測(cè)從邊緣端接入的智能設(shè)備的市場(chǎng)體量將快速增長(zhǎng),，應(yīng)用場(chǎng)景的多樣性也將不斷快速拓展,。長(zhǎng)遠(yuǎn)地看，存算產(chǎn)品的適用范圍也可能會(huì)延伸至超大算力領(lǐng)域,，我們將持續(xù)積極探索,，為未來的應(yīng)用場(chǎng)景做好技術(shù)儲(chǔ)備與戰(zhàn)略規(guī)劃。

　　據(jù)了解,，目前蘋芯已開發(fā)實(shí)現(xiàn)了多款基于SRAM的存內(nèi)計(jì)算加速單元并已完成流片,，處于外部測(cè)試和demo階段，公司正與智慧穿戴、圖像物體識(shí)別領(lǐng)域的頭部客戶做技術(shù)驗(yàn)證,。

　　“存內(nèi)計(jì)算技術(shù)的發(fā)展是一條追求高能效計(jì)算的重要技術(shù)路線，如何有效控制存內(nèi)計(jì)算接口是一個(gè)重要挑戰(zhàn),。誰擁有兼顧計(jì)算密度與存儲(chǔ)密度的存內(nèi)計(jì)算硬件架構(gòu),，誰就擁有了打開高能效計(jì)算的金鑰匙。未來的存內(nèi)計(jì)算一定會(huì)滲透到大大小小各種規(guī)模的應(yīng)用中去,，大大提高計(jì)算的能量效率,。”楊越坦言道,。

　　在王紹迪看來,，存算一體面臨的挑戰(zhàn)就是時(shí)間，還有很多事情沒有做,，這些都需要通過不斷的實(shí)驗(yàn)去驗(yàn)證和解決,，需要時(shí)間，它還在發(fā)展初期,，有廣闊的提升空間,，這也是我最喜歡它的一點(diǎn)。距離存算一體的能力極限可能還有1000倍的空間,，每年我們都能把它提升2-5倍,，隨著算力提升和成本降低，它應(yīng)用場(chǎng)景會(huì)越來越廣,。

　　寫在最后

　　“存算一體”打破了運(yùn)行70年的馮諾依曼架構(gòu),，將成為AI時(shí)代主流的計(jì)算架構(gòu)。目前國(guó)內(nèi)外在存算一體方面都處于起步階段,，存算一體正處于學(xué)術(shù)界向工業(yè)界遷移的關(guān)鍵時(shí)期,，所以這可能是我們發(fā)展國(guó)產(chǎn)芯片的另一大重要方向。

電子技術(shù)圖片.png

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外,，轉(zhuǎn)載內(nèi)容只為傳遞更多信息,，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章,、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者,。如涉及作品內(nèi)容,、版權(quán)和其它問題，請(qǐng)及時(shí)通過電子郵件或電話通知我們,，以便迅速采取適當(dāng)措施,，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：[email protected],。

存內(nèi)計(jì)算,，要爆發(fā)了？

日期： 2021-10-29

來源：半導(dǎo)體行業(yè)觀察

相關(guān)內(nèi)容