過去70年,,計算機(jī)一直遵循馮·諾依曼架構(gòu)設(shè)計,,運(yùn)行時數(shù)據(jù)需要在處理器和內(nèi)存之間來回傳輸。
隨著時代發(fā)展,,這一工作模式面臨較大挑戰(zhàn):在人工智能等高并發(fā)計算場景中,,數(shù)據(jù)來回傳輸會產(chǎn)生巨大的功耗;目前內(nèi)存系統(tǒng)的性能提升速度大幅落后于處理器的性能提升速度,,有限的內(nèi)存帶寬無法保證數(shù)據(jù)高速傳輸,。
12月3日,快科技獲悉,,達(dá)摩院成功研發(fā)新型架構(gòu)芯片,。該芯片是全球首款基于DRAM的3D鍵合堆疊存算一體AI芯片,,可突破馮·諾依曼架構(gòu)的性能瓶頸,滿足人工智能等場景對高帶寬,、高容量內(nèi)存和極致算力的需求,。
在特定AI場景中,,該芯片性能提升10倍以上,,能效比提升高達(dá)300倍。
在摩爾定律逐漸放緩的背景下,,存算一體成為解決計算機(jī)性能瓶頸的關(guān)鍵技術(shù),。
存算一體芯片類似人腦,將數(shù)據(jù)存儲單元和計算單元融合,,可大幅減少數(shù)據(jù)搬運(yùn),,從而極大地提高計算并行度和能效。
這一技術(shù)早在上世紀(jì)90年代就被提出,,但受限于技術(shù)的復(fù)雜度,、高昂的設(shè)計成本以及應(yīng)用場景的匱乏,過去幾十年,,業(yè)界對存算一體芯片的研究進(jìn)展緩慢,。
達(dá)摩院研發(fā)的存算一體芯片集成了多個創(chuàng)新型技術(shù),是全球首款使用混合鍵合3D堆疊技術(shù)實(shí)現(xiàn)存算一體的芯片,。該芯片內(nèi)存單元采用異質(zhì)集成嵌入式DRAM(SeDRAM),,擁有超大帶寬、超大容量等特點(diǎn),;計算單元方面,,達(dá)摩院研發(fā)設(shè)計了流式的定制化加速器架構(gòu),對推薦系統(tǒng)進(jìn)行“端到端”的加速,,包括匹配,、粗排序、神經(jīng)網(wǎng)絡(luò)計算,、細(xì)排序等任務(wù),。
得益于整體架構(gòu)的創(chuàng)新,該芯片同時實(shí)現(xiàn)了高性能和低系統(tǒng)功耗,。在實(shí)際推薦系統(tǒng)應(yīng)用中,,相比傳統(tǒng)CPU計算系統(tǒng),存算一體芯片的性能提升10倍以上,,能效提升超過300倍,。該技術(shù)的研究成果已被芯片領(lǐng)域頂級會議ISSCC 2022收錄,未來可應(yīng)用于VR/AR,、無人駕駛,、天文數(shù)據(jù)計算,、遙感影像數(shù)據(jù)分析等場景。
達(dá)摩院計算技術(shù)實(shí)驗(yàn)室科學(xué)家鄭宏忠表示:“存算一體是顛覆性的芯片技術(shù),,它天然擁有高性能,、高帶寬和高能效的優(yōu)勢,可以從底層架構(gòu)上解決后摩爾定律時代的芯片性能和能耗問題,,達(dá)摩院研發(fā)的芯片將這一技術(shù)與場景緊密結(jié)合,,實(shí)現(xiàn)了內(nèi)存、計算以及算法應(yīng)用的完美融合,?!?/p>
據(jù)悉,達(dá)摩院計算技術(shù)實(shí)驗(yàn)室專注研究芯片設(shè)計方法學(xué)和新型計算機(jī)體系結(jié)構(gòu)技術(shù),,已擁有多項(xiàng)領(lǐng)先成果,,在ISSCC、ISCA,、MICRO,、HPCA等頂級會議上發(fā)表多篇論文。