12 月 3 日消息,,據(jù)阿里云官方微信公眾號發(fā)布,阿里達摩院成功研發(fā)出存算一體芯片,。這是全球首款基于 DRAM 的 3D 鍵合堆疊存算一體芯片,。該芯片突破了馮?諾依曼架構(gòu)的性能瓶頸,滿足人工智能等場景對高帶寬,、高容量內(nèi)存和極致算力的需求,。在特定 AI 場景中,該芯片性能提升 10 倍以上,,效能比提升高達 300 倍,。
為了拉近計算資源和存儲資源的距離,達摩院計算技術(shù)實驗室創(chuàng)新性采用混合鍵合 (Hybrid Bonding) 的 3D 堆疊技術(shù)進行芯片封裝 —— 將計算芯片和存儲芯片 face-to-face 地用特定金屬材質(zhì)和工藝進行互聯(lián),。
相比業(yè)內(nèi)常見的封裝方案 HBM,,混合鍵合 3D 堆疊技術(shù)擁有高帶寬、低成本等特點,,被認為是低功耗近存計算的完美載體之一,;內(nèi)存單元采用異質(zhì)集成嵌入式 DRAM ,,擁有超大內(nèi)存容量和超大帶寬優(yōu)勢。
在計算芯片方面,,達摩院研發(fā)設(shè)計了流式的定制化加速器架構(gòu),,對推薦系統(tǒng)進行“端到端”加速,包括匹配,、粗排序,、神經(jīng)網(wǎng)絡(luò)計算、細排序等任務(wù),。
這種近存架構(gòu)有效解決了帶寬受限的問題,,最終內(nèi)存、算法以及計算模塊的完美融合,,大幅提升帶寬的同時還實現(xiàn)了超低功耗,,展示了近存計算在數(shù)據(jù)中心場景的潛力。
達摩院表示,,最終的測試芯片顯示,,這種存算技術(shù)和架構(gòu)的優(yōu)勢顯著,能通過拉近存儲單元與計算單元的距離增加帶寬,,降低數(shù)據(jù)搬運的代價,,緩解由于數(shù)據(jù)搬運產(chǎn)生的瓶頸,而且與數(shù)據(jù)中心的推薦系統(tǒng)對于帶寬/內(nèi)存的需求完美匹配,。
目前,,該芯片的研究成果已被芯片領(lǐng)域頂級會議 ISSCC 2022 收錄。