3月12日消息,,據(jù)路透社引述2名知情人士的話報道稱,,Meta正在測試第一顆自主研發(fā)的用于訓(xùn)練AI系統(tǒng)的RISC-V構(gòu)架芯片,,這款定制化設(shè)計的芯片將符合Meta自身的運(yùn)算需求,,并降低對于英偉達(dá)(NVIDIA)等AI芯片大廠的依賴。
據(jù)了解,,Meta這款自研AI芯片的測試,,是在芯片完成設(shè)計定案(即所謂tape-out)后展開的。一次tape-out成本可達(dá)數(shù)千萬美元,,大約需要3~6個月完成,,且無法保證測試必定成功。萬一失敗,,Meta需要找出芯片設(shè)計問題并重新tape-out步驟,。
Meta 之前曾在一次小規(guī)模測試部署中,推出一款自研的AI推理芯片,,但由于表現(xiàn)不佳而取消,,轉(zhuǎn)而在2022年下單采購數(shù)十億美元的英偉達(dá)GPU。自此之后,,Meta 成為NVIDIA一大客戶,,累積大量GPU用于訓(xùn)練模型,包括用于內(nèi)容推薦與廣告系統(tǒng),、以及大型語言模型Llama,,同時也為每天使用Meta旗下社交媒體平臺體超過30億用戶執(zhí)行推理工作,。但是這也使得Meta在采購英偉達(dá)GPU上耗費(fèi)了大量的資金。因此,,Meta還是希望通過自研AI芯片來降低成本,。
一名知情人士表示,不同于Meta此前推出的MTIA系列AI推理芯片,,Meta 最新曝光的這款自研的AI芯片,,是專門為AI訓(xùn)練任務(wù)所設(shè)計,預(yù)期還將整合HBM3或HBM3E內(nèi)存,。由于是定制化設(shè)計,,因此這款芯片的尺寸、功耗及性能可以實(shí)現(xiàn)最優(yōu)化,,有望比用于同樣AI工作負(fù)載的GPU更高效,。預(yù)計其每瓦性能表現(xiàn)可以與英偉達(dá)最新的GPU(如H200、B200,,甚至是下一代B300等)競爭,。
另一知情人士則稱,Meta這款自研的AI芯片將交由臺積電代工,。
對此傳聞,,Meta與臺積電均拒絕發(fā)表任何評論。
值得注意的是,,自研芯片是Meta長期計劃的一部分,,目的是降低AI基礎(chǔ)設(shè)施所帶來的成本。實(shí)際上,,Meta 預(yù)估2025年總支出介于1,140~1,190億美元之間,,其中資本支出上看650億美元,主要用于AI基礎(chǔ)設(shè)施建設(shè),,其中就包括自研AI芯片,。
2023年,Meta就曾推出了首款自研AI芯片MTIA(MTIA v1),,采用的是臺積電7nm制程,。而在2024年推出的第二代MTIA同樣是交由臺積電代工,不過制程工藝升級到了5nm,,配備更多處理核心,,片內(nèi)存儲(on-chip memory)也翻倍到了256MB(MTIA v1 僅有128MB),off-chip LPDDR5也提高到了128GB(MTIA v1 為 64GB),,主頻也從800MHz上升到了1.35GHz,,當(dāng)然功耗也增加到了90W(MTIA v1 為 25W)。需要指出的是,這兩代MTIA芯片都主要用于推理應(yīng)用,。
△MTIA v2
Meta當(dāng)時曾透露,,第二代MTIA已投入16個數(shù)據(jù)中心區(qū)域使用,主要用于決定Facebook與Instagram動態(tài)消息顯示的內(nèi)容推薦系統(tǒng),。Meta也承認(rèn),,第二代MTIA不會取代目前用于訓(xùn)練模型的GPU,而是補(bǔ)充運(yùn)算資源,。
Meta首席產(chǎn)品官Chris Cox在上周舉行的摩根士丹利科技,、媒體和電信大會表示,“我們正在研究如何訓(xùn)練推薦系統(tǒng),,最終考慮如何對生成式AI進(jìn)行訓(xùn)練和推理”,。他形容Meta的芯片開發(fā)任務(wù)目前處于“從走路到爬行再到奔跑”的階段,內(nèi)部認(rèn)為用于內(nèi)容推薦系統(tǒng)的第一代推理芯片是一大成功,。Meta希望2026年開始在AI訓(xùn)練階段使用自研芯片,。
顯然,這也意味著此次曝光的Meta自研的AI訓(xùn)練芯片如果獲得成功的話,,可能將會在2026年進(jìn)入大規(guī)模部署,。