3月12日消息,,據(jù)路透社引述2名知情人士的話報(bào)道稱,,Meta正在測試第一顆自主研發(fā)的用于訓(xùn)練AI系統(tǒng)的RISC-V構(gòu)架芯片,,這款定制化設(shè)計(jì)的芯片將符合Meta自身的運(yùn)算需求,并降低對于英偉達(dá)(NVIDIA)等AI芯片大廠的依賴,。
據(jù)了解,,Meta這款自研AI芯片的測試,是在芯片完成設(shè)計(jì)定案(即所謂tape-out)后展開的,。一次tape-out成本可達(dá)數(shù)千萬美元,,大約需要3~6個(gè)月完成,且無法保證測試必定成功,。萬一失敗,,Meta需要找出芯片設(shè)計(jì)問題并重新tape-out步驟。
Meta 之前曾在一次小規(guī)模測試部署中,,推出一款自研的AI推理芯片,,但由于表現(xiàn)不佳而取消,轉(zhuǎn)而在2022年下單采購數(shù)十億美元的英偉達(dá)GPU,。自此之后,,Meta 成為NVIDIA一大客戶,累積大量GPU用于訓(xùn)練模型,,包括用于內(nèi)容推薦與廣告系統(tǒng),、以及大型語言模型Llama,同時(shí)也為每天使用Meta旗下社交媒體平臺體超過30億用戶執(zhí)行推理工作,。但是這也使得Meta在采購英偉達(dá)GPU上耗費(fèi)了大量的資金,。因此,Meta還是希望通過自研AI芯片來降低成本,。
一名知情人士表示,,不同于Meta此前推出的MTIA系列AI推理芯片,Meta 最新曝光的這款自研的AI芯片,,是專門為AI訓(xùn)練任務(wù)所設(shè)計(jì),,預(yù)期還將整合HBM3或HBM3E內(nèi)存。由于是定制化設(shè)計(jì),,因此這款芯片的尺寸,、功耗及性能可以實(shí)現(xiàn)最優(yōu)化,有望比用于同樣AI工作負(fù)載的GPU更高效,。預(yù)計(jì)其每瓦性能表現(xiàn)可以與英偉達(dá)最新的GPU(如H200,、B200,甚至是下一代B300等)競爭,。
另一知情人士則稱,,Meta這款自研的AI芯片將交由臺積電代工。
對此傳聞,,Meta與臺積電均拒絕發(fā)表任何評論,。
值得注意的是,自研芯片是Meta長期計(jì)劃的一部分,,目的是降低AI基礎(chǔ)設(shè)施所帶來的成本,。實(shí)際上,Meta 預(yù)估2025年總支出介于1,140~1,190億美元之間,,其中資本支出上看650億美元,,主要用于AI基礎(chǔ)設(shè)施建設(shè),其中就包括自研AI芯片,。
2023年,,Meta就曾推出了首款自研AI芯片MTIA(MTIA v1),采用的是臺積電7nm制程,。而在2024年推出的第二代MTIA同樣是交由臺積電代工,,不過制程工藝升級到了5nm,配備更多處理核心,,片內(nèi)存儲(chǔ)(on-chip memory)也翻倍到了256MB(MTIA v1 僅有128MB),,off-chip LPDDR5也提高到了128GB(MTIA v1 為 64GB),,主頻也從800MHz上升到了1.35GHz,當(dāng)然功耗也增加到了90W(MTIA v1 為 25W),。需要指出的是,,這兩代MTIA芯片都主要用于推理應(yīng)用。
△MTIA v2
Meta當(dāng)時(shí)曾透露,,第二代MTIA已投入16個(gè)數(shù)據(jù)中心區(qū)域使用,,主要用于決定Facebook與Instagram動(dòng)態(tài)消息顯示的內(nèi)容推薦系統(tǒng)。Meta也承認(rèn),,第二代MTIA不會(huì)取代目前用于訓(xùn)練模型的GPU,,而是補(bǔ)充運(yùn)算資源。
Meta首席產(chǎn)品官Chris Cox在上周舉行的摩根士丹利科技,、媒體和電信大會(huì)表示,,“我們正在研究如何訓(xùn)練推薦系統(tǒng),最終考慮如何對生成式AI進(jìn)行訓(xùn)練和推理”,。他形容Meta的芯片開發(fā)任務(wù)目前處于“從走路到爬行再到奔跑”的階段,,內(nèi)部認(rèn)為用于內(nèi)容推薦系統(tǒng)的第一代推理芯片是一大成功。Meta希望2026年開始在AI訓(xùn)練階段使用自研芯片,。
顯然,,這也意味著此次曝光的Meta自研的AI訓(xùn)練芯片如果獲得成功的話,可能將會(huì)在2026年進(jìn)入大規(guī)模部署,。