3 月 11 日消息,,據(jù)路透社報(bào)道,,社交媒體公司 Meta(旗下?lián)碛?Facebook、Instagram 和 WhatsApp)正在測試其首款用于訓(xùn)練人工智能系統(tǒng)的自研芯片。據(jù)兩位知情人士透露,,此舉標(biāo)志著 Meta 在減少對外部供應(yīng)商(如英偉達(dá))的依賴、并逐步向設(shè)計(jì)更多定制化芯片方面邁出了關(guān)鍵一步,。
報(bào)道稱,,Meta 已開始小規(guī)模部署這款芯片,并計(jì)劃如果測試順利,,就增加產(chǎn)量以進(jìn)行大規(guī)模使用,。Meta 推動開發(fā)內(nèi)部芯片是其長期計(jì)劃的一部分,目的是降低龐大的基礎(chǔ)設(shè)施成本,。
據(jù)預(yù)測,,Meta 在 2025 年的總支出將在 1140 億至 1190 億美元(IT之家備注:當(dāng)前約 8277.36 億至 8640.41 億元人民幣)之間,其中包括高達(dá) 650 億美元的資本支出,,而其中大部分將用于人工智能基礎(chǔ)設(shè)施建設(shè),。消息人士稱,Meta 的這款新訓(xùn)練芯片是一款專用加速器,,專門用于處理人工智能相關(guān)任務(wù),,這使其相比通常用于人工智能工作負(fù)載的集成圖形處理單元(GPU)更具能效優(yōu)勢。
此外,,Meta 正在與中國臺灣地區(qū)的芯片制造商臺積電合作生產(chǎn)該芯片,。此次測試部署是在 Meta 完成芯片的首次“流片”后啟動的。流片是硅片開發(fā)工作中的一個重要里程碑,,涉及將初步設(shè)計(jì)送入芯片工廠進(jìn)行生產(chǎn),。通常,流片的成本高達(dá)數(shù)千萬美元,,耗時約三至六個月,,且無法保證測試一定成功。一旦失敗,,Meta 將不得不診斷問題并重新進(jìn)行流片,。
盡管 Meta 的自研芯片計(jì)劃在過去幾年中曾遭遇波折,甚至一度放棄了一款處于類似開發(fā)階段的芯片,,但該公司仍在持續(xù)推進(jìn)相關(guān)工作,。去年,Meta 開始在其推薦系統(tǒng)中使用一款自研的推理芯片,,用于運(yùn)行 Facebook 和 Instagram 新聞推送中的人工智能系統(tǒng),。Meta 高管表示,他們計(jì)劃從 2026 年開始使用自研芯片進(jìn)行訓(xùn)練,,即通過向人工智能系統(tǒng)輸入大量數(shù)據(jù)來“訓(xùn)練”其執(zhí)行任務(wù)的計(jì)算密集型過程,。
Meta 首席產(chǎn)品官克里斯?考克斯(Chris Cox)在上周的摩根士丹利科技,、媒體和電信會議上表示:“我們正在研究如何為推薦系統(tǒng)進(jìn)行訓(xùn)練,以及如何逐步思考生成式人工智能的訓(xùn)練和推理,?!彼麑?Meta 的芯片開發(fā)工作形容為“從爬行到行走再到奔跑”的過程,但同時指出,,第一代用于推薦系統(tǒng)的推理芯片取得了“巨大成功”,。
然而,Meta 此前曾因一款自研推理芯片在類似的小規(guī)模測試部署中失敗而暫停相關(guān)項(xiàng)目,,并在 2022 年轉(zhuǎn)而向英偉達(dá)訂購了價值數(shù)十億美元的 GPU,。此后,Meta 一直保持作為英偉達(dá)的最大客戶之一,,購買了大量 GPU 用于訓(xùn)練其模型,,包括推薦系統(tǒng)、廣告系統(tǒng)以及其 Llama 基礎(chǔ)模型系列,。這些芯片每天還為超過 30 億使用 Meta 應(yīng)用程序的用戶提供推理服務(wù),。
今年,隨著人工智能研究人員對通過不斷增加數(shù)據(jù)和計(jì)算能力來“擴(kuò)展”大型語言模型的潛力表示懷疑,,這些 GPU 的價值受到質(zhì)疑,。這種懷疑在 1 月底被中國初創(chuàng)公司 DeepSeek 推出的新低成本模型進(jìn)一步強(qiáng)化,這些模型通過更依賴推理而非計(jì)算能力來優(yōu)化效率,。受 DeepSeek 影響,,全球人工智能股票市場出現(xiàn)大幅波動,英偉達(dá)的股價一度下跌了五分之一,,盡管隨后大部分跌幅被收回,,但近期又因貿(mào)易擔(dān)憂等因素再次下跌。