《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 模擬設(shè)計 > 業(yè)界動態(tài) > 谷歌第七代TPU發(fā)布

谷歌第七代TPU發(fā)布

峰值算力可達(dá)4614TFLOPs
2025-04-11
來源:芯智訊
關(guān)鍵詞: 谷歌 TPU 算力

當(dāng)?shù)貢r間4月9日,,谷歌公司在美國舉行了“Google Cloud Next 25”大會,,正式發(fā)布了專為AI量身打造的第七代TPU(Tensor Processing Unit)加速器“Ironwood”,這是谷歌首款專為推理設(shè)計的TPU,可驅(qū)動思考型(thinking)和推理型(inferential)模型,,單芯片峰值算力可達(dá)4,614 TFLOPs,。

據(jù)介紹,,Ironwood是谷歌首款在其張量核和矩陣數(shù)學(xué)單元中支持 FP8 計算的 TPU,此前谷歌的 TPU 僅支持用于推理的 INT8 格式和處理以及用于訓(xùn)練的 BF16 格式和處理,。Ironwood 芯片還擁有第三代 SparseCore 加速器,該加速器首次在 TPU v5p 中首次亮相,,并在去年的 Trillium 芯片中得到了增強,。SparseCore 芯片最初旨在加速推薦模型,這些模型利用嵌入來跨用戶類別進行推薦,。Ironwood 芯片中的第三代 SparseCore 編碼了各種算法,,以加速金融和科學(xué)計算,但具體細(xì)節(jié)未透露,。

Ironwood還大幅增加高頻寬內(nèi)存(HBM)容量,,每顆芯片的HBM容量提高到了192GB,達(dá)到了Trillium的6倍,,可處理更大型的模型和數(shù)據(jù)集運算,減少頻繁的數(shù)據(jù)傳輸需求,,提升整體性能,。同時,HBM帶寬也大幅提升,,Ironwood單顆芯片的內(nèi)存帶寬可達(dá)7.2Tbps,,是Trillium的4.5倍。如此高速的帶寬可確保數(shù)據(jù)快速存取,。

谷歌還強化了Ironwood芯片間互連(Inter-Chip Interconnect,,ICI)帶寬,雙向傳輸提高至1.2Tbps,,是Trillium的1.5倍,,如此一來加速芯片間的通信,提升大型分布式訓(xùn)練和推理的效率,。

1.jpg

△Ironword 封裝包括計算芯片上方的中央小芯片,,以及沿頂部邊緣的HBM上方的另外兩個小芯片。這些無疑是谷歌用于將 TPU 芯片電氣連接成 pod 的芯片間互連 (ICI) 的 I/O 芯片,。更大的 TPU 聚合與谷歌的“Jupiter”光電路開關(guān)進一步捆綁在一起,。

總體來看,得益于計算核心,、HBM等多方面的提升,,Ironword單芯片峰值算力可達(dá)4,614 TFLOPs,達(dá)到了上一代 Trillium的10倍,。

2.jpg

▲近三代谷歌TPU產(chǎn)品比較

在提升性能的同時,,谷歌還提升了“Ironwood”能效表現(xiàn)。據(jù)介紹,,相比 2024年推出的第六代TPU “Trillium”,,Ironwood的性能功耗比達(dá)到了Trillium的2倍,。Ironwood 還可結(jié)合先進的液冷解決方案和芯片設(shè)計優(yōu)化,即使持續(xù)面對繁重AI工作負(fù)載,,也能維持相比標(biāo)準(zhǔn)氣冷高出近2倍的性能,。

Ironwood 根據(jù)客戶對AI工作負(fù)載的需求提供2種規(guī)模配置,分別是面向推理的256個計算引擎的版本,、面向訓(xùn)練的9,216個計算引擎的版本,。

3.jpg

當(dāng)擴展至每個Pod達(dá)到9,216顆晶片時,總運算能力可達(dá)42.5 Exaflops,,是世界上最大的超級電腦El Capitan的24倍以上,,El Capitan每個Pod僅提供1.7 Exaflops。由于Ironwood提供大規(guī)模運算能力,,能夠支持最嚴(yán)苛的AI工作負(fù)載,,例如用于訓(xùn)練和推理、具備思考能力的超大型密集LLM或MoE,。

Ironwood 還配備增強版的SparseCore,,這是一種專門用于處理進階排序和推薦系統(tǒng)工作負(fù)載常見的超大規(guī)模嵌入加速器。此外,,Google DeepMind 開發(fā)的機器學(xué)習(xí)執(zhí)行階段構(gòu)架Pathways,,可在多個TPU間達(dá)成高效的分布式運算。Google Cloud 上的Pathways讓客戶輕易超越單個Ironwood Pod的限制,,將數(shù)十萬顆芯片組合在一起,,快速推進AI發(fā)展。

AI芯片競爭激烈之際,,英偉達(dá)仍處于領(lǐng)先地位,,除谷歌外,亞馬遜和微軟等科技巨頭都在發(fā)展自家的解決方案,,亞馬遜擁有AWS Trainium / Inferentia芯片以及Graviton處理器,,微軟則有Maia 100、Cobalt 100芯片?,F(xiàn)在Ironwood加入TPU陣容,,有望繼續(xù)強化Google Cloud服務(wù)。


官方訂閱.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章,、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者,。如涉及作品內(nèi)容,、版權(quán)和其它問題,,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟損失,。聯(lián)系電話:010-82306118;郵箱:[email protected],。