本文作者: 李壽鵬
本文來源: 半導(dǎo)體行業(yè)觀察
原文鏈接:https://mp.weixin.qq.com/s/RmVrg5LynNKFxwoCCDUvcA
在生成式AI浪潮的推動下,,AMD也成為半導(dǎo)體市場的一個(gè)贏家,。
根據(jù)最新的數(shù)據(jù)顯示,,自今年年初以來,AMD的市值大漲超過90%,。如果將時(shí)間線拉長到五年,,AMD的市值大漲超過660%。在這背后,,除了文章開頭談到的生成式AI推動外,,AMD所推動的基于ZEN架構(gòu)CPU和專為數(shù)據(jù)中心專用GPU設(shè)計(jì)的CDNA架構(gòu)產(chǎn)品,收購Xilinx和Pensando所獲得的的FPGA和DPU,,以及公司在Chiplet和3D V-Cache等技術(shù)的投入功不可沒,。
在今天于舊金山舉辦的產(chǎn)品發(fā)布會上,AMD CEO Lisa Su更是直言,,我們?nèi)蕴幱?AI 生命周期的非常,、非常早的階段,。而根據(jù)他們的預(yù)估,數(shù)據(jù)中心AI加速器的TAM到2027年將會達(dá)到1500億美元,,這意味著未來四年的CAGR將會超過50%,。
正是在這樣龐大市場需求的推動下,AMD帶來了公司最新的,,極具競爭力的AMD Instinct MI300系列的產(chǎn)品更多細(xì)節(jié)和更新。與此同時(shí),,AMD還帶來了第四代的Epyc產(chǎn)品的更新,,全面擁抱數(shù)據(jù)中心新時(shí)代。
1530億晶體管的怪獸芯片,,震撼登場
在AMD今天的發(fā)布會上,,最受人關(guān)注的毫無疑問是公司的Instinct MI 300系列。因?yàn)樵?a class="innerlink" href="http://forexkbc.com/tags/英偉達(dá)" target="_blank">英偉達(dá)GPU把持的AI時(shí)代,,大家希望AMD的這系列芯片能成為萬億芯片巨頭的最強(qiáng)競爭者,。而從Lisa提供的參數(shù)看來,MI 300系列的新芯片擁有極強(qiáng)的競爭力,。
“人工智能是塑造下一代計(jì)算的決定性技術(shù),,也是 AMD 最大的戰(zhàn)略增長機(jī)會?!盠isa Su強(qiáng)調(diào),。
對AMD有了解的讀者應(yīng)該知道,MI 300是他們在去年六月發(fā)布的,,面向AI和HPC推出的一個(gè)重要產(chǎn)品,。通過將CPU和GPU以chiplet的方式集成到一個(gè)芯片,并采用統(tǒng)一的內(nèi)存架構(gòu),,AMD希望這個(gè)市場能夠給AI市場帶來不一樣的產(chǎn)品,。
而在今日,AMD帶來了公司的AMD Instinct MI 300X,,一款專門面向生成式AI推出的加速器,。和AMD Instinct MI 300A不一樣,AMD Instinct MI 300X并沒有集成CPU內(nèi)核,,而是采用了8 個(gè) GPU chiplet(基于CDNA 3架構(gòu))和另外 4 個(gè) IO 內(nèi)存chiplet的設(shè)計(jì),,這讓其集成的晶體管數(shù)量達(dá)到了驚人的1530億。而為了緩解AI 大型語言模型 (LLM) 所面臨的內(nèi)存制約,,AMD為這款芯片集成了192GB的HBM 3,,其存儲帶寬也高達(dá)5.2 TB/s,可以處理的參數(shù)高達(dá)400億,。
作為一款對標(biāo)英偉達(dá)H100的產(chǎn)品,,如圖所示,,AMD Instinct MI 300X的HMB密度是前者的2.4倍,帶寬則為前者的1.6倍,。這讓AMD的這顆產(chǎn)品在當(dāng)前的AI時(shí)代競爭力大增,。同時(shí),據(jù)AMD方面透露,,基于帶寬高達(dá)896GB/s的AMD Infinity架構(gòu),,我們可以將八個(gè) M1300X 加速器組合在一個(gè)系統(tǒng)中,這樣就能為開發(fā)帶來更強(qiáng)大的計(jì)算能力,為 AI 推理和訓(xùn)練提供不一樣的解決方案,。據(jù)AMD介紹,,該芯片會在今年三季度送樣,值得一提的是,,這種設(shè)計(jì)方法也是英偉達(dá)的 8 路 HGX 和英特爾Ponte Vecchio 的X8 UBB的選擇,。
如前面所說,AMD同期還推出了AMD Instinct MI300A,,這是全球首款面向AI和HPC的APU,,采用了集成24 個(gè) Zen 4 內(nèi)核、CDNA3 GPU 內(nèi)核和 128GB HBM3的設(shè)計(jì),。換而言之,,和MI 300X只是集成GPU內(nèi)核不一樣,AMD Instinct MI300A在設(shè)計(jì)上同時(shí)集成了CPU和GPU,。與 MI250 相比,,該產(chǎn)品提供了 8 倍的性能和 5 倍的效率。在半導(dǎo)體行業(yè)觀察之前的文章《AMD最大的芯片:13個(gè)chiplet,,1460億晶體管》中,,我們有介紹了這款初代的產(chǎn)品。
據(jù)外媒seminalysis所說,,MI300A 憑借異構(gòu) CPU+GPU 計(jì)算成為頭條新聞,,而El Capitan Exascale 超級計(jì)算機(jī)正在使用該版本。他們指出,,MI300A 在 72 x 75.4mm 基板上采用集成散熱器封裝的設(shè)計(jì),,適合插槽 SH5 LGA 主板,每塊板有 4 個(gè)處理器,,能有效地支付開發(fā)成本,。seminalysis透露,該芯片已經(jīng)出貨,,但真正在第三季度出現(xiàn)增長,,這和AMD的說法也是一致的。他們進(jìn)一步指出,,標(biāo)準(zhǔn)服務(wù)器/節(jié)點(diǎn)將是 4 個(gè) MI300A,。不需要主機(jī) CPU,,因?yàn)樗莾?nèi)置的。
“這是迄今為止市場上最好的 HPC 芯片,,并將保持一段時(shí)間,。”seminalysis強(qiáng)調(diào),。
在發(fā)布這些面向AI應(yīng)用芯片的同時(shí),,我們自然就繞不開AMD在軟件方面的投入,這在很多分析人士看來,,會是AMD在這個(gè)市場發(fā)力的一個(gè)短板,。但從AMD總裁Victor Peng的介紹我們可以看到,他們也在這個(gè)市場訂下了一個(gè)目標(biāo),,那就是Open(software approach)、Proven(AI capability)和Ready(support for AI models),。
據(jù)Victor Peng介紹,,AMD 擁有一套完整的庫和工具ROCm,可以用于其優(yōu)化的 AI 軟件堆棧,。與專有的 CUDA 不同,,這是一個(gè)開放平臺。而在過去的發(fā)展中,,公司也一直在不斷優(yōu)化 ROCm 套件,。AMD同時(shí)還在與很多合作伙伴合作,希望進(jìn)一步完善其軟件,,方便開發(fā)者的AI開發(fā)和應(yīng)用,。
“我們在構(gòu)建可與模型、庫,、框架和工具的開放生態(tài)系統(tǒng)協(xié)同工作的強(qiáng)大軟件堆棧方面取得了真正的巨大進(jìn)步,。”Victor Peng說,。
備受關(guān)注的Bergamo,,如約而至
在介紹了MI300的同時(shí),AMD在今天還介紹公司了另一款重頭戲產(chǎn)品——新一代的EPYC,。這是一系列為數(shù)據(jù)中心設(shè)計(jì)的芯片,,到了第四代,AMD則準(zhǔn)備了四條針對不同市場的產(chǎn)品線,,當(dāng)中更是包括了備受關(guān)注的,、以云原生計(jì)算需求為目的的Bergamo系列以及代號為Genoa-X的第二代 EPYC 3D V-Cache CPU。
據(jù)Lisa Su 介紹,,新一代的AMD EPYC Genoa 在云工作負(fù)載中的性能是英特爾競爭處理器的 1.8 倍,,在企業(yè)工作負(fù)載中的速度是英特爾競爭處理器的 1.9 倍,。Lisa同時(shí)談到,絕大多數(shù)人工智能都在 CPU 上運(yùn)行,,而AMD 的產(chǎn)品在這方面性能方面比競爭對手的至強(qiáng) 8490H 具有絕對領(lǐng)先優(yōu)勢,,性能高出 1.9 倍,效率也同樣是競爭對手的1.8 倍,。
在介紹了EPYC Genoa之后,,Lisa著重介紹了公司的云原生產(chǎn)品Bergamo,一款讓開發(fā)者期待已久的高密度服務(wù)器 CPU,。據(jù)介紹,,該芯片基于 AMD 的密度優(yōu)化 Zen 4c 架構(gòu),提供多達(dá) 128 個(gè) CPU 內(nèi)核,,比 AMD 當(dāng)前一代旗艦 EPYC 9004 “Geona”芯片多 32 個(gè)內(nèi)核,。在AMD CTO Mark Papermaster看來,Zen 4c是AMD緊湊密度的補(bǔ)充,,是公司核心路線圖的新泳道,,它在大約一半的核心區(qū)域提供與 Zen 4 相同的功能。
在分析人士看來,,Zen 4c 和 Bergamo 設(shè)計(jì)的目的是提供盡可能多的計(jì)算資源,,這也是AMD在摩爾定律失效的情況下,為滿足盡客戶需要繼續(xù)增加核心數(shù)量需求而做出的一個(gè)決定,。根據(jù)AMD提供的數(shù)據(jù),,全新的Zen 4C核心可以減少35%的面積,在每個(gè)CCD中可以提供的核心數(shù)量是Zen 4的兩倍,,在每個(gè)Socket中則能增加33%的核心,。換而言之,Zen 4 每個(gè) CCD 有 8 個(gè)內(nèi)核,,而 Zen 4c 每個(gè) CCD 有 16 個(gè)內(nèi)核,。這也意味著 Zen 4c EPYC 芯片的 CCD 總體上少于其原始 Zen 4 芯片。
據(jù)AMD介紹,, 這次發(fā)布的Bergamo僅使用八個(gè) Zen 4C Chiplet和中央 IO Chiplet,,這和標(biāo)準(zhǔn)EPYC 芯片最多使用十二個(gè) Zen 4 Chiplet設(shè)計(jì)略有不同。得益于這個(gè)設(shè)計(jì),,Bergamo成為了一個(gè)擁有820億晶體管的設(shè)計(jì),,低于完整 Genoa 芯片中的約900億個(gè)晶體管。這個(gè)更高的內(nèi)核數(shù)量和更小的時(shí)鐘速度設(shè)計(jì)使得該芯片比 Genoa 設(shè)計(jì)更節(jié)能——這是AMD定義該產(chǎn)品所專注市場時(shí)考慮的重要因素,。AMD也透露,,Bergamo在性能和效率方面的表現(xiàn)也非常出色。
依賴于其高核心密度和高能效,AMD 希望Bergamo在該領(lǐng)域能與基于 Arm 的Ampere,、Amazon 和其他使用Arm 架構(gòu)內(nèi)核的公司競爭,,AMD 也希望這款芯片會成為Intel于2024 年推出的,具備144核心的Sierra Forest的有力競爭者,。
除了上述產(chǎn)品之外,,AMD還帶來了具有1.1GB L3緩存的“Genoa-X”EPYC 處理器。據(jù)了解,,Genoa-X是 AMD 第一代 V-cache Milan-X的繼任者,。與上一代產(chǎn)品一樣,AMD 正在使用緩存芯片堆疊為其他常規(guī)的 Genoa Zen 4 CCD 添加更多的 L3 緩存,。在這種設(shè)計(jì)下,,Genoa/Genoa-X 芯片上有 12 個(gè) CCD,這允許 AMD 向芯片添加 768MB 的額外 L3 緩存,。
更多芯片在路上
在這次的盛會上,,AMD還披露了全新的DPU規(guī)劃,這是他們通過收購 Pensando所獲得的技術(shù),。在他們看來,,AMD 的 Pensando SmartNIC 是新數(shù)據(jù)中心架構(gòu)不可或缺的一部分。按照AMD的規(guī)劃,,他們接下來會將P4 DPU 卸載集成到網(wǎng)絡(luò)交換機(jī),從而在機(jī)架級別提供服務(wù),。為此,,他們正在與HPE Aruba Networks 一起開發(fā)智能交換機(jī)。
AMD 同時(shí)強(qiáng)調(diào)了其代號為“Giglio”的下一代 DPU 路線圖,,與當(dāng)前一代產(chǎn)品相比,,該路線圖旨在為客戶帶來更高的性能和能效,預(yù)計(jì)將于 2023 年底上市,。AMD 還發(fā)布了 AMD Pensando Software-in-Silicon Developer Kit (SSDK),,使客戶能夠快速開發(fā)或遷移服務(wù)以部署在 AMD Pensando P4 可編程 DPU 上,與 AMD 上已經(jīng)實(shí)現(xiàn)的現(xiàn)有豐富功能集相協(xié)調(diào)Pensando 平臺,。AMD Pensando SSDK 使客戶能夠發(fā)揮領(lǐng)先的 AMD Pensando DPU 的強(qiáng)大功能,,并在其基礎(chǔ)架構(gòu)中定制網(wǎng)絡(luò)虛擬化和安全功能,與 Pensando 平臺上已實(shí)施的現(xiàn)有豐富功能集相協(xié)調(diào),。
依賴于這些豐富的產(chǎn)品,,AMD正在沖擊數(shù)據(jù)中心的下一個(gè)高峰。
更多精彩內(nèi)容歡迎點(diǎn)擊==>>電子技術(shù)應(yīng)用-AET<<