《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 模擬設(shè)計 > 業(yè)界動態(tài) > AMD Zen 5 CPU架構(gòu)內(nèi)核解析

AMD Zen 5 CPU架構(gòu)內(nèi)核解析

IPC性能提升了16%,!
2024-07-16
來源:芯智訊
關(guān)鍵詞: AMD Zen5

7月15日消息,,AMD近日在美國洛杉磯舉行的技術(shù)日活動中,,介紹了其全新的Zen 5 CPU架構(gòu),將會帶來平均16%的每時鐘指令數(shù)(IPC)性能提升,相關(guān)處理器產(chǎn)品將于7月底上市。

在今年6月初的Computex 2024展會上,AMD正式發(fā)布了基于全新的Zen5架構(gòu)的Ryzen 9000系列桌面處理器(Granite Ridge)和面向筆記本電腦的Ryzen AI 300系列AI PC處理器(Strix Point),。

其中,Ryzen 9000系列當(dāng)中的旗艦產(chǎn)品——Ryzen 9 9950X配備16核心32線程,,170W TDP,,最高主頻5.7 GHz。而Ryzen AI 300系列的旗艦產(chǎn)品——Ryzen AI 9 HX 370的CPU為12核心24線程,,包括4個Zen 5 內(nèi)核和8個Zen 5C 內(nèi)核,,每個核心1MB二級緩存,三級緩存為24MB,,最高主頻5.1GHz,。GPU不但升級架構(gòu),CU單元數(shù)量也從12個增至16個,,命名為“Radeon 890M”,。NPU算力則提升到了50TOPS,增加了2倍有余,。

根據(jù)此前AMD公布的數(shù)據(jù)顯示,,與英特爾Core i9-14900K相比,AMD旗艦16核心Ryzen 9 9950X在游戲性能測試中的速度快4%到23%,。在生產(chǎn)力性能測試中,,9950X顯示出更大的優(yōu)勢,比英特爾Core i9-14900K快7%至56%,。同樣Ryzen AI 300系列相比上代產(chǎn)品也帶來的很大的性能提升,。

當(dāng)然,制程工藝,、CPU核心數(shù)量,、緩存容量和主頻上的提升,都對于其CPU的性能提升帶來了不小的助力,,但是其中關(guān)鍵的性能提升則是來源于Zen 5 內(nèi)核架構(gòu)的提升,。

Zen 5 內(nèi)核帶來了平均16%的IPC性能提升

據(jù)介紹,其 Zen 5 內(nèi)核擁有 6 個 ALU,,數(shù)量是上一代的 3 倍,,采用了 48KB 的 12 路一級緩存,在浮點運算以及最大帶寬上均是上代的 2 倍,,并且Zen 5內(nèi)核也同樣支持完整版的 AVX-512 指令,,從而在一些專業(yè)應(yīng)用上有事半功倍的作用,。得益于這些方面的提升,Zen 5的IPC性能比上一代的Zen 4 內(nèi)核高出了10%-35%,,平均提升了16%,。

1.jpg

據(jù)AMD首席技術(shù)官Mark Papermaster介紹,,Zen 5內(nèi)核的最大改進(jìn)之一是其前端,,在其IPC整體性能提升當(dāng)中的占比為39%。

具體來說,,AMD已經(jīng)擴(kuò)大了前端,,允許每個周期進(jìn)行更多的分支預(yù)測——這是現(xiàn)代CPU內(nèi)核性能的主要貢獻(xiàn)者——并實施了雙解碼管道以及i-cache和op-cache改進(jìn),以遏制延遲并提高帶寬,。

2.png

Zen 5 這個更寬的前端與一個更大的整數(shù)執(zhí)行引擎配對,,該引擎現(xiàn)在每個周期中最多支持8條指令——調(diào)度和報廢,而上代的Zen 4 只有6條指令,。AMD 還將算術(shù)邏輯單元 (ALU) 的數(shù)量從 4 個增加到 6 個,,還有3個乘法器,并實施了更統(tǒng)一的調(diào)度程序,,以提高執(zhí)行效率,。

3.png

為了減少錯誤預(yù)測增加的可能性,AMD還將Zen 5的執(zhí)行窗口延長了約40%,?!八淖饔檬菐硇碌男阅芩剑驗樗c這些前端進(jìn)步相結(jié)合......它允許我們使用這些指令,,并利用通過管道向我們提供的改進(jìn)預(yù)測,,“Papermaster 解釋道。

Zen 5 的 IPC 性能增長當(dāng)中,,約 27% 可歸因于后端數(shù)據(jù)帶寬的增加,。與上一代相比,AMD 將 L1 數(shù)據(jù)緩存從 32KB 提升到 48KB,,并將 L1 和浮點單元的最大帶寬增加了一倍,。

4.png

關(guān)鍵的一點是,AMD不僅對分支預(yù)測器或執(zhí)行引擎進(jìn)行了優(yōu)化,,還試圖平衡內(nèi)核的每個元素,,以避免瓶頸或增加延遲。其結(jié)果是,,器核心可以比前幾代更快地消化更多指令,。

Zen 5 內(nèi)核所帶來的最大的IPC提升,在于其改進(jìn)了AVX-512指令的實施,,對于AVX-512矢量擴(kuò)展進(jìn)行了重新設(shè)計,,以提供完整的512位數(shù)據(jù)路徑,,使得其在AVX-512 矢量擴(kuò)展的工作負(fù)載中表現(xiàn)更為出色。

5.png

雖然 Papermaster 聲稱 Zen 5 現(xiàn)在可以運行完整的 AVX-512 工作負(fù)載而不會受到頻率損失,,但這些指令在歷史上一直運行得非常熱,。這在臺式機(jī)或工作站上沒什么大不了的,但對于散熱空間有限的筆記本電腦來說并不理想,。所以對于“Strix Point”系列移動芯片,,AMD則是堅持使用“double-pumped” AVX-512來實現(xiàn)——可能會針對每瓦性能和散熱限制進(jìn)行優(yōu)化。相比之下,,上代的Zen 4 則是“double-pumped” AVX-256,。

此外,Papermaster 還強(qiáng)調(diào)了了AVX-512 工矢量擴(kuò)展在 CPU 上運行AI工作負(fù)載的潛力,。在機(jī)器學(xué)習(xí)方面,,AMD聲稱單核Zen 5 性能比Zen 4 提高了32%,在AES-XTS 加密算法性能上也提升了35%,。特別是在其移動芯片方面,,AMD強(qiáng)調(diào)了在每個領(lǐng)域運行機(jī)器學(xué)習(xí)的概念,而不僅僅是在集成GPU或NPU上,。

AMD表示 Zen 5 架構(gòu)將會應(yīng)用于各個領(lǐng)域,,除了桌面與移動處理器之外,包括 EPYC 霄龍?zhí)幚砥饕约扒度胧教幚砥鞯榷紝⒉捎?Zen 5 架構(gòu),,從而讓企業(yè)部署更加得心應(yīng)手,。

在AMD的技術(shù)日披露中,其Zen 5和緊湊型Zen 5C 內(nèi)核在功能方面在架構(gòu)上基本保持相同,,只不過較小的 Zen 5C 內(nèi)核可以以較低的頻率換取更高的性能密度,。

據(jù)介紹,首批基于 Zen 5 內(nèi)核的處理器系列(Ryzen 9000系列和Ryzen AI 300系列處理器)將于 7 月 31 日上市,。但是基于Zen 5 內(nèi)核的數(shù)據(jù)中心處理器可能必須等待更長的時間才能到達(dá),。

根據(jù)之前曝光的信息顯示,在第5代 Epyc服務(wù)器處理器,,預(yù)計將會采用臺積電3nm制程,,并將具有192個CPU內(nèi)核和384個線程。與此同時,,頻率優(yōu)化的“Turin”可能會有128 個內(nèi)核和256 個線程,。

競爭白熱化

在Zen 5 內(nèi)核推出之際,AMD 正面臨多年來最激烈的競爭,。因為高通公司推出了一款強(qiáng)大的基于 Arm 架構(gòu)的Windows筆記本電腦芯片,,而英特爾也準(zhǔn)備在其至強(qiáng)和酷睿產(chǎn)品系列中推出一系列改進(jìn)的CPU。

在客戶端領(lǐng)域,,高通具有45TOPS NPU算力的驍龍?zhí)幚砥魇蛊湓谖④浀腃opilot + AI PC推動中處于領(lǐng)先地位,。AMD的具備50TOPS NPU算力的Ryzen AI 300系列則希望帶來更多競爭優(yōu)勢,。但是,英特爾即將上市的Lunar Lake則具有48TOPS NPU算力,,AI綜合算力更是高達(dá)120TOPS,。顯然,AMD的Ryzen AI 300在與英特爾Lunar Lake的競爭當(dāng)中,,可能并沒有多少優(yōu)勢,。

在數(shù)據(jù)中心領(lǐng)域也有類似的情況,隨著英特爾 144 核 Sierra Forest 和即將推出的 128 核 Granite Rapids Xeon 6 平臺的推出,,AMD在該市場也面臨更加激烈的競爭,。英特爾Xeon 6系列除了架構(gòu)轉(zhuǎn)向了全大核和全小核,也轉(zhuǎn)向新的小芯片架構(gòu),,并且這些芯片也升級到了Intel 3 制程工藝。

與此同時,,越來越多的云服務(wù)提供商也在自研基于Arm 架構(gòu)的定制芯片,,來處理其超大規(guī)模工作負(fù)載。比如亞馬遜的Graviton 現(xiàn)在已經(jīng)是發(fā)展到了第四代,,并普遍可用,。此外,谷歌,、阿里云,、百度、微軟,、Meta也都已開始部署或研發(fā)自己的Arm架構(gòu)服務(wù)器芯片,。


000.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點,。轉(zhuǎn)載的所有的文章、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容,、版權(quán)和其它問題,,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟(jì)損失,。聯(lián)系電話:010-82306118;郵箱:[email protected],。