《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 模擬設(shè)計(jì) > 新品快遞 > AMD官宣下代GPU加速卡Instinct MI355X

AMD官宣下代GPU加速卡Instinct MI355X

288GB海量?jī)?nèi)存 3nm CNDA4全新架構(gòu)
2024-10-11
來(lái)源:快科技

除了正式發(fā)布升級(jí)版的Instinct MI325X GPU加速卡,,AMD還宣布了全新的下一代Instinct MI350系列的首款產(chǎn)品“Instinct MI355X”,,并披露了部分規(guī)格,、性能數(shù)據(jù),。

MI355X將在2025年下半年上市,也就是還有差不多一年時(shí)間,。

1.png

MI350系列將首次升級(jí)為臺(tái)積電3nm工藝,,首次采用CDNA 4架構(gòu),首次引入FP6,、FP4浮點(diǎn)數(shù)據(jù)類型,,搭配內(nèi)存還是HBM3E但是容量高達(dá)288GB,。

具體功耗沒有披露,但是MI325X已經(jīng)最高達(dá)1000W,,AMD也透露MI355X會(huì)順應(yīng)行業(yè)趨勢(shì)(NVIDIA B200 1000W,、GB200 1700W),因此必然會(huì)顯著超過1000W,。

2.png

FP6,、FP4都屬于浮點(diǎn)數(shù)據(jù)格式,分別代表6位,、4位精度,,也就是只需6位、4位就能表達(dá)一個(gè)數(shù)字,,相比于FP16,、F8精度大大降低,但是數(shù)據(jù)處理量也大大減少,,適合大模型的量化,,特別是大語(yǔ)言模型和混合專家模型。

如果你不需要太高的精度,,更想要速度,,F(xiàn)P6、FP4就非常適合,。

MI355X上的FP6、FP4浮點(diǎn)性能都是9.2 PFlops(每秒9200萬(wàn)億次運(yùn)算),,同時(shí)還將FP16,、FP8性能都提升了80%,分別達(dá)到2.3 PFlops,、4.6 PFlops,。

NVIDIA Blackwell GPU同樣引入了FP6、FP4精度,,但是性能更高,,分別達(dá)20 PFlops、40 PFlops,。

3.png

單卡多達(dá)288GB HBM3E內(nèi)存確實(shí)是無(wú)可匹敵,,同時(shí)帶寬高達(dá)8TB/s。

對(duì)比MI325X分別多出1/8,、1/3,,而相比目前已上市的MI300X都增加了足足50%。

對(duì)比競(jìng)品,,Blackwell B200也只有192GB HBM3E,,但帶寬同樣做到了8TB/s。

4.png

MI355X同樣支持單平臺(tái)八卡,這樣就有總計(jì)2.3TB HBME內(nèi)存,、64TB/s帶寬,,性能更是高達(dá)FP16 18.5 PFlops、FP8 37 PFlops,、FP6/FP4 74 PFlops,。

它也將在明年下半年供貨。

5.png

Instinct系列的性能進(jìn)步幅度無(wú)疑是飛躍性的,,一代一個(gè)新模樣,,跨代對(duì)比更是驚人。

MI355X對(duì)比MI300X,,F(xiàn)P16性能達(dá)到了7.4倍之多,,HBM容量也有1.5倍,所能處理的模型參數(shù)規(guī)模,,也從7140億增加到4.2萬(wàn)億,,足足6倍之多。

6.png

展望未來(lái),,2026年將推出再下一代的Instinct MI400系列,,基于再下一代的CDNA架構(gòu)(CDNA 5?),規(guī)格和性能必將再次邁上一個(gè)大大的臺(tái)階,。


Magazine.Subscription.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn),。轉(zhuǎn)載的所有的文章,、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者,。如涉及作品內(nèi)容、版權(quán)和其它問題,,請(qǐng)及時(shí)通過電子郵件或電話通知我們,,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失,。聯(lián)系電話:010-82306118,;郵箱:[email protected]