《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 電源技術(shù) > 業(yè)界動(dòng)態(tài) > TA是史上最失敗的CPU 也是AMD登上巔峰的墊腳石

TA是史上最失敗的CPU 也是AMD登上巔峰的墊腳石

2018-08-09
關(guān)鍵詞: AMD CPU i9-7980XE

就在昨天AMD第二代線程撕裂者旗艦Threadripper 2990WX外觀正式解禁,,AMD官網(wǎng)也揭露了其部分性能,,得益于其擁有高達(dá)32個(gè)核心64個(gè)線程,,Threadripper 2990WX輕松拿下了消費(fèi)級(jí)市場(chǎng)CPU之王的頭銜,,此前坐在王座上的i9-7980XE被輕松秒殺,,可謂一時(shí)之間風(fēng)光無(wú)限,。

但俗話說(shuō)的好,,現(xiàn)在有多風(fēng)光,,以前就有多折墮(落魄的意思),,AMD也不例外,。就在2年以前,AMD還是一個(gè)被Intel無(wú)視的對(duì)手,,產(chǎn)品性能與Intel有巨大的鴻溝,,股價(jià)最低時(shí)僅為2美元出頭,瀕臨破產(chǎn),。AMD會(huì)這么落魄,,其中一個(gè)很主要的原因是因?yàn)楫?dāng)年推出的Bulldozer,推土機(jī)處理器微架構(gòu),。 

就在前兩天,,國(guó)外媒體ExtremeTech就總結(jié)了至今為止最糟糕的10款CPU,其中推土機(jī)(Bulldozer)進(jìn)入了前三甲的位置,,由此可見(jiàn)推土機(jī)的失敗,,是一個(gè)比較公認(rèn)的事實(shí)。今天,,在Threadripper 2990WX意氣風(fēng)發(fā)的日子,,PConline曉邊就帶領(lǐng)大家回顧一下當(dāng)初AMD這個(gè)失敗的架構(gòu),看看它從誕生到落幕,,作為一個(gè)失敗者的故事,。

推土機(jī)的誕生:背負(fù)復(fù)仇的使命


AMD是一家富有冒險(xiǎn)精神的公司,雖然他的營(yíng)收規(guī)模僅為Intel的1/10,但其敢于在在HT總線,、DDR內(nèi)存,、多核處理器等技術(shù)做創(chuàng)新,本世紀(jì)初憑借K8架構(gòu),,其處理器在ipc和效能上大幅領(lǐng)先奔騰4,,在這段時(shí)間里Intel被AMD“教做人”,。但I(xiàn)ntel畢竟還是CPU界的大哥,豐厚的財(cái)力規(guī)模,、海量的人才儲(chǔ)備,、巨大的業(yè)界影響力和與OEM核心伙伴堅(jiān)固的關(guān)系都成為Intel翻盤的資本。

終于,,在2006年,,Core系列處理器一鳴驚人,首批推出的Core 2 Extreme 6800和Core 2 Duo E6300都顯示出了無(wú)與倫比的效能,。不僅超越上代chanpin40%之多,,在功耗發(fā)熱上的表現(xiàn)也讓人瞠目結(jié)舌,Intel的產(chǎn)品完成看一次華麗的逆襲,。如果說(shuō)Core首批推出的處理器型號(hào)是為Intel吹響了反擊的號(hào)角,,那么以Nehalem為架構(gòu)的Core i系列處理器,則徹底奠定的Intel后來(lái)13年稱霸CPU市場(chǎng)的基礎(chǔ),。

強(qiáng)大的Intel


2008年11月,,Intel發(fā)布了Core i7 965E/920處理器,原生四核心,,內(nèi)部整合內(nèi)存控制器,、使用了打破內(nèi)存帶寬傳輸瓶頸的QPI總線架構(gòu)和HT超線程技術(shù),憑借異想天開(kāi)的Turbo睿頻加速技術(shù)將處理器的能耗比提高到了極致,,酷睿處理器的發(fā)布是一個(gè)劃時(shí)代的改變,,它令人信服的KO了AMD當(dāng)時(shí)的K10架構(gòu)處理器,逼迫對(duì)方只能依靠性價(jià)比或者“開(kāi)核”等騷操作才能在市場(chǎng)占據(jù)為數(shù)不多的份額,。

嘗到成功的甜頭,,AMD自然不會(huì)這么輕易接受失敗,為了改變市場(chǎng)局面,,AMD傾盡全力的投入到下一代革命性架構(gòu)的研發(fā)當(dāng)中,,并在2011年推出了第一代推土機(jī)處理器,但當(dāng)時(shí)誰(shuí)也沒(méi)料到,,推土機(jī)架構(gòu)處理器的推出,,是AMD在CPU市場(chǎng)徹底潰敗的開(kāi)始。

推土機(jī)架構(gòu):尷尬的“革新者”


CPU的微架構(gòu)與制作工藝直接決定了CPU的效能,,優(yōu)化微架構(gòu)與更新制作工藝成為CPU廠商提升CPU效能的最重要途徑,,推土機(jī)架構(gòu)便是當(dāng)年AMD嘔心瀝血做出的CPU微架構(gòu)。

微信圖片_20180809215531.jpg

早期AMD在宣傳推土機(jī)架構(gòu)時(shí)提出了不少的創(chuàng)新點(diǎn),,概括起來(lái)有1,、全新模塊化設(shè)計(jì),更高效,、核心擴(kuò)展更容易,。2,、32nm SOI制作工藝,功耗控制更為出色,。3,、全新多線程架構(gòu),多線程運(yùn)算性能更強(qiáng),。4,、指令4發(fā)射(K10只有3發(fā)射)與AVX指令,整數(shù)/浮點(diǎn)運(yùn)算更強(qiáng),,單核心性能提升,。5、第二代Turbo Core技術(shù),,更好適應(yīng)各種應(yīng)用環(huán)境,。

其中推土機(jī)架構(gòu)的核心基礎(chǔ)和靈魂,就是模塊化設(shè)計(jì),。大家都知道傳統(tǒng)意義下CPU擁有更多的物理核心,,性能會(huì)更強(qiáng),,但是成本也會(huì)更高,,也因此Intel在酷睿處理器上應(yīng)用了SMT技術(shù),也就是超線程,。SMT可以讓一個(gè)CPU核心的多個(gè)線程共享資源并同步執(zhí)行,,硬件上幾乎不需要增加成本,不過(guò)效能肯定沒(méi)有更多的物理核心來(lái)的強(qiáng),。

微信圖片_20180809215628.jpg

AMD“推土機(jī)”微架構(gòu)


AMD為了平衡成本和多線程效能的問(wèn)題,,獨(dú)特的推出CMT技術(shù)。AMD在“推土機(jī)”上把兩個(gè)核心及相關(guān)單元封裝成一個(gè)模塊,,兩個(gè)核心共用一個(gè)浮點(diǎn)運(yùn)算單元,,但每一個(gè)核心都有完整的整數(shù)運(yùn)算單元,F(xiàn)X-8150由四模塊組成八核心,,浮點(diǎn)單元實(shí)際上只有四個(gè),,以往CPU是每個(gè)核心一個(gè)浮點(diǎn)單元的。這樣四核心由雙模塊組成,,六核心由三模塊組成,,如此類推。采用模塊化設(shè)計(jì)的好處是可以減少冗余電路,,堆砌CPU核心更容易,,這在當(dāng)時(shí)真的是一個(gè)天馬行空的創(chuàng)意。AMD把這個(gè)稱為CMT物理多核,,也因此,,與其說(shuō)推土機(jī)的8核CPU叫8核處理器,,筆者曉邊更愿意稱它做4模塊8線程處理器,因?yàn)樗恳粋€(gè)”核心“其實(shí)都是不完整的殘疾核心,,并沒(méi)有單獨(dú)的浮點(diǎn)運(yùn)算模塊,,但這樣做的好處就是,CPU以相對(duì)較小的成本,,獲得了8個(gè)完整的整數(shù)運(yùn)算單元,,高端處理器才擁有的8個(gè)線程。

AMD在推土機(jī)這樣設(shè)計(jì),,其實(shí)原因有三個(gè):其一是是他認(rèn)為目前CPU中超過(guò)80%的運(yùn)算都是整數(shù)運(yùn)算,,增加一個(gè)整數(shù)單元的好處是顯而易見(jiàn)的,用增加5%的核心面積的微小代價(jià)即可換來(lái)80%的整數(shù)性能提升,,而浮點(diǎn)運(yùn)算在未來(lái)則可以交給GPU負(fù)責(zé),,這樣更加高效。其二是在未來(lái),,通用運(yùn)算會(huì)持續(xù)向多線程發(fā)展,,對(duì)線程的要求是無(wú)限的。其三是未來(lái)大幅提升CPU頻率是可以實(shí)現(xiàn)的,,這可以彌補(bǔ)處理器單線程羸弱的問(wèn)題,。

AMD的賭徒企業(yè)風(fēng)格在推土機(jī)的研發(fā)設(shè)計(jì)中體現(xiàn)的淋漓盡致,他在未來(lái)處理器發(fā)展方向上打了三個(gè)賭,,可惜的是在當(dāng)時(shí)沒(méi)有一個(gè)賭對(duì)了,。

微信圖片_20180809215654.jpg

8核推土機(jī)架構(gòu)


搭載四個(gè)模塊八個(gè)線程的高級(jí)桌面處理器有大量的整數(shù)線程富余,但大多數(shù)用戶的工作量仍然沒(méi)法被平均分配到八個(gè)線程上去(簡(jiǎn)單的說(shuō)就是大多數(shù)程序多線程優(yōu)化不好),。單線程的運(yùn)行依舊占據(jù)了用戶絕大多數(shù)使用的使用場(chǎng)景,。另一方面,浮點(diǎn)單元的共享意味著充滿浮點(diǎn)算術(shù)的應(yīng)用程序就沒(méi)有足夠的運(yùn)行資源,。雖然基于GPU的計(jì)算在一些特定工作中非常重要——比如科學(xué)超級(jí)計(jì)算——但主流應(yīng)用程序還是更依賴CPU來(lái)做浮點(diǎn)運(yùn)算,。

推土機(jī)的架構(gòu)帶來(lái)了處理器單核性能的倒退,甚至比不上自家上代六核旗艦Phenom II X6 1090T,,更不要說(shuō)去和Intel當(dāng)時(shí)的SNB處理器比劃了,。而在AMD的設(shè)想中單核性能的倒退能通過(guò)大幅提升處理器頻率改善,但是使用更落后的32nm制程的推土機(jī)處理器一味提升頻率,,結(jié)果就是在功耗發(fā)熱方面成為大火爐(這種情況在打樁機(jī)時(shí)顯現(xiàn)的極致),。

微信圖片_20180809215718.jpg

推土機(jī)旗艦FX-8150

這樣的設(shè)計(jì)造成的另一個(gè)結(jié)果就是,最吃浮點(diǎn)運(yùn)算性能和單核性能的大多數(shù)游戲表現(xiàn)中,,推土機(jī)甚至不如”肥龍2“,,只能在SNB處理器后面吃塵,這在DIY市場(chǎng)是致命的,,畢竟大多數(shù)DIY玩家都是為了游戲才去玩DIY硬件,。消費(fèi)市場(chǎng)不買賬,,口碑逐漸崩壞,推土機(jī)架構(gòu)的結(jié)局似乎已經(jīng)可以預(yù)見(jiàn),。

推土機(jī)的發(fā)展:農(nóng)用機(jī)器系列處理器


打樁機(jī):不屈的挑戰(zhàn)者但終成笑柄

微信圖片_20180809215743.jpg

AMD當(dāng)時(shí)CPU的發(fā)展 路線圖

AMD在推出推土機(jī)架構(gòu)處理器后,,市場(chǎng)反饋并不太好,但這畢竟只是第一代,,也可能是市場(chǎng)和軟件環(huán)境還沒(méi)適應(yīng)這個(gè)處理器中的新物種,。于是AMD在第二年便推出推土機(jī)小修小改的版本,Piledriver打樁機(jī)架構(gòu)處理器,。與推土機(jī)相比,,同為是模塊化設(shè)計(jì)的“打樁機(jī)”核心改動(dòng)主要體現(xiàn)在:1、新增FMA3,、AVX1.1和F16C等新指令集,;2、強(qiáng)化電源管理,,降低產(chǎn)品功耗,;3、一級(jí),、二級(jí)緩存優(yōu)化,;4、核心頻率提高,,TDP保持不變,。

微信圖片_20180809215808.jpg

微信圖片_20180809215836.jpg

其中最主要便是這功耗的優(yōu)化,,這讓處理器在相同電壓下對(duì)比上一代有了10%左右的超頻空間,。雖然當(dāng)時(shí)以FX8350為代表的打樁機(jī)處理器使用的僅是格羅方德落后的32nm工藝打造,但得益于其設(shè)計(jì)較長(zhǎng)的流水線,,打樁機(jī)可以輕松超頻到4.5GHz以上,,以至于當(dāng)時(shí)坊間的A飯都戲謔的稱”性能不夠,超頻來(lái)湊“,,”超一下,,又不是不能用“。為了把打樁機(jī)的性能發(fā)揮到極致,,AMD當(dāng)時(shí)甚至還推出了TDP高達(dá)220W,,動(dòng)態(tài)頻率可達(dá)5.0GHz的核彈FX9590,但其可怕的功耗和散熱供電要求,,以及5.0GHz的單核性能僅相當(dāng)于3.8GHz左右時(shí)的i7-4770K單核性能,,都成為這款處理器走向主流市場(chǎng),和讓消費(fèi)者選擇它的掣肘,。

微信圖片_20180809215900.jpg

FX9590僅僅是AMD發(fā)出不屈的怒吼,,高頻的打樁機(jī)只能給AMD帶來(lái)大火爐的稱號(hào),,但仍然改變不了推土機(jī)家族失敗的命運(yùn),最后落得個(gè)”i3默秒全“的恥辱性頭銜,。

打樁機(jī)的失敗讓AMD清醒的認(rèn)識(shí)了自己,,至此AMD放棄了CPU高端市場(chǎng),轉(zhuǎn)而投身到另一個(gè)大坑異構(gòu)運(yùn)算的研發(fā)中(詳情可以點(diǎn)擊這里跳轉(zhuǎn)相關(guān)文章),。此后AMD推出的Steamroller壓路機(jī),、Excavator挖掘機(jī)都僅應(yīng)用在APU和低端處理器型號(hào)身上,重點(diǎn)都是降低CPU的功耗,,提高處理器的能耗比,。雖然這些低端APU產(chǎn)品在市場(chǎng)獲得不少消費(fèi)者青睞,但消費(fèi)者選擇它的原因大都是因?yàn)槠涓咝阅艿暮孙@,,甚至民間不少網(wǎng)友笑稱買APU是買GPU送CPU,,買Intel的CPU則是買CPU送GPU。

AMD的CPU也在市場(chǎng)徹底失去了口碑,,不管從市場(chǎng)還是性能表現(xiàn)等各個(gè)角度來(lái)講,,推土機(jī)架構(gòu)都是十分失敗的,甚至可以說(shuō)被釘在了CPU歷史的恥辱柱上,,以至于直到今天AMD也不敢啟用曾經(jīng)象征AMD最高性能處理器的FX后綴,,畢竟FX很容易讓人聯(lián)想到推土機(jī)系列處理器。

推土機(jī)的影響:失敗是成功之母


模塊化設(shè)計(jì):前人栽樹(shù)后人乘涼

流傳比較廣的話語(yǔ)總是比較有道理,,比如說(shuō)失敗乃是成功之母,,又比如說(shuō)看數(shù)碼硬件資訊就來(lái)PConline。自推土機(jī)失敗以來(lái)AMD臥薪嘗膽,,終于在2017年迸發(fā)出了令人驚訝的力量,,在所有人事先不看好的情況下實(shí)現(xiàn)了逆襲,發(fā)布了媲美酷睿i系列處理器的銳龍系列處理器,,彼時(shí),,AMD自上一個(gè)巔峰已經(jīng)過(guò)去了13年之久。

微信圖片_20180809215932.jpg

ZEN架構(gòu)

銳龍系列處理器,,能一鳴驚人的原因,,很大部分得益于的架構(gòu)設(shè)計(jì)上還巧妙地采用了名為CCX(CPU Complex)的模塊化設(shè)計(jì)方案。模塊化這個(gè)字眼是不是很熟悉,?你沒(méi)有看錯(cuò),,模塊化的設(shè)計(jì)理念雖然是推土機(jī)失敗的根本原因,但模塊化這個(gè)詞并不是洪水猛獸,,ZEN架構(gòu)則是模塊化設(shè)計(jì)理念下更成熟的產(chǎn)物,。

微信圖片_20180809215958.jpg

雖然同樣采用模塊化的設(shè)計(jì)理念,但是ZEN架構(gòu)吸取了推土機(jī)的教訓(xùn),每一個(gè)核心都是完整的核心,,并且大幅加強(qiáng)了浮點(diǎn)運(yùn)算性能,,在整數(shù)管線上,Zen有4個(gè)算術(shù)邏輯單元(ALU)和兩個(gè)地址產(chǎn)生單元(AGU),。浮點(diǎn)管線上,,共享浮點(diǎn)單元的概念被廢棄了:現(xiàn)在每個(gè)核都有一對(duì)獨(dú)立的128位乘法疊加運(yùn)算單元(FMA)。浮點(diǎn)單元內(nèi)有分開(kāi)的加法和乘法管線,,用于在不進(jìn)行乘法累積運(yùn)算時(shí)應(yīng)對(duì)更多樣的混合指令,。但256位AVX指令集還是得分開(kāi)在兩個(gè)FMA單元上執(zhí)行,并動(dòng)用所有的浮點(diǎn)單元,。最終結(jié)果就是Ryzen系列處理器對(duì)比推土機(jī)系列處理器在ipc方面有著超過(guò)40%的巨幅提升,。

微信圖片_20180809220020.jpg

ZEN架構(gòu)

ZEN架構(gòu)中一個(gè)CCX模塊中有4個(gè)核心,每個(gè)核心擁有自己獨(dú)立的L1和L2緩存,,一個(gè)CCX模塊共享8MB L3緩存,。每個(gè)核心都可以選擇性地開(kāi)啟或者關(guān)閉SMT功能,也可以選擇性地關(guān)閉部分核心,。相比于Intel的環(huán)形布線,,ZEN架構(gòu)的帶來(lái)的好處是顯而易見(jiàn)的。在AMD最新的處理器布局上,,每一代從最高的服務(wù)器EPYC到最低端的入門級(jí)Ryzen 3系列處理器,,他們都只需要設(shè)計(jì)一個(gè)Die(內(nèi)核),然后不斷堆棧即可,,這對(duì)比Intel方面會(huì)省下不少的設(shè)計(jì)和流片成本,,所以我們也能看到市場(chǎng)上同核心的Ryzen處理器售價(jià)會(huì)相比酷睿要低不少。除此以外,,模塊化的設(shè)計(jì)也讓CPU核心的增加像堆棧積木那么簡(jiǎn)單,,線程撕裂者Threadripper 2990WX的誕生也是水到渠成的事情。

改善了推土機(jī)單線程羸弱,,依賴高頻的缺點(diǎn),,并秉承著模塊化的設(shè)計(jì)理念,相信未來(lái)通用運(yùn)算依然對(duì)多線程的有著極大的需求,,時(shí)隔6年后,AMD再一次依靠ZEN架構(gòu)奏響進(jìn)軍高端CPU市場(chǎng)的號(hào)角,。

而在AMD依靠Threadripper 2990WX奪得消費(fèi)級(jí)CPU市場(chǎng)王座的背后,,是史上最失敗的處理器甘當(dāng)墊腳石的結(jié)果。

總結(jié)


英雄總會(huì)遲暮,,更何況推土機(jī)更像是一個(gè)傳統(tǒng)意義上的“狗熊”,,但不管怎么說(shuō),當(dāng)推土機(jī)這些老前輩看到Threadripper 2990WX如此強(qiáng)大時(shí),相信也會(huì)不留遺憾的離去,,消失在歷史的洪流當(dāng)中,。而曉邊我,也只能以此文,,紀(jì)念這款被I粉嘲笑,,被A飯仇恨的處理器,為大家?guī)?lái)它的故事,。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn),。轉(zhuǎn)載的所有的文章,、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者,。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失,。聯(lián)系電話:010-82306118,;郵箱:[email protected]