日前,“SEMICON China 2017國際半導(dǎo)體展”在上海盛大開幕,,多家公司參加了本次盛會,。
上海兆芯集成電路有限公司副總裁傅城博士在會議上公布繼開先ZX-C系列處理器之后,兆芯最新一代ZX-D系列4核和8核通用處理器目前已經(jīng)成功流片,。此外,,媒體還報(bào)道:在展會上業(yè)內(nèi)人士還向我們透露,兆芯將在明年(2018年)推出16nm的ZX-E 8核CPU,,并公開了Fritz Chess Benchmark國際象棋性能測試的成績,。而且在測試成績的圖片上還有“兆芯處理器媲美國際主流水準(zhǔn)”的字樣,。
其實(shí),,這并不是兆芯第一次宣稱其處理器媲美國際主流/國際整體水平。在“十二五”科技成果展上,,兆芯官方資料宣稱:國產(chǎn)X86通用處理器的成功自主研發(fā)和量產(chǎn),,令國產(chǎn)處理器在性能方面完成了一次跨越式的提升,從“十二五”初期的不足國際整體水準(zhǔn)的10%提升到了目前的80%,。
但實(shí)際上,,兆芯在“十二五”科技成果展上的宣傳,,和這次Fritz Chess Benchmark測試成績,以及所謂的“兆芯處理器媲美國際主流水準(zhǔn)”是有較大水分的,。
Fritz Chess Benchmark測試成績存在的問題
根據(jù)公布的Fritz Chess Benchmark國際象棋性能測試的成績,,一些媒體在報(bào)道中宣稱:運(yùn)行在3.0GHz頻率下的ZX-E8核心處理器性能已經(jīng)超過了AMD的FX-8370處理器,非常接近采用Skylake核心的英特爾Core i5-6600處理器,,意味著國產(chǎn)處理器的性能提升了一大步,。
而根據(jù)圖片中顯示,ZX-D的測試分?jǐn)?shù)與Intel I3 6300相當(dāng),。圖片中的這種表達(dá)方式,,很容易讓人認(rèn)為ZX-D(8核版)性能與Intel I3 6300處理器相當(dāng),ZX-E與Intel i5 6600處理器性能相當(dāng),,超越了AMD的FX 8370,,并使宣傳圖片上所謂的“兆芯處理器媲美國際主流水準(zhǔn)”實(shí)至名歸。
然而,,這個(gè)圖表中的測試成績其實(shí)是存在一些問題的,,經(jīng)不起推敲。舉例來說,,Intel I5 7500的測試成績就很有問題,。
眾所周知,這些年Intel雖然在降低能耗,,提升核顯性能上下了不少功夫,,但在CPU性能提升上就非常吝嗇了,每一代產(chǎn)品更新近乎是一點(diǎn)一點(diǎn)擠牙膏,,以至于Intel被廣大網(wǎng)友冠以“牙膏廠”的美譽(yù),而I5 6600和I5 7500理論上提高不大,。Spec測試定點(diǎn)成績的話,,CPU性能大約提高5%,。而在這個(gè)兆芯公布的測試中性能提高了將近3000分。
但實(shí)際上,,14000分的測試成績,,即便是Intel I5
7600K也達(dá)不到這個(gè)分?jǐn)?shù)。根據(jù)第三方測試,,Intel I5 7600K的測試成績?yōu)?2000+分,,而主頻更低的Intel I5
7500測試成績根本不可能比Intel I5 7600K的分?jǐn)?shù)更高。
拔高國外廠商產(chǎn)品也就罷了,但發(fā)布錯(cuò)誤的測試成績,,壓低國外廠商的產(chǎn)品測試分?jǐn)?shù),,來抬高自己,這種做法就非常值得商榷了,。
Intel I3 6300的測試成績存在略顯偏低的情況,,實(shí)測I3 6100都有將近7800分,與圖表中公布的Intel I3 6300的測試結(jié)果相當(dāng),,而Intel I3 6300比Intel I3 6100主頻更高一些,,測試的成績也應(yīng)當(dāng)會高一些。如果說I3 6300的分?jǐn)?shù)偏差還可以用測試誤差來解釋,,那FX 8370的成績就有點(diǎn)匪夷所思了,。
AMD FX 8370的測試成績有很大問題,兆芯提供的圖表中,,F(xiàn)X8370的成績只有9000多分,,但這個(gè)分?jǐn)?shù)大約只和FX 6350差不多。FX 8370的分?jǐn)?shù)要比兆芯公布的成績高很多,。
根據(jù)網(wǎng)絡(luò)公布的測試,,F(xiàn)X 8350的國際象棋分?jǐn)?shù)就已經(jīng)達(dá)到12000分左右了,F(xiàn)X 8370的測試成績只會比FX 8350分?jǐn)?shù)高,,有的測試中跑出了12751,,還的測試甚至跑出了13546分的成績(這個(gè)成績可能是超頻下取得的)。而在兆芯提供的圖表中,,F(xiàn)X8370的成績只有9300多分,,明顯少了3000多分。由于偏差幅度實(shí)在是太大,,這已經(jīng)不能用測試誤差來自圓其說了,。
必須要說的是,,這里給ZX-D和ZX-E作為參照的CPU中,,還有并未在中國大陸開售的。比如AMD的Zen,,圖表中的四核的Zen中國大陸目前還買不到,,也就無法去證實(shí)其實(shí)際性能。在圖表中一些測試數(shù)據(jù)存在明顯問題的情況下,,挑出一些跑象棋測試明顯吃虧的CPU(比如雙核的G4500,,原因下文會介紹),或者目前中國大陸還買不到的CPU(四核Zen),,或者故意大幅壓低作為直接對比的fx 8370的測試成績來做參照,,很容易使人產(chǎn)生一些聯(lián)想。
特別是一些媒體根據(jù)圖表報(bào)道的結(jié)論,,“運(yùn)行在3.0GHz頻率下的ZX-E8核心處理器性能已經(jīng)超過了AMD的FX-8370處理器”,,這完全是將FX 8370處理器的測試成績壓低3000多分的前提下,得出的結(jié)論,。
Fritz Chess
Benchmark測試并不能說明全面問題
首先要說明的是,,F(xiàn)ritz Chess Benchmark測試并不說明全面問題。Fritz Chess Benchmark測試的是多線程,,核心數(shù)越高,,測試成績就越好。象棋剛出現(xiàn)的時(shí)候確實(shí)是重要的cpu測試軟件,,主要考驗(yàn)cpu分支預(yù)測效率的高低,,缺點(diǎn)就是流水線流不起來,不體現(xiàn)cpu絕對性能的好壞,。但隨著技術(shù)的進(jìn)步,,分支預(yù)測效率都達(dá)到了頂峰,Intel,、IBM,、AMD這些國際大廠在分支預(yù)測上大多不相伯仲。所以只要核數(shù)主頻類似,,緩存性能差不多,,哪怕微結(jié)構(gòu)和制程有差距,象棋分?jǐn)?shù)也都差不多,,衡量價(jià)值就變小了,。
據(jù)多位有十年以上工作資歷的工程師表示:這個(gè)測試程序?qū)儆诜种芗统绦颍创a是不斷地判斷,,全是if else嵌套多達(dá)5-6層,,碰到分支密集型程序,分支預(yù)測器猜不準(zhǔn)的情況下,流水線就會不斷中斷,,再好的設(shè)計(jì)都沒有用了,。
換言之,就是碰到分支密集型程序基本上哪個(gè)處理器都做不好,,也就是說,這個(gè)測試中流水線會流不起來,,在用強(qiáng)弱CPU做對比的時(shí)候,,會縮小不同CPU之間的性能差距,抹殺部分Intel,、AMD這樣國際大廠產(chǎn)品的性能優(yōu)勢,。
所以性能比較要全面,拿各種各樣的測試程序來綜合測試,,反應(yīng)各種模塊的性能,。SPEC2000/2006要測試20多個(gè)程序,而且覆蓋廣泛,,代表性強(qiáng),,是比較權(quán)威的測試。像spec cpu2006測試的26個(gè)程序就基本上能說明問題,。不僅Intel,、ARM這樣的國際巨頭會有SPEC測試成績,國內(nèi)龍芯,、申威,、飛騰都會公開CPU的SPEC2000/2006測試成績,并說明使用的編譯器,、操作系統(tǒng)等測試環(huán)境,。
比如之前被認(rèn)為裸CPU性能可以匹敵Intel E5的飛騰2000,即便飛騰有國防科大這樣的特殊背景,,但也不避諱公布SPEC測試成績,,其SPEC測試成績也非常亮眼:
在2GHz主頻下,采用GCC4.8編譯器,,SPEC2000和SPEC2006的測試成績分別為:
SPECint_base2000:1610 SPECint_base2006:12.4
SPECfp_base2000:1589 SPECfp_base2006:11.3
SPECint_rate2000:690 SPECint_rate2006:570
SPECfp_rate2000:615 SPECfp_rate2006:482
正是如此亮眼的成績,,使得飛騰2000贏得了谷歌、百度等大公司的青睞,,飛騰也成為國內(nèi)ARM服務(wù)器出貨量的領(lǐng)頭羊,。
而在SPEC測試成績上,兆芯的官方網(wǎng)站上一直對此諱莫如深,,因而外人也很難去評估其實(shí)際裸CPU性能,。目前,比較罕見的公開資料是《面向C4350AL處理器的GCC移植與優(yōu)化》。
在該論文中,中國科學(xué)院軟件研究所對兆芯C4350AL做的SPEC2006測試,,測試結(jié)果為:
SPECint_base2006:8.4
SPECfp_base2006:5.5,。
下圖附帶了《面向C4350AL處理器的GCC移植與優(yōu)化》論文中所有子項(xiàng)的測試成績。
不過,,C4350AL是兆芯早些時(shí)候的產(chǎn)品,,其實(shí)就是VIA Nano的馬甲。由于在核心微結(jié)構(gòu)上一直穿馬甲——兆芯過去的做法一直是拿VIA的技術(shù)改制造工藝堆核心數(shù)量,。ZX-D核心微結(jié)構(gòu)到底有多少修改還是未知數(shù)(核心微結(jié)構(gòu)到底是否改得動,,有多少源代碼是VIA的陳舊代碼,有多少是國內(nèi)工程師自己新寫的,,有多少是向第三方購買的,?),加上沒有其他中立權(quán)威機(jī)構(gòu)做SEPC測試,,并給予公開成績的情況下,,也就只能用中國科學(xué)院軟件研究所測試的C4350AL的成績作為借鑒了。
作為參照,,Intel I5 4460的SPECint_base2006和SPECfp_base2006的成績都在30以上,,即便是Intel多年擠牙膏,性能也是有提升的,,Intel最新CPU的SPEC2006測試成績只會更高,。
單線程性能非常有限
而本次公布的Fritz Chess Benchmark測試,這里其實(shí)玩了一個(gè)小手段,,網(wǎng)絡(luò)上公布的兆芯Fritz Chess Benchmark國際象棋性能測試成績其實(shí)是有貓膩的,。Fritz Chess Benchmark顯示的是多線程性能,也就是說,,如果測試的CPU核心數(shù)越多,,那么,測試結(jié)果會越高,。
覆蓋的指令集老舊也是Fritz Chess Benchmark測試的一個(gè)問題,,而且這個(gè)測試成績僅僅測試定點(diǎn)成績,并不測試浮點(diǎn)性能。測試對核心數(shù),、主頻,、緩存等因素比較敏感,比如E5 2650 v2有8核16線程和20m緩存,,即便默認(rèn)頻率只有2.6G,,跑分依舊高達(dá)兩萬多。
但Fritz Chess Benchmark測試對很多方面的考察不足,,特別是對一些單線程性能強(qiáng)勁,,但核心數(shù)較少,或者是閹割了緩存的CPU就會存在測試成績和該CPU在實(shí)際使用中的表現(xiàn)不匹配的情況,。比如圖表中作為參照,只有雙核的Intel G4500,、Intel I3 6300處理器,,以及圖表中緩存相對小一些的AMD A10 7890。
具體來說,,ZX-E是8核CPU,,而ZX-E與Intel i5 6600測試分?jǐn)?shù)差距大約為10%,本質(zhì)上是8核對比4核的結(jié)果,,換言之,,如果就以單線程(單個(gè)CPU核)性能來說,按照網(wǎng)絡(luò)上公布的Fritz Chess Benchmark測試成績,,目前還處于PPT狀態(tài)的ZX-E連Intel i5 6600的一半都不如,。
同樣,8核版的ZX-D在圖表中能的數(shù)據(jù)能夠媲美Intel I3 6300處理器也是8核對比雙核的結(jié)果,,雖然Intel I3 6300處理器的超線程特性會給測試帶來一定加成,,但本質(zhì)上來說Intel I3 6300依舊是雙核,等于是用ZX-D 8核的成績對比Intel I3 6300雙核的成績,。換言之,,就是ZX-D 8核綁在一起的性能約等于Intel I3 6300雙核的性能。如果以這個(gè)象棋測試為基準(zhǔn),,換算為單線程性能的話,,ZX-D的單線程性能可謂慘不忍睹。
也許有人會說,,多線程性能過得去不是也挺好,?為何要執(zhí)著于單線程性能?
其實(shí),,作為桌面CPU,,最重要的就是單線程性能,因?yàn)樽烂嫫脚_程序都是串行的,如果單線程性能上不去,,用戶體驗(yàn)會很糟糕,,即便是8核、16核CPU,,在單線程性能不足的情況下,,實(shí)際用戶體驗(yàn)很可能會反而不如雙核CPU——在使用中很有可能出現(xiàn)網(wǎng)絡(luò)上調(diào)侃的“1核有難,7核(15核)圍觀”的情況,。
此外,,很多應(yīng)用往往做不到8核/16核優(yōu)化,不少都是雙核優(yōu)化的,,比如大量國產(chǎn)網(wǎng)絡(luò)游戲,。而恰恰國產(chǎn)網(wǎng)絡(luò)游戲的用戶數(shù)量還真不少,換言之,,就是面對國產(chǎn)網(wǎng)絡(luò)游戲的CPU非常有市場,。如果用單線程性能有限,但卻有8個(gè)核心的CPU,,比如8核版的ZX-D來運(yùn)行這些雙核優(yōu)化的網(wǎng)絡(luò)游戲,,用戶體驗(yàn)會非常差,實(shí)際的游戲體驗(yàn)反而不如之前圖表中,,測試成績不如ZX-D的Intel G4500,。
這也是玩國產(chǎn)網(wǎng)絡(luò)游戲,Intel I3系列CPU雖然只有雙核,,但實(shí)際游戲體驗(yàn)卻勝過AMD一系列6核,、8核CPU的原因——這些年,AMD雖然開發(fā)出了一系列6核,、8核CPU,,但無論在用戶體驗(yàn)上,還是在商業(yè)上,,都不是Intel的雙核,、四核CPU的對手,而且近乎處于被碾壓的狀態(tài),。甚至有網(wǎng)友調(diào)侃“I3默秒全”,,這種說法的根源也在于Intel的CPU在單線程性能上遠(yuǎn)遠(yuǎn)強(qiáng)于其他公司的X86 CPU。
就商業(yè)上來說,,AMD這些年這一大票單線程性能不行的6核,、8核CPU顯然是失敗的,而兆芯CPU的單線程性能比AMD都有不小差距,,ZX-D和ZX-E將來在商業(yè)市場上的前景就可想而知了,,只能仰仗兆芯強(qiáng)悍的背景,,向黨政軍推廣采購了。事實(shí)上,,某地方政府一直在不遺余力推廣兆芯,,下圖來自其政府采購網(wǎng)。
而AMD最新的Zen顯然是AMD總結(jié)經(jīng)驗(yàn)后嘔心瀝血之作,其最大的特點(diǎn)就是大幅提升了單線程性能,,Zen的微結(jié)構(gòu)性能已經(jīng)與Intel的Haswell相當(dāng),,雖然Haswell是數(shù)年前的產(chǎn)品,但考慮到Intel這些年一直擠牙膏,,Zen的性能還是很不錯(cuò)的,,而這也是AMD對Zen寄予厚望的原因。
因此,,對于桌面CPU,,單線程性能才是最重要的,單純堆核心數(shù),,然后用某一個(gè)特定的、以偏概全的,、非權(quán)威測試說明多線程性能接近Intel的某些CPU,,而非像飛騰那樣公開SPEC2000/2006測試數(shù)據(jù),就宣稱“兆芯處理器媲美國際主流水準(zhǔn)”,,這絕非科學(xué)客觀的態(tài)度,。