蘋果發(fā)表初代「Apple Silicon」M1 處理器后,,其優(yōu)異的性能表現(xiàn),,加上多年來(lái)世人對(duì)「擠牙膏」的Intel 和「毫無(wú)道理可尋」x86 指令集,,長(zhǎng)期累積的不滿,,一次「業(yè)力引爆」,導(dǎo)致很多人瞬間失去了知識(shí),、理智和常識(shí),。
除了網(wǎng)絡(luò)上滿滿的吹捧其跑分性能的歌功頌德文,以排山倒海之勢(shì),,把人炸得昏頭轉(zhuǎn)向,,連更換底層硬件架構(gòu)之后最重要的軟件兼容性都忘的一干二凈,,更不乏「微軟將棄x86 而典范轉(zhuǎn)移到ARM」、「Wintel即將土崩瓦解」和「蘋果將強(qiáng)勢(shì)重返服務(wù)器市場(chǎng)」等缺乏邏輯的橫空高論,,紛紛傾巢而出,仿佛讓人活在蘋果早已統(tǒng)治電腦工業(yè)的平行時(shí)空,。
筆者將會(huì)深入探討蘋果M1 的優(yōu)勢(shì),、劣勢(shì)與對(duì)業(yè)界造成的真正影響,但在一堆人還在一頭熱的當(dāng)下,,為了避免任何的誤解,,索性先將「結(jié)論」寫在前頭:
蘋果M1 的優(yōu)異性能的根本基礎(chǔ)是臺(tái)積電5納米制程與160 億晶體管,這簡(jiǎn)單的道理,,只要想想還在受困于10 納米制程良率,,和AMD Zen 3 依舊停在臺(tái)積電7 納米,即可明白,。
蘋果M1 的優(yōu)劣勢(shì)皆來(lái)自于其封閉生態(tài)體系,,蘋果過(guò)去強(qiáng)行將iOS 和macOS 的應(yīng)用程序全面64 位元化,就是為了Apple Silicon 的長(zhǎng)遠(yuǎn)布局,,讓他們可以專心針對(duì)64 位元AArch64 最佳化,,無(wú)須顧慮32 位元昔日包袱的執(zhí)行效率。
Apple Silicon并非毫無(wú)風(fēng)險(xiǎn),,不只轉(zhuǎn)型陣痛期,,更賭上了「究竟會(huì)有多少「假果粉」Mac用戶非要安裝原生Windows不可」和「會(huì)因?yàn)楦玫恼闲裕敢怵б捞O果神教的新興信眾」,,哪一邊會(huì)比較多,。
只要蘋果沒(méi)有想不開出售芯片給其他人,或者微軟棄x86 轉(zhuǎn)向ARM,,就算蘋果自研處理器在自己的電腦上跑自家的軟件再快,,Mac 區(qū)區(qū)不到7% 的個(gè)人電腦市占率和不足2,000 萬(wàn)臺(tái)的一年出貨量,絲毫動(dòng)搖不了Wintel 和x86 生態(tài)系統(tǒng)的基本盤,。
在商言商,,戰(zhàn)略重心早已轉(zhuǎn)向云端的微軟,操作系統(tǒng)從x86 全面轉(zhuǎn)移到ARM,,或著只弄出個(gè)特化版Windows,,現(xiàn)階段對(duì)他們根本一點(diǎn)好處也沒(méi)有,做個(gè)M1 原生的Office 就該謝天謝地了,。
同理可證,,最終目標(biāo)放在維持自家生態(tài)系獲利的蘋果,自然也沒(méi)有跨界的必要,。自從iPhone 4 開始使用自己的A4 處理器,,蘋果就從未對(duì)外銷售芯片,,有什么理由相信他們會(huì)瞬間策略大轉(zhuǎn)彎?
有鑒于過(guò)去Xserve 和Xserve RAID 的慘痛教訓(xùn),,蘋果很難有動(dòng)力重返因出貨重心轉(zhuǎn)移到云端巨頭自行客制化的數(shù)據(jù)中心,,而導(dǎo)致利潤(rùn)早已大不如前的品牌服務(wù)器市場(chǎng)。
蘋果M1 對(duì)業(yè)界真正的影響與對(duì)Intel,、AMD 最不利的因素,,在于這將鼓勵(lì)云端巨頭更積極的打造自用的ARM 服務(wù)器處理器,而這也是以ARM 為首的芯片IP 生態(tài)圈最重要的價(jià)值:用最短的時(shí)間和最少的費(fèi)用,,用拼積木的方式,,研制出Time To Market 的產(chǎn)品。
AMD 重新啟動(dòng)K12 微架構(gòu)專案,,推出相容ARM 指令集的EPYC,,可能性慢慢的上升中,假如成真,,「處理器游俠」Jim Keller為此重回AMD(他先前在AMD 時(shí),,原本要操刀這個(gè)專案),也不會(huì)是太令人感到意外的發(fā)展,。
以電腦工業(yè)歷史的角度,,從A4 到M1 的發(fā)展歷程,象征著「只要有制程優(yōu)勢(shì)和夠大的市場(chǎng)基本盤」,,RISC 絕對(duì)比CISC 更能輕易生出兼具高性能與低功耗的處理器微架構(gòu),,這是IBM 無(wú)緣享有的先天利基。
大概就是這樣,,但還是強(qiáng)烈建議各位繼續(xù)硬著頭皮看下去,,你將會(huì)有更多的收獲。
M1的天時(shí),、地利與人和
蘋果M1 的單核跑分一舉追上Intel 和AMD 的最新x86 微架構(gòu)(WillowCove,、Zen 3),其實(shí)并不會(huì)讓人感到一絲一毫的意外,,畢竟天時(shí),、地利、人和,,都站在蘋果那邊,。大家還記得電影少林足球的強(qiáng)雄的經(jīng)典臺(tái)詞嗎:「球證、旁證,、技術(shù)委員,、主辦、協(xié)辦,、所有單位都是我的人,,你們?cè)趺锤叶?!?/p>
天時(shí):臺(tái)積電和Intel制程技術(shù)出現(xiàn)了看似一去不回頭的死亡交叉。在過(guò)去,,x86指令集兼容處理器之所以能夠跟「高效能」劃上等號(hào),,仰仗著領(lǐng)先眾多RISC體系的制程技術(shù)優(yōu)勢(shì),以及蓬勃發(fā)展的個(gè)人電腦市場(chǎng),,才有那個(gè)資源去支撐動(dòng)輒3到5年的產(chǎn)品開發(fā)周期,,現(xiàn)在反倒是蘋果占了這些便宜。
地利:靠著1年超過(guò)2億部iPhone和5,000萬(wàn)臺(tái)iPad的雄厚本錢,,蘋果率先啟用臺(tái)積電5納米制程,而Intel卻連擠10納米牙膏都擠不太出來(lái),。至于AMD大概都準(zhǔn)備把有限的資源,,集中在5納米的Zen 4和3納米的Zen 5了。
人和:蘋果在2017年底的iOS 11完成了iOS App純64位元化,,也在2019年macOS Catalina全面終止32位元App支援,,不但讓蘋果可全心全力發(fā)揮64位元ARMv8-A的潛能,也簡(jiǎn)化了Rosetta 2二進(jìn)位碼動(dòng)態(tài)轉(zhuǎn)譯器的復(fù)雜度,,只要轉(zhuǎn)換x86-64到ARMv8-A,,而且也不包含難搞的AVX、AVX2和AVX-512,,這對(duì)改善效能當(dāng)然也有立竿見(jiàn)影的效果,。
當(dāng)RISC 處理器享有昔日x86 的制程優(yōu)勢(shì)與市場(chǎng)規(guī)模
智能手機(jī)就像昔日的個(gè)人電腦,給了消費(fèi)型RISC 處理器一塊逐漸茁壯成長(zhǎng)的沃土,。蘋果M1 的最大成就,,莫過(guò)于將IBM Power 等級(jí)的超高階RISC 心臟,以一般人可以接受的成本與價(jià)格,,搬到了筆記型電腦里面,,創(chuàng)造了地球上最強(qiáng)大的移動(dòng)式運(yùn)算處理器。
當(dāng)年曾經(jīng)參與PowerMac 的IBM 高層與眾多RISC 先驅(qū)者,,看到蘋果終于在M1 修成正果,,不知是否后悔并未認(rèn)真替蘋果研發(fā)適用于筆電的PowerPC 處理器,眼睜睜的看著Power Everywhere 戰(zhàn)略大計(jì),,失去了最大塊的基本盤,,使其終究沒(méi)有實(shí)現(xiàn)的可能性。
時(shí)過(guò)境遷,,讓人不勝唏噓,,更使人不得不好奇,2 位當(dāng)代RISC大師David Patterson 和John Hennessy,,會(huì)如何在未來(lái)的新版電腦組織結(jié)構(gòu)教科書中(《計(jì)算機(jī)體系結(jié)構(gòu):量化研究方法》),,對(duì)蘋果M1 寫下怎樣的評(píng)語(yǔ),。也許他們的心情也會(huì)五味雜陳吧?
抽絲剝繭M1 為何如此強(qiáng)大
看跑分看得很爽是一回事,,但要透徹領(lǐng)悟支撐這些數(shù)字的技術(shù)卻非常的困難,,筆者就先依據(jù)列出幾個(gè)規(guī)格,比較蘋果M1(高效能Firestorm,、低功耗Icestorm),、 Intel Tiger Lake-U(Willow Cove 微架構(gòu))、AMD Ryzen 5000 系列(Zen 3 微架構(gòu)),,讓各位瞧瞧臺(tái)積電5 納米制程和160 億晶體管的威力究竟有多么巨大,。因GPU 相關(guān)資料仍過(guò)于有限,本次聚焦在CPU 的部分,。
光從這張晶體管數(shù)量,、芯片面積和整合的功能,就足以見(jiàn)證臺(tái)積電5 納米制程有多么的可怕,,這才是M1 強(qiáng)大的根基,,其他的講再多都是多余,也讓人極度期待AMD Zen 4 的規(guī)格與表現(xiàn),。
再來(lái)看看決定IPC(Instruction Per Cycle,,每個(gè)時(shí)鐘周期的執(zhí)行指令數(shù))上限的指令解碼寬度和亂序指令執(zhí)行核心(OOOE,Out-Of-OrderExecution)的重新排序緩沖區(qū)(ROB,, ReOrderBuffer),。乍看之下,M1每個(gè)時(shí)鐘周期最多可解碼8 個(gè)指令(其實(shí)從A11 就差不多是這樣了),,完全是IBM Power 的等級(jí),,似乎很厲害,但這本來(lái)就是指令編碼格式統(tǒng)一,、長(zhǎng)度固定的RISC,,應(yīng)當(dāng)享有的先天優(yōu)勢(shì)。更何況,,一個(gè)「相對(duì)簡(jiǎn)單」的x86 指令,,其工作量可能就相當(dāng)于1.5-2 個(gè)ARM 指令,Intel 和AMD 又有微指令Cache加持,,換言之,,解碼器寬度的差異性并沒(méi)有那么大,唯一可以確定的是復(fù)數(shù)x86 指令集的解碼器,,真的非常的難實(shí)作,。
但亂序指令執(zhí)行核心的規(guī)模差距就讓人瞠目結(jié)舌了,幾乎都是最新型x86微架構(gòu)的2-3 倍,,世上唯一凌駕于蘋果的,,只有單一核心可同時(shí)運(yùn)行「1,000 個(gè)指令(In-Flight )」的IBM Power10 了,。同場(chǎng)加映ARM 本家最強(qiáng)的Cortex-X1:ROB 也只有224。此外,,藉由4 個(gè)128 位元NEON 運(yùn)算單元,,F(xiàn)irestorm 的浮點(diǎn)指令輸出吞吐量,為現(xiàn)有新型x86 微架構(gòu)的2 到3 倍,。就算論數(shù)據(jù)更寬的SIMD 指令集,,「極度向量電腦化」的SVE(Scalable Vector Extension),其未來(lái)性也遠(yuǎn)勝于AVX-512,,就看蘋果想不想用,。
蘋果歷代Ax 處理器一直有一個(gè)為人稱道之處:規(guī)格簡(jiǎn)單粗暴、但性能表現(xiàn)強(qiáng)大到讓人感覺(jué)很不真實(shí)的存儲(chǔ)器子系統(tǒng),,M1 Firestorm 核心「6 倍」于Intel AMD 的L1 指令快取,,在前代A13 就有128kB 的等級(jí)。Icestorm的L1 指令與數(shù)據(jù)快取容量分別是128kB和64kB,,但也多于現(xiàn)有x86 核心,連4 核共用的L2 快取也有4MB,。
當(dāng)然,,x86 因大量指令直接以存儲(chǔ)器做為運(yùn)算目標(biāo)、使其非常的「Memory Intensive」,,以及指令格式混亂,,激增了快取存儲(chǔ)器的復(fù)雜度,但「其他」的ARM 指令集相容處理器至今仍遠(yuǎn)遠(yuǎn)不及蘋果的成就,,卻也是不爭(zhēng)的事實(shí),。
不過(guò),在規(guī)格表上看不到的秘密是:iOS 11 全面軟件生態(tài)系統(tǒng)64 位元化之后,,蘋果Ax 處理器「很可能」早就放棄32 位元兼容性(或著就算能用也是跑得很慢),,這是連IBM 都無(wú)福消受的天大優(yōu)勢(shì),畢竟數(shù)十年來(lái),,還是有一大票老舊的企業(yè)服務(wù)器應(yīng)用程序,,在今天還在線上服役。也因此,,當(dāng)震驚于M1 的優(yōu)異表現(xiàn)之余,,各位也請(qǐng)冷靜的想想,這根本就是一場(chǎng)不公平的競(jìng)賽,,而蘋果M1 與其后代,,也注定難以走出自家的封閉花園,有誰(shuí)會(huì)想要一顆跑32 位元應(yīng)用程序很慢,、甚至根本不能用的ARM 系統(tǒng)單芯片,?
重回服務(wù)器市場(chǎng)的機(jī)會(huì)還是非常渺茫
這年頭只要一提到「高效能」,,很多人的身體就會(huì)本能性自動(dòng)反應(yīng)「進(jìn)軍服務(wù)器」,不過(guò)「服務(wù)器」等級(jí)的處理器,,并不是空有高效能,,即可功德圓滿,高可用度,、高穩(wěn)定度,、更精細(xì)的虛擬化管理機(jī)能、更完備的管理機(jī)制,、與操作系統(tǒng)高度整合的錯(cuò)誤回報(bào)技術(shù),,都是必要的條件。充足的I/O 完整度,、供給充沛頻寬和容量的存儲(chǔ)器子系統(tǒng),、大型化多處理器/ 多核心仰賴的高效率快取數(shù)據(jù)一致性協(xié)定(Cache Coherence)等,更是不可或缺,。很明顯的,,目前這個(gè)M1 還是遠(yuǎn)遠(yuǎn)不及IBM Intel 和AMD。
某些高人相信蘋果可以一步一步慢慢來(lái),,先從「邊緣計(jì)算(Edge Computing,,如歐洲電信標(biāo)準(zhǔn)協(xié)會(huì)定義的5G MEC)」服務(wù)器切入,但也得蘋果有類似電信營(yíng)運(yùn)商的需要,。更何況,,邊緣計(jì)算服務(wù)器,往往會(huì)被布署在環(huán)境較為嚴(yán)苛的地點(diǎn),,等于一腳踏入工業(yè)電腦廠商的守備范圍,。除非蘋果對(duì)「服務(wù)器」有著突破性的定義和創(chuàng)新,否則像Google 云端TPU 一樣「自研自用」替使用者提供云端服務(wù),,是最有可能的方向,,但也絕非一蹴而就的。
關(guān)于蘋果是否將重回品牌服務(wù)器的議題,,無(wú)論如何,,機(jī)會(huì)都非常的渺茫,況且蘋果在「企業(yè)端軟件解決方案」這部份的資產(chǎn)幾乎是零,,為此開辟一個(gè)獲利不高的血腥戰(zhàn)場(chǎng),,對(duì)他們并不劃算,沒(méi)必要重蹈當(dāng)年Xserve 的覆轍,。
延伸到自家數(shù)據(jù)中心的可能性激增
話說(shuō)回來(lái),,看在蘋果的Mac Pro 里面還有一顆「28 核心」Xeon 要用自家芯片取而代之的份上,說(shuō)沒(méi)有高端產(chǎn)品的開發(fā)計(jì)劃,絕對(duì)是騙人的,,這也可能觸發(fā)蘋果連數(shù)據(jù)中心都逐步轉(zhuǎn)移到自家芯片的可能性,。蘋果在2015 年在其數(shù)據(jù)中心將VMware 轉(zhuǎn)向開源的KVM,現(xiàn)在看來(lái),,并非區(qū)區(qū)只為了節(jié)省2 年2,000 萬(wàn)美元的軟件授權(quán)費(fèi)用,,背后隱藏了更巨大的布局。
只不過(guò),,到頭來(lái),,這些目前尚未存在的「服務(wù)器等級(jí)AppleSilicon」,也是蘋果自家限定,,外人無(wú)緣一親芳澤,。只希望這間公司哪天想開了,愿意站上IEEE,、ISSCC 和HotChips 的演講臺(tái),,讓世人一窺其神秘芯片家族的廬山真面目,但這件好事成真的機(jī)會(huì)還是很渺茫就是了,。
M1 的下一步,?
M1 只是蘋果小小的第一步,后繼將會(huì)推出更高端的產(chǎn)品,,但對(duì)蘋果最重要的并非效能,,而是設(shè)法加速軟件生態(tài)圈轉(zhuǎn)移到原生版程序的進(jìn)度,像時(shí)下「Rosetta 2 跑得不順,、甚至無(wú)法安裝應(yīng)用程序」,、「印表機(jī)等周邊驅(qū)動(dòng)程序無(wú)法運(yùn)作」,、「電池續(xù)航力遠(yuǎn)不如官方宣稱的持久」等,,都是蘋果急需迫切解決的難題。
雖然蘋果生態(tài)圈常見(jiàn)「只要搞定微軟Office 和Adobe 就等于解決80% 需求」的論點(diǎn),,但除非你只會(huì)用得到Safari 和macOS 內(nèi)建的應(yīng)用程序,,要不然當(dāng)下的確不是入手M1 心臟MacBook 的好時(shí)機(jī)。
從M1 回頭檢視RISC 與CISC 的戰(zhàn)爭(zhēng)
人類第一臺(tái)RISC 電腦IBM 801 計(jì)劃的主持人John Cocke,,假如地下有知,,應(yīng)該會(huì)感慨萬(wàn)千吧。長(zhǎng)期壟罩在x86 陰影之下的電腦工業(yè),,仿佛暗云散去,,照出了一道道充滿希望的曙光。
「x86 義和團(tuán)」和「RISC 十字軍」的戰(zhàn)爭(zhēng),,持續(xù)了20 幾年,,隨著前者的自滅和M1 的問(wèn)世,后者近來(lái)開始有「蠕動(dòng)」的跡象。但筆者還是得提醒一個(gè)血淋淋的前提:蘋果是一個(gè)「瓶中生態(tài)系」的封閉花園,,里面再怎么枝繁葉茂,,就像茶壺內(nèi)的風(fēng)暴,對(duì)外面的世界幾乎難以帶來(lái)直接的沖擊,。
反過(guò)來(lái)說(shuō),,蘋果M1 的誕生,對(duì)整個(gè)電腦工業(yè)界并不算壞事,,最起碼足以讓Intel 和AMD 受到更強(qiáng)烈的刺激,,促使他們加快研制更性能強(qiáng)悍的處理器,而不是像Intel 的Skylake 微架構(gòu)一樣,,一用就是4 年,,然后這段「牙膏期」就讓ARM 指令集兼容處理器,效能激增到足以挑戰(zhàn)高階x86 微架構(gòu)的水準(zhǔn),。
庫(kù)克終于實(shí)現(xiàn)了喬布斯的未竟之志
將冷冰冰的技術(shù)規(guī)格束之高閣,,來(lái)談點(diǎn)比較感性的東西。
回顧蘋果在2008 年并購(gòu)PA Semi 時(shí),,外界普遍不看好喬布斯的大膽決定,,也一度無(wú)消無(wú)息到讓人以為蘋果早就放棄了,直到iPhone 4 才讓大家知道蘋果是玩真的,。12 年來(lái),,在這個(gè)研發(fā)先進(jìn)制程高效能處理器動(dòng)不動(dòng)就燒掉10 億美元的年代,蘋果持之以恒的將自己的芯片一步一步從手機(jī)平板推進(jìn)到自家的Mac,,怎么算都耗費(fèi)了數(shù)十億甚至上百億美元都有可能,,所以這也是筆者對(duì)于那些宣稱Apple Silicon 單價(jià)只有「幾十美元」的產(chǎn)業(yè)分析師嗤之以鼻的主因,你們是以為「研發(fā)」這件事是不用成本的嗎,?
蘋果熬了這么久,,也做了這么多的超前布署(軟件生態(tài)純64 位元化、數(shù)據(jù)中心舍棄VMware),,背后一定滿滿來(lái)自喬布斯那未竟的執(zhí)念,,而庫(kù)克總算實(shí)現(xiàn)了他的夢(mèng)想,這才是M1處理器,,真正讓筆者有感的地方,,也沒(méi)有任何東西比M1 更能吊祭已不在人世的史蒂夫·喬布斯。