本周三,,Arm發(fā)布了最新一代架構(gòu)Armv9,,這一架構(gòu)是在目前已經(jīng)廣泛使用的Armv8的基礎(chǔ)上,面向未來十年的新一代架構(gòu),。
雷鋒網(wǎng)了解到,,Armv9架構(gòu)有三個系列,分別是針對通用計算的A系列,,實時處理器的R系列,微控制器的M系列,,預(yù)計未來兩代移動基礎(chǔ)設(shè)施CPU的性能提升將超過30%,。首款基于Armv9架構(gòu)CPU的移動處理器最快將在今年底問世,可能來自MediaTek,。
Armv9架構(gòu)的初代版本增強了安全性,、機器學(xué)習(xí)、DSP性能,,Armv9架構(gòu)未來也將持續(xù)增強這些性能,,并將加入新特性。
最近幾年,,Arm架構(gòu)處理器已經(jīng)從智能手機為代表的終端向?qū)π阅芤蟾叩腜C,、數(shù)據(jù)中心延伸。從最新的發(fā)布可以看到,,Arm希望Armv9架構(gòu) CPU以及基于其GPU,、NPU處理器能夠無處不在,。如果Arm的目標能夠?qū)崿F(xiàn),是否可以實現(xiàn)CPU計算統(tǒng)治,?Arm的第三個1000萬出貨目標多久能夠達成,?
安全是發(fā)揮計算架構(gòu)
潛能最大的挑戰(zhàn)
—
Armv9架構(gòu)的發(fā)布會上,安全性被頻頻提及,,與安全相關(guān)的技術(shù)和介紹的篇幅也很長,。Arm高級副總裁、首席架構(gòu)師兼技術(shù)院士Richard Grisenthwaite解釋稱,,“我看來,,計算若要充分發(fā)揮潛能,安全是最大的挑戰(zhàn),,越來越多的私人數(shù)據(jù)被存放在計算系統(tǒng)中,,這讓這些數(shù)據(jù)成為安全攻擊的誘人目標。今年網(wǎng)絡(luò)犯罪損失的金額預(yù)估高達6萬億美元,?!?/p>
因此,Armv9架構(gòu)在安全性方面做了多方面的工作,。首先是引入了Arm機密計算架構(gòu)(Confidential Compute Architecture, CCA),,機密計算通過打造基于硬件的安全運行環(huán)境來執(zhí)行計算,保護部分代碼和數(shù)據(jù),,免于被存取或修改,,甚至不受特權(quán)軟件的影響。
Arm CCA將引入動態(tài)創(chuàng)建機密領(lǐng)域(Realms)的概念,,機密領(lǐng)域面向所有應(yīng)用,,運行在獨立于安全或非安全環(huán)境之外的環(huán)境中,實現(xiàn)保護數(shù)據(jù)安全的目的,。比如,,在商業(yè)應(yīng)用中,機密領(lǐng)域可以保護系統(tǒng)中商用機密數(shù)據(jù)和代碼,,無論它們正被使用,、閑置或正在傳輸中。
據(jù)悉,,Arm會在今年下半年公布Arm CCA的更多信息,。
內(nèi)存標簽擴展是Armv9架構(gòu)的另一項安全技術(shù)。Richard Grisenthwaite說:“在分析了全球軟件報告的大量安全問題后,,我們發(fā)現(xiàn)許多問題的根源實際上與過去內(nèi)存安全的老問題有關(guān),。這些問題已經(jīng)困擾計算領(lǐng)域50年,兩個持續(xù)多年特別常見的內(nèi)存安全問題——緩存溢出和釋放后重用,。很大一部分的問題是,,這些內(nèi)存安全漏洞被利用之前就能發(fā)現(xiàn)問題,,這是提高全球軟件安全至關(guān)重要的一步?!?/p>
Arm持續(xù)與谷歌合作開發(fā)的“內(nèi)存標簽擴展”技術(shù),,可以在軟件中查找空間和時間內(nèi)存安全的問題,允許軟件將指向內(nèi)存的指針與標簽建立關(guān)聯(lián),,并在使用指針時檢查這個標簽是否正確,。
Richard稱,內(nèi)存標簽擴展是明年上市的第一代Armv9 CPU不可或缺的一部分,。支持內(nèi)存標簽擴展的軟件也正被引入到安卓11系統(tǒng)和OPENSUSE,。
Arm還與劍橋大學(xué)在其CHERI架構(gòu)上合作多年,從架構(gòu)底層來提升安全性,。據(jù)介紹,,CHERI架構(gòu)定義了可提供這種封裝能力的硬件功能,這在未來將可能促成一個本質(zhì)上更為安全的計算平臺,,但這也會使某些系統(tǒng)的變成方式產(chǎn)生重大改變,。
不過,這種架構(gòu)Arm已經(jīng)在和其合作伙伴探索,,如果成功,,會在未來5-6年引入Armv9架構(gòu),成為Armv9架構(gòu)主要的組件之一,。
未來兩代Armv9架構(gòu)CPU
性能提升將超過30%
—
安全性是計算架構(gòu)的基礎(chǔ),,性能提升則是滿足越來越高的計算需求以及多樣化計算需求的關(guān)鍵。Arm預(yù)計,,新一代架構(gòu)Armv9將保持超過業(yè)界CPU性能提升的速度,,未來兩代移動和基礎(chǔ)設(shè)施CPU的性能提升將超過30%。
Richard強調(diào):“這個數(shù)據(jù)是根據(jù)業(yè)界標準評測工具來衡量,,30%的算力提升完全是憑借于本身架構(gòu)而不是借助于制程工藝來實現(xiàn),。”
計算性能提升非常重要的驅(qū)動力就是AI,,Statista Research Department今年1月發(fā)布的最近報告估計,,到21世紀20年代中期,,全球?qū)⒂谐^80億臺搭載AI語音輔助的設(shè)備,。不同設(shè)備對于AI性能的需求不同,也就需要不同的AI處理器,。
Arm與富士通合作開發(fā)了可伸縮矢量擴展(Scalable Vector Extension, SVE)技術(shù)并用在了全球最快的超級計算機“富岳”上,。在SVE的基礎(chǔ)上,Armv9中使用了新開發(fā)的SVE2技術(shù),,增強了對在CPU上本地運行的5G系統(tǒng),、虛擬和增強現(xiàn)實以及ML工作負載的處理能力,,能夠提供實現(xiàn)增強的機器學(xué)習(xí)和數(shù)字信號處理能力。
“我們還將通過提升頻率,、帶寬,、緩存大小、并減少內(nèi)存延遲,,以最大化CPU 性能,。”Richard表示,。
在解決新問題的過程中,,Arm加入了一些復(fù)雜技術(shù),這是否違背了精簡指令集(RISC)的初衷,?Richard的觀點是:“Arm架構(gòu)的精簡指令(RISC)核心沒有改變,,我們依然遵循著注冊到注冊(registration to registration) 的操作原則,所以從硬件的角度來看,,Arm指令集仍然保持著精益性,。”
Arm稱,,除了大幅增強CPU內(nèi)的矩陣乘法,,Mali GPU和Ethos NPU也會持續(xù)進行AI創(chuàng)新,擴展Arm的技術(shù)能力,。
統(tǒng)治CPU計算
—
目前,,CPU領(lǐng)域最成功的架構(gòu)當屬x86,不過x86的成功和統(tǒng)治力在于PC和高性能計算市場,,在Arm擅長的智能終端市場并不成功,。近幾年,Arm架構(gòu)在高性能計算領(lǐng)域取得了一些進展,,包括上面提到的“富岳”超級計算機,,以及推出采用Arm架構(gòu)的多款服務(wù)器。去年,,蘋果M1處理器Macbook Pro電腦的推出,,也讓業(yè)界看到了x86架構(gòu)在PC市場的統(tǒng)治地位并非牢不可破。
Arm首席執(zhí)行官Simon Segars說,,“Arm芯片實現(xiàn)1000億顆的出貨花了26年,,如果預(yù)測準確,接下來一年,,我們的合作伙伴出貨的Arm芯片將累計達到2000億顆,。也就是說,我們的第二個1000億的出貨將在短短5年內(nèi)達成?!?/p>
雷鋒網(wǎng)了解到,,目前Arm架構(gòu)的芯片出貨已經(jīng)超過1800億顆,Armv9架構(gòu)會成為實現(xiàn)Arm芯片3000億顆芯片出貨的先驅(qū),。沒有人能準確預(yù)估Arm實現(xiàn)第三個1000億顆芯片出貨的時間,,但可以明確的是Arm希望其芯片能夠為所有智能計算提供算力,也就是讓其芯片在未來無處不在,。
為了實現(xiàn)這個目標,,同時滿足行業(yè)從通用計算向普遍的專用處理發(fā)展的需求,Arm也開始強調(diào)全面計算的理念,。全面計算設(shè)計方法包含Arm的CPU,、GPU、NPU,,通過將全面計算的設(shè)計原則應(yīng)用在包含汽車,、客戶端、基礎(chǔ)設(shè)施和物聯(lián)網(wǎng)解決方案的整個IP組合中,。
與此配合,,Arm也需要在標準化程度上取得平衡。Richard說:“如果過多的標準化,,那么合作伙伴將無法開發(fā)合適的專用解決方案,。而如果太少的標準化,我們得承擔(dān)低價值,、形同實異的解決方案的風(fēng)險,。這將讓軟件生態(tài)系統(tǒng)的成本增加、且毫無益處,?!?/p>
Arm在服務(wù)器領(lǐng)域中已經(jīng)看到了標準化平衡的價值,推出了“服務(wù)器基礎(chǔ)架構(gòu)SBSA”和相關(guān)的認證計劃“服務(wù)器就緒”,。
“我們也正在擴大標準化的范圍,,Arm SystemReady將服務(wù)器就緒計劃的概念從云端延伸到物聯(lián)網(wǎng)邊緣等廣泛的設(shè)備上,以實現(xiàn)通用操作系統(tǒng)及虛擬機管理程序之間的交互運作,?!盧ichard說。
如果Arm的全面計算以及標準化探索成功,,從終端到邊緣再到云端,,Arm是否就能夠?qū)崿F(xiàn)在未來的計算統(tǒng)治?實現(xiàn)3000億顆甚至更多芯片出貨又會有多快呢,?
小結(jié)
—
現(xiàn)在看來,,有兩大方面的阻礙,一方面是在復(fù)雜的國際形勢下,,同屬精簡指令集的RISC-V正在快速發(fā)展,,加上x86陣營intel和AMD也在加強x86的競爭力,Arm要真正撼動x86的優(yōu)勢領(lǐng)域并非易事,。
另一方面,,中國作為芯片進口的大國,Arm與Nvidia的收購交易,,以及美國對中國領(lǐng)先芯片設(shè)計公司的出口限制,,讓客戶產(chǎn)生擔(dān)憂。
對于Armv9是否以供給包括華為在內(nèi)的中國企業(yè)的問題,,Arm的官方回復(fù)是:“Arm既有源于美國的IP,,也有非源于美國的IP。經(jīng)過全面的審查,,Arm確定其Armv9架構(gòu)不受美國出口管理條例(EAR)的約束,。Arm已將此通知美國政府相關(guān)部門,我們將繼續(xù)遵守美國商務(wù)部針對華為及其附屬公司海思的指導(dǎo)方針,?!?/p>
這樣的回復(fù),不知你怎么看,?