英特爾這幾年估計(jì)心很累,。
除了PC銷(xiāo)量下滑、工藝進(jìn)展遲滯,,當(dāng)英偉達(dá)股價(jià)上漲,、新型AI處理器問(wèn)世、AMD收購(gòu)賽靈思,、蘋(píng)果發(fā)布新芯片……英特爾每每都要被拖出來(lái)吊打一次,。
是廉頗老矣?還是大象善舞本來(lái)就不容易,?
從英特爾現(xiàn)在的業(yè)務(wù)情況來(lái)看,,傳統(tǒng)PC業(yè)務(wù)已經(jīng)從原來(lái)的八成下降到現(xiàn)在的五成,而數(shù)據(jù)中心則一路上揚(yáng),,營(yíng)收從原來(lái)的二成增長(zhǎng)到了五成,。或許老牌科技企業(yè)都逃不開(kāi)波峰低谷的發(fā)展周期,,于是轉(zhuǎn)型就成為必然,。
從2017年開(kāi)始,英特爾就宣稱(chēng)自己是一家數(shù)據(jù)公司,,因?yàn)椤皵?shù)據(jù)才是未來(lái)的石油”,。2018年底,英特爾宣布最新戰(zhàn)略目標(biāo),,即以制程和封裝,、XPU架構(gòu)、內(nèi)存和存儲(chǔ),、互連,、安全、軟件六大技術(shù)支柱為核心,,明確了“以PC為中心”轉(zhuǎn)向“以數(shù)據(jù)為中心”的轉(zhuǎn)型目標(biāo),。
而就在昨晚,英特爾正式發(fā)布其首款數(shù)據(jù)中心獨(dú)立圖形顯卡——服務(wù)器GPU,,以及oneAPI Gold工具包,。這也意味著,英特爾六大戰(zhàn)略中的XPU架構(gòu)(XPU架構(gòu)中的“X”指的是包含 CPU,、GPU,、專(zhuān)用加速器以及FPGA 的混合架構(gòu))集齊最后一條“神龍”;軟件方面,one API Gold繼Beta版本發(fā)布一年后,,也完成了階段性的躍升,。軟硬件共同發(fā)力,英特爾卯足力氣攪動(dòng)數(shù)據(jù)中心本來(lái)就不平靜的池水,。
局勢(shì)已經(jīng)非常明朗,,英特爾、英偉達(dá),、AMD都在打造自家的XPU架構(gòu),,通過(guò)收購(gòu)也好、自研也罷,,在硬件架構(gòu)和軟件工具上的布局都是一副當(dāng)仁不讓的態(tài)勢(shì),。
英特爾加速計(jì)算20年坎坷路
英特爾不是沒(méi)有過(guò)獨(dú)立顯卡GPU的嘗試,只不過(guò)是20年前,。2009年末,,英特爾宣布取消“Larrabee”圖形芯片項(xiàng)目,將重注都押在多核的技術(shù)路徑上,。
彼時(shí),英偉達(dá)已經(jīng)推出Tesla,,大舉進(jìn)攻,。AMD也在2006年收購(gòu)了ATI后正式進(jìn)入顯卡領(lǐng)域,雖然在CPU和GPU面臨著英特爾和英偉達(dá)的雙重夾擊,,卻也是成就今天三足鼎立局面的關(guān)鍵一步,。
英特爾在集成顯卡這條路的經(jīng)濟(jì)賬沒(méi)毛病。將圖像處理的部分整合到CPU中,,這樣一來(lái)核心顯卡始終是和CPU一體的,,必要時(shí)還是需要調(diào)用部分CPU的運(yùn)算能力來(lái)提高圖像處理效率。當(dāng)性能需要提升時(shí)怎么辦,?增加核顯,,還可以提高處理器價(jià)格,間接增加利潤(rùn),?;蛟S正因如此,英特爾沒(méi)有太大動(dòng)力去開(kāi)發(fā)獨(dú)顯GPU,,在宣布取消Larrabee項(xiàng)目時(shí),,信誓旦旦表示不會(huì)推出獨(dú)立顯卡GPU,至少短期內(nèi)不會(huì),。
被停掉的Larrabee后來(lái)成為了至強(qiáng)融核(Xeon Phi)協(xié)處理器的原型,,這是英特爾首款集成眾核(Many Integrated Core,MIC)架構(gòu)的產(chǎn)品,用作高性能計(jì)算的超級(jí)計(jì)算機(jī)或服務(wù)器的加速卡,,順應(yīng)了高性能計(jì)算市場(chǎng)的異構(gòu)需求,。Xeon Phi也一度被用到超級(jí)計(jì)算機(jī)上,雄霸世界超算榜單,,例如我國(guó)的天河一號(hào),、天河二號(hào),直到2015年4月被美國(guó)禁止向中國(guó)超算中心出口Xeon Phi,。
受市場(chǎng)需求頹勢(shì)的主要影響,,2018年開(kāi)始,代號(hào)為Knight Landing的Xeon Phi 7210,、7230等產(chǎn)品列入停產(chǎn)計(jì)劃,;去年,代號(hào)為Knight Mill的Xeon Phi處理器也啟動(dòng)停產(chǎn)計(jì)劃,,并宣布將在今年7月31日停止出貨,。
而就在英特爾在加速計(jì)算曲折前進(jìn)的這些年,英偉達(dá)GPU一騎絕塵,,AMD也在CPU和GPU雙線(xiàn)開(kāi)花,。雖說(shuō)船大不好調(diào)頭,但作為巨頭,,必要時(shí)確實(shí)要勇于自我piapia打臉,。
2017年末,原AMD RTG總裁,、顯卡首席架構(gòu)師Raja Koduri離開(kāi)AMD,,加入英特爾。當(dāng)時(shí)業(yè)界就推斷英特爾可能要重啟獨(dú)顯計(jì)劃,,直到Xeon Phi陸續(xù)停產(chǎn),,這一猜想在去年達(dá)到沸點(diǎn)。
直到今年8月的架構(gòu)日上,,英特爾曝光了針對(duì)數(shù)據(jù)中心的首款基于 Xe 架構(gòu)的獨(dú)立圖形顯卡,,有關(guān)英特爾開(kāi)發(fā)獨(dú)顯GPU的傳言正式得到驗(yàn)證。
英特爾高級(jí)副總裁,、首席架構(gòu)師,,兼架構(gòu)、圖形和軟件部門(mén)總經(jīng)理RajaKoduri發(fā)布Xe戰(zhàn)略
Xe GPU的出現(xiàn),,從多個(gè)維度補(bǔ)充了英特爾缺失的拼圖,。它正式宣告英特爾進(jìn)軍高端GPU領(lǐng)域,將觸角伸向移動(dòng)端,、桌面端,、云游戲、數(shù)據(jù)中心、高性能計(jì)算等多個(gè)領(lǐng)域,。此外,,它作為英特爾向量計(jì)算的代表產(chǎn)品,進(jìn)一步補(bǔ)全了英特爾的XPU組合,。
XPU架構(gòu)成為必爭(zhēng)之地
僅有CPU一條路確實(shí)走不通,,這一點(diǎn)AMD的方向從一開(kāi)始就是正確的,英特爾這些年也通過(guò)買(mǎi)買(mǎi)買(mǎi)擴(kuò)充了XPU架構(gòu),。
圖源 | arabhardware.net
2015~2019這幾年間,,英特爾都有重磅收購(gòu),幾乎都是圍繞這個(gè)架構(gòu)理念展開(kāi)的,。2015年收購(gòu)FPGA供應(yīng)商Altera,,2016年收購(gòu)AI芯片供應(yīng)商N(yùn)ervana,2017年收購(gòu)了ADAS芯片供應(yīng)商Mobileye和AI芯片供應(yīng)商Movidius,,2018年收購(gòu)eASIC,,2019年收購(gòu)云端AI芯片供應(yīng)商Habana Labs。
直到昨天正式推出針對(duì)數(shù)據(jù)中心的首款服務(wù)器GPU,,至此,,XPU全家桶已配齊。如果說(shuō)英特爾之前擱置GPU計(jì)劃是出于市場(chǎng)策略和技術(shù)瓶頸,,那么,,今天重返這一市場(chǎng),難度就會(huì)低嗎,?英偉達(dá)的GPU性能不夠好嗎?AMD的性?xún)r(jià)比它不香嗎,?用戶(hù)選擇英特爾的理由是什么,?
據(jù)英特爾的技術(shù)大拿表示,在過(guò)去的20年里,,英特爾其實(shí)一直在提供集成圖形顯卡,。而顯然,隨著工作負(fù)載和性能需求都在上升,,AI和流媒體在這些工作負(fù)載中的占比也在上升,。英特爾正在擴(kuò)展為更為堅(jiān)實(shí)的Linux堆棧,并將從數(shù)據(jù)中心一些獨(dú)特的用例開(kāi)始,,比如安卓云游戲和流媒體服務(wù),。
這是非常明智的一個(gè)起步。安卓云游戲在全球游戲開(kāi)發(fā)生態(tài)系統(tǒng)中占據(jù)74%的市場(chǎng)份額,,增長(zhǎng)空間非常大,;而流媒體服務(wù)涉及高密度的媒體轉(zhuǎn)碼和編碼,現(xiàn)在小視頻、直播盛行,,有著巨量的用戶(hù)市場(chǎng),。英特爾希望通過(guò)至強(qiáng)可擴(kuò)展處理器與全新服務(wù)器GPU的組合,加上開(kāi)源和授權(quán)的軟件組件,,通過(guò)較低的總體擁有成本(TCO),,為安卓云游戲以及實(shí)時(shí)頂級(jí)視頻直播的高密度媒體轉(zhuǎn)編碼提供高密度、低時(shí)延的解決方案,。
但不管怎樣,,英特爾這一次押注數(shù)據(jù)中心GPU,將會(huì)是更為艱難的挑戰(zhàn),。首先龐大的研發(fā)投入仍然必不可少,,更重要的是,這一次要突圍的技術(shù)需要多點(diǎn)開(kāi)花,,要在AI,、5G、自動(dòng)駕駛等領(lǐng)域都要持續(xù)投入,,基礎(chǔ)研發(fā)上既要保持專(zhuān)注還要保證核心競(jìng)爭(zhēng)優(yōu)勢(shì),,軟件要更易用,生態(tài)要更強(qiáng)大,。
互相滲透的軟件生態(tài)
XPU的確很強(qiáng)大,,但是想要把整個(gè)計(jì)算系統(tǒng)打通,除了硬件,,軟件平臺(tái)也是要搭建的,。因?yàn)樯婕暗骄唧w的開(kāi)發(fā)工作,在不同架構(gòu)之間切換并不容易,,尤其是想要跨廠(chǎng)商進(jìn)行切換的時(shí)候,,這也是業(yè)內(nèi)普遍的痛點(diǎn)。
英特爾曾在2019年的SuperComputing大會(huì)上首次提出oneAPI,,并表示這是為實(shí)現(xiàn)統(tǒng)一,、簡(jiǎn)化的跨架構(gòu)編程模型所提出的愿景,希望能夠不受限于單一廠(chǎng)商專(zhuān)用的代碼構(gòu)建,,且能實(shí)現(xiàn)原有代碼的集成,。借助oneAPI,開(kāi)發(fā)者可以針對(duì)他們要解決的特定問(wèn)題選擇最佳的加速器架構(gòu),,且無(wú)需為一個(gè)架構(gòu)和平臺(tái)再重寫(xiě)軟件,。這不僅能夠釋放底層硬件的性能潛力,同時(shí)能降低軟件開(kāi)發(fā)和維護(hù)成本,。繼Beta版本發(fā)布一年后,,相信這次最新發(fā)布的Gold版本在代碼穩(wěn)定性,、成熟度以及性能表現(xiàn)方面值得期待。
既然支持跨架構(gòu),、跨廠(chǎng)商的切換,,那么不妨設(shè)想一下,如果英特爾,、英偉達(dá)和AMD的芯片同在一個(gè)系統(tǒng)中,,oneAPI是否可以提供支持?
對(duì)這一問(wèn)題,,英特爾方面給出的答案是肯定的,,哪怕這個(gè)系統(tǒng)中沒(méi)有英特爾的芯片,也是可以支持的,。這意味著什么,?它將成為開(kāi)放的行業(yè)規(guī)范,任何人都可以運(yùn)用它,,它甚至可以進(jìn)入英偉達(dá),、AMD的生態(tài)系統(tǒng)。面對(duì)競(jìng)爭(zhēng),,英特爾向友商敞開(kāi)懷抱,,并且進(jìn)入他們的陣營(yíng)擁抱他們和他們的盟友。oneAPI就是英特爾在軟件乃至生態(tài)層面最大的雄心,。
英偉達(dá)的做法異曲同工,。在2019年法蘭克福國(guó)際超算大會(huì)上,英偉達(dá)已經(jīng)宣布其CUDA編程架構(gòu)開(kāi)放支持Arm CPU架構(gòu),,向Arm生態(tài)系統(tǒng)提供全堆棧的AI,、HPC軟件,可支持所有AI框架,、600多個(gè)HPC應(yīng)用程序的加速,,其中包括所有NVIDIA CUDA-X AI和HPC庫(kù)、GPU加速的AI框架和軟件開(kāi)發(fā)工具,,比如支持OpenACC的PGI編譯器和性能分析器。而堆棧優(yōu)化完成后,,NVIDIA將為所有主流CPU架構(gòu)提供加速,,包括x86、POWER,、Arm,。
AMD幾年前也開(kāi)始了這樣的嘗試,其Radeon開(kāi)放運(yùn)算平臺(tái)ROCm,,希望通過(guò)CUDA編譯代碼轉(zhuǎn)換,,進(jìn)一步支持英偉達(dá)的 CUDA平行運(yùn)算平臺(tái),,開(kāi)始了在軟件平臺(tái)上對(duì)英偉達(dá)的追趕。
寫(xiě)在最后
5G,、AI都在催生計(jì)算場(chǎng)景的多樣性和更為豐富的內(nèi)涵,。未來(lái)的數(shù)據(jù)是多樣化的,需要通過(guò)多種硬件計(jì)算組合來(lái)應(yīng)對(duì)多種數(shù)據(jù)類(lèi)型,,誰(shuí)能挖掘出最優(yōu)化的算力組合,,誰(shuí)就能讓數(shù)據(jù)發(fā)揮出最大價(jià)值。異構(gòu)計(jì)算,,不僅是解決摩爾定律走入絕境的一種方法,,更是未來(lái)所需。這就是為什么英特爾,、英偉達(dá),、AMD紛紛在構(gòu)建自己的XPU平臺(tái)。
不過(guò),,當(dāng)三大巨頭紛紛端出自己的全家桶時(shí),,一個(gè)挑戰(zhàn)是共通的:進(jìn)步絕不僅體現(xiàn)在處理性能的提升上,更大的難題在于:如何牢牢抓住應(yīng)用需求,,用極為豐富,、靈活的組合給出最優(yōu)化、最適配的方案,?