英特爾這幾年估計(jì)心很累,。
除了PC銷量下滑,、工藝進(jìn)展遲滯,當(dāng)英偉達(dá)股價(jià)上漲,、新型AI處理器問世,、AMD收購賽靈思,、蘋果發(fā)布新芯片……英特爾每每都要被拖出來吊打一次,。
是廉頗老矣?還是大象善舞本來就不容易,?
從英特爾現(xiàn)在的業(yè)務(wù)情況來看,,傳統(tǒng)PC業(yè)務(wù)已經(jīng)從原來的八成下降到現(xiàn)在的五成,而數(shù)據(jù)中心則一路上揚(yáng),,營(yíng)收從原來的二成增長(zhǎng)到了五成,。或許老牌科技企業(yè)都逃不開波峰低谷的發(fā)展周期,,于是轉(zhuǎn)型就成為必然,。
從2017年開始,英特爾就宣稱自己是一家數(shù)據(jù)公司,,因?yàn)椤皵?shù)據(jù)才是未來的石油”,。2018年底,英特爾宣布最新戰(zhàn)略目標(biāo),,即以制程和封裝,、XPU架構(gòu)、內(nèi)存和存儲(chǔ),、互連,、安全、軟件六大技術(shù)支柱為核心,,明確了“以PC為中心”轉(zhuǎn)向“以數(shù)據(jù)為中心”的轉(zhuǎn)型目標(biāo),。
而就在昨晚,英特爾正式發(fā)布其首款數(shù)據(jù)中心獨(dú)立圖形顯卡——服務(wù)器GPU,,以及oneAPI Gold工具包,。這也意味著,英特爾六大戰(zhàn)略中的XPU架構(gòu)(XPU架構(gòu)中的“X”指的是包含 CPU,、GPU,、專用加速器以及FPGA 的混合架構(gòu))集齊最后一條“神龍”;軟件方面,,one API Gold繼Beta版本發(fā)布一年后,,也完成了階段性的躍升。軟硬件共同發(fā)力,,英特爾卯足力氣攪動(dòng)數(shù)據(jù)中心本來就不平靜的池水,。
局勢(shì)已經(jīng)非常明朗,英特爾,、英偉達(dá),、AMD都在打造自家的XPU架構(gòu),通過收購也好,、自研也罷,,在硬件架構(gòu)和軟件工具上的布局都是一副當(dāng)仁不讓的態(tài)勢(shì),。
英特爾加速計(jì)算20年坎坷路
英特爾不是沒有過獨(dú)立顯卡GPU的嘗試,只不過是20年前,。2009年末,,英特爾宣布取消“Larrabee”圖形芯片項(xiàng)目,將重注都押在多核的技術(shù)路徑上,。
彼時(shí),,英偉達(dá)已經(jīng)推出Tesla,大舉進(jìn)攻,。AMD也在2006年收購了ATI后正式進(jìn)入顯卡領(lǐng)域,,雖然在CPU和GPU面臨著英特爾和英偉達(dá)的雙重夾擊,卻也是成就今天三足鼎立局面的關(guān)鍵一步,。
英特爾在集成顯卡這條路的經(jīng)濟(jì)賬沒毛病,。將圖像處理的部分整合到CPU中,這樣一來核心顯卡始終是和CPU一體的,,必要時(shí)還是需要調(diào)用部分CPU的運(yùn)算能力來提高圖像處理效率,。當(dāng)性能需要提升時(shí)怎么辦?增加核顯,,還可以提高處理器價(jià)格,,間接增加利潤(rùn)?;蛟S正因如此,,英特爾沒有太大動(dòng)力去開發(fā)獨(dú)顯GPU,在宣布取消Larrabee項(xiàng)目時(shí),,信誓旦旦表示不會(huì)推出獨(dú)立顯卡GPU,,至少短期內(nèi)不會(huì)。
被停掉的Larrabee后來成為了至強(qiáng)融核(Xeon Phi)協(xié)處理器的原型,,這是英特爾首款集成眾核(Many Integrated Core,,MIC)架構(gòu)的產(chǎn)品,用作高性能計(jì)算的超級(jí)計(jì)算機(jī)或服務(wù)器的加速卡,,順應(yīng)了高性能計(jì)算市場(chǎng)的異構(gòu)需求,。Xeon Phi也一度被用到超級(jí)計(jì)算機(jī)上,雄霸世界超算榜單,,例如我國的天河一號(hào),、天河二號(hào),直到2015年4月被美國禁止向中國超算中心出口Xeon Phi,。
受市場(chǎng)需求頹勢(shì)的主要影響,,2018年開始,代號(hào)為Knight Landing的Xeon Phi 7210,、7230等產(chǎn)品列入停產(chǎn)計(jì)劃,;去年,代號(hào)為Knight Mill的Xeon Phi處理器也啟動(dòng)停產(chǎn)計(jì)劃,,并宣布將在今年7月31日停止出貨,。
而就在英特爾在加速計(jì)算曲折前進(jìn)的這些年,英偉達(dá)GPU一騎絕塵,,AMD也在CPU和GPU雙線開花,。雖說船大不好調(diào)頭,但作為巨頭,,必要時(shí)確實(shí)要勇于自我piapia打臉,。
2017年末,原AMD RTG總裁,、顯卡首席架構(gòu)師Raja Koduri離開AMD,,加入英特爾。當(dāng)時(shí)業(yè)界就推斷英特爾可能要重啟獨(dú)顯計(jì)劃,,直到Xeon Phi陸續(xù)停產(chǎn),,這一猜想在去年達(dá)到沸點(diǎn)。
直到今年8月的架構(gòu)日上,,英特爾曝光了針對(duì)數(shù)據(jù)中心的首款基于 Xe 架構(gòu)的獨(dú)立圖形顯卡,,有關(guān)英特爾開發(fā)獨(dú)顯GPU的傳言正式得到驗(yàn)證。
英特爾高級(jí)副總裁,、首席架構(gòu)師,,兼架構(gòu)、圖形和軟件部門總經(jīng)理RajaKoduri發(fā)布Xe戰(zhàn)略
Xe GPU的出現(xiàn),,從多個(gè)維度補(bǔ)充了英特爾缺失的拼圖,。它正式宣告英特爾進(jìn)軍高端GPU領(lǐng)域,將觸角伸向移動(dòng)端,、桌面端,、云游戲、數(shù)據(jù)中心,、高性能計(jì)算等多個(gè)領(lǐng)域,。此外,它作為英特爾向量計(jì)算的代表產(chǎn)品,,進(jìn)一步補(bǔ)全了英特爾的XPU組合,。
XPU架構(gòu)成為必爭(zhēng)之地
僅有CPU一條路確實(shí)走不通,這一點(diǎn)AMD的方向從一開始就是正確的,,英特爾這些年也通過買買買擴(kuò)充了XPU架構(gòu),。
圖源 | arabhardware.net
2015~2019這幾年間,英特爾都有重磅收購,幾乎都是圍繞這個(gè)架構(gòu)理念展開的,。2015年收購FPGA供應(yīng)商Altera,,2016年收購AI芯片供應(yīng)商N(yùn)ervana,2017年收購了ADAS芯片供應(yīng)商Mobileye和AI芯片供應(yīng)商Movidius,,2018年收購eASIC,,2019年收購云端AI芯片供應(yīng)商Habana Labs。
直到昨天正式推出針對(duì)數(shù)據(jù)中心的首款服務(wù)器GPU,,至此,,XPU全家桶已配齊。如果說英特爾之前擱置GPU計(jì)劃是出于市場(chǎng)策略和技術(shù)瓶頸,,那么,,今天重返這一市場(chǎng),難度就會(huì)低嗎,?英偉達(dá)的GPU性能不夠好嗎,?AMD的性價(jià)比它不香嗎?用戶選擇英特爾的理由是什么,?
據(jù)英特爾的技術(shù)大拿表示,,在過去的20年里,英特爾其實(shí)一直在提供集成圖形顯卡,。而顯然,,隨著工作負(fù)載和性能需求都在上升,AI和流媒體在這些工作負(fù)載中的占比也在上升,。英特爾正在擴(kuò)展為更為堅(jiān)實(shí)的Linux堆棧,,并將從數(shù)據(jù)中心一些獨(dú)特的用例開始,比如安卓云游戲和流媒體服務(wù),。
這是非常明智的一個(gè)起步,。安卓云游戲在全球游戲開發(fā)生態(tài)系統(tǒng)中占據(jù)74%的市場(chǎng)份額,增長(zhǎng)空間非常大,;而流媒體服務(wù)涉及高密度的媒體轉(zhuǎn)碼和編碼,,現(xiàn)在小視頻、直播盛行,,有著巨量的用戶市場(chǎng),。英特爾希望通過至強(qiáng)可擴(kuò)展處理器與全新服務(wù)器GPU的組合,加上開源和授權(quán)的軟件組件,,通過較低的總體擁有成本(TCO),,為安卓云游戲以及實(shí)時(shí)頂級(jí)視頻直播的高密度媒體轉(zhuǎn)編碼提供高密度、低時(shí)延的解決方案,。
但不管怎樣,,英特爾這一次押注數(shù)據(jù)中心GPU,將會(huì)是更為艱難的挑戰(zhàn)。首先龐大的研發(fā)投入仍然必不可少,,更重要的是,,這一次要突圍的技術(shù)需要多點(diǎn)開花,要在AI,、5G,、自動(dòng)駕駛等領(lǐng)域都要持續(xù)投入,,基礎(chǔ)研發(fā)上既要保持專注還要保證核心競(jìng)爭(zhēng)優(yōu)勢(shì),,軟件要更易用,生態(tài)要更強(qiáng)大,。
互相滲透的軟件生態(tài)
XPU的確很強(qiáng)大,,但是想要把整個(gè)計(jì)算系統(tǒng)打通,除了硬件,,軟件平臺(tái)也是要搭建的,。因?yàn)樯婕暗骄唧w的開發(fā)工作,在不同架構(gòu)之間切換并不容易,,尤其是想要跨廠商進(jìn)行切換的時(shí)候,,這也是業(yè)內(nèi)普遍的痛點(diǎn)。
英特爾曾在2019年的SuperComputing大會(huì)上首次提出oneAPI,,并表示這是為實(shí)現(xiàn)統(tǒng)一,、簡(jiǎn)化的跨架構(gòu)編程模型所提出的愿景,希望能夠不受限于單一廠商專用的代碼構(gòu)建,,且能實(shí)現(xiàn)原有代碼的集成,。借助oneAPI,開發(fā)者可以針對(duì)他們要解決的特定問題選擇最佳的加速器架構(gòu),,且無需為一個(gè)架構(gòu)和平臺(tái)再重寫軟件,。這不僅能夠釋放底層硬件的性能潛力,同時(shí)能降低軟件開發(fā)和維護(hù)成本,。繼Beta版本發(fā)布一年后,,相信這次最新發(fā)布的Gold版本在代碼穩(wěn)定性、成熟度以及性能表現(xiàn)方面值得期待,。
既然支持跨架構(gòu),、跨廠商的切換,那么不妨設(shè)想一下,,如果英特爾,、英偉達(dá)和AMD的芯片同在一個(gè)系統(tǒng)中,oneAPI是否可以提供支持,?
對(duì)這一問題,,英特爾方面給出的答案是肯定的,哪怕這個(gè)系統(tǒng)中沒有英特爾的芯片,也是可以支持的,。這意味著什么,?它將成為開放的行業(yè)規(guī)范,任何人都可以運(yùn)用它,,它甚至可以進(jìn)入英偉達(dá),、AMD的生態(tài)系統(tǒng)。面對(duì)競(jìng)爭(zhēng),,英特爾向友商敞開懷抱,,并且進(jìn)入他們的陣營(yíng)擁抱他們和他們的盟友。oneAPI就是英特爾在軟件乃至生態(tài)層面最大的雄心,。
英偉達(dá)的做法異曲同工,。在2019年法蘭克福國際超算大會(huì)上,英偉達(dá)已經(jīng)宣布其CUDA編程架構(gòu)開放支持Arm CPU架構(gòu),,向Arm生態(tài)系統(tǒng)提供全堆棧的AI,、HPC軟件,可支持所有AI框架,、600多個(gè)HPC應(yīng)用程序的加速,,其中包括所有NVIDIA CUDA-X AI和HPC庫、GPU加速的AI框架和軟件開發(fā)工具,,比如支持OpenACC的PGI編譯器和性能分析器,。而堆棧優(yōu)化完成后,NVIDIA將為所有主流CPU架構(gòu)提供加速,,包括x86,、POWER、Arm,。
AMD幾年前也開始了這樣的嘗試,,其Radeon開放運(yùn)算平臺(tái)ROCm,希望通過CUDA編譯代碼轉(zhuǎn)換,,進(jìn)一步支持英偉達(dá)的 CUDA平行運(yùn)算平臺(tái),,開始了在軟件平臺(tái)上對(duì)英偉達(dá)的追趕。
寫在最后
5G,、AI都在催生計(jì)算場(chǎng)景的多樣性和更為豐富的內(nèi)涵,。未來的數(shù)據(jù)是多樣化的,需要通過多種硬件計(jì)算組合來應(yīng)對(duì)多種數(shù)據(jù)類型,,誰能挖掘出最優(yōu)化的算力組合,,誰就能讓數(shù)據(jù)發(fā)揮出最大價(jià)值。異構(gòu)計(jì)算,,不僅是解決摩爾定律走入絕境的一種方法,,更是未來所需,。這就是為什么英特爾、英偉達(dá),、AMD紛紛在構(gòu)建自己的XPU平臺(tái),。
不過,當(dāng)三大巨頭紛紛端出自己的全家桶時(shí),,一個(gè)挑戰(zhàn)是共通的:進(jìn)步絕不僅體現(xiàn)在處理性能的提升上,,更大的難題在于:如何牢牢抓住應(yīng)用需求,用極為豐富,、靈活的組合給出最優(yōu)化,、最適配的方案?