對(duì)英特爾來(lái)說(shuō),,“CPU巨頭”的標(biāo)簽已經(jīng)深入人心。不過(guò),,在最近兩個(gè)月,,CPU在英特爾的關(guān)注度被軟件和獨(dú)立GPU搶了風(fēng)頭。不知從何時(shí)起,,“軟件為先”和“XPU”已經(jīng)成為英特爾新的流行詞,。同樣,英偉達(dá)對(duì)ARM的收購(gòu),,以及AMD對(duì)賽靈思的收購(gòu),,也昭示著芯片巨頭們與英特爾的“不謀而合”,它們紛紛將未來(lái)的布局瞄準(zhǔn)了同一個(gè)方向:異構(gòu)計(jì)算,。
“通用”與“專用”相向而行
從20世紀(jì)60年代的字符終端時(shí)代到如今的智能計(jì)算時(shí)代,,數(shù)據(jù)的量和質(zhì)都發(fā)生了顯著的變化。以文本,、圖表為主的結(jié)構(gòu)化數(shù)據(jù)比例不斷下降,,融媒體數(shù)據(jù)、實(shí)時(shí)處理的傳感級(jí)數(shù)據(jù)等非結(jié)構(gòu)數(shù)據(jù),以及深度學(xué)習(xí)的元數(shù)據(jù)的持續(xù)激增,,將越來(lái)越多種類,、精度的數(shù)據(jù)以更快的速度進(jìn)行傳輸和處理,并成為智能計(jì)算的剛需,。
作為通用處理器的代表型廠商,,英特爾已經(jīng)將異構(gòu)計(jì)算作為應(yīng)對(duì)AI時(shí)代算力挑戰(zhàn)的關(guān)鍵戰(zhàn)略,。如果將數(shù)據(jù)看作食材,,CPU就相當(dāng)于“瑞士軍刀”,適用于一切食材,,卻不一定能將所有食材處理得又快又好,。GPU、FPGA,、DSP等專用處理器的加入,,讓計(jì)算架構(gòu)能更有效地應(yīng)對(duì)場(chǎng)景化數(shù)據(jù)。
“異構(gòu)計(jì)算的產(chǎn)業(yè)的基礎(chǔ)是數(shù)據(jù)的爆炸式增長(zhǎng),,這其實(shí)是我們發(fā)展異構(gòu)計(jì)算的主要驅(qū)動(dòng)力,。”英特爾架構(gòu),、圖形和軟件集團(tuán)副總裁兼中國(guó)區(qū)總經(jīng)理謝曉清在接受《中國(guó)電子報(bào)》采訪時(shí)指出,,“CPU提供的是通用型計(jì)算的能力,解決的問(wèn)題很廣義,。但是GPU,、FPGA,或者AI加速芯片解決的是特定領(lǐng)域的問(wèn)題?,F(xiàn)在很多數(shù)據(jù)的產(chǎn)生都有一定的特點(diǎn),,以至于在CPU上的運(yùn)算效果不一定是最理想的,在GPU或者其他并行計(jì)算能力高的芯片上會(huì)跑得更好,,這是異構(gòu)計(jì)算的主要驅(qū)動(dòng)力,。”
作為專用處理器廠商,,賽靈思從器件向異構(gòu)平臺(tái)的轉(zhuǎn)變也已開(kāi)始,。賽靈思大中華區(qū)核心市場(chǎng)業(yè)務(wù)發(fā)展總監(jiān)酆毅向《中國(guó)電子報(bào)》記者指出,智能駕駛正在從ADAS逐漸向全面自動(dòng)駕駛持續(xù)演進(jìn),,傳感器數(shù)量的增多勢(shì)必會(huì)帶來(lái)爆炸式的數(shù)據(jù)增長(zhǎng),,這就需要汽車具備強(qiáng)大的異構(gòu)計(jì)算平臺(tái)。在工業(yè)視覺(jué)領(lǐng)域,,機(jī)器人技術(shù),、工業(yè)PC、I/O的模塊、智能傳感器,、人機(jī)界面等都在產(chǎn)生不同類型的數(shù)據(jù),。在專業(yè)音視頻和廣播領(lǐng)域,從內(nèi)容采集到內(nèi)容消費(fèi)的全部過(guò)程也需要遠(yuǎn)程管理不同的服務(wù)器和計(jì)算平臺(tái),。
“單獨(dú)的計(jì)算架構(gòu),,無(wú)法滿足越來(lái)越多樣的開(kāi)發(fā)需求,因此,,異構(gòu)計(jì)算是未來(lái)的發(fā)展之路,。”酆毅指出,,“伴隨工藝的進(jìn)步,,F(xiàn)PGA也打破了傳統(tǒng)的應(yīng)用邊界,進(jìn)入到AI,、數(shù)據(jù)中心,、視頻處理、自動(dòng)駕駛,、5G等新興領(lǐng)域中,。而FPGA也通過(guò)集成標(biāo)量處理引擎、自適應(yīng)硬件引擎和智能引擎,,完成了從器件到異構(gòu)平臺(tái)的轉(zhuǎn)變,。”
引發(fā)芯片巨頭割據(jù)戰(zhàn)
在很長(zhǎng)一段時(shí)間里,,處理器市場(chǎng)維持著英特爾,、英偉達(dá)各自引領(lǐng)CPU和GPU的狀態(tài),且AMD在兩個(gè)市場(chǎng)均為第二,。如今,,這種局面正在被打破。通過(guò)一連串基于收購(gòu)和自研的“補(bǔ)課”行為,,三大處理器頭部廠商都在向CPU+GPU+FPGA/NPU的方向靠攏,,為異構(gòu)計(jì)算儲(chǔ)備“彈藥”。
上個(gè)月,,英特爾時(shí)隔22年重返獨(dú)顯市場(chǎng),,正式發(fā)布獨(dú)立顯卡iRIS Xe Max。眾所周知,,英特爾從2015年起,,陸續(xù)收購(gòu)了當(dāng)時(shí)第二大FPGA廠商Altera、自動(dòng)駕駛視覺(jué)處理公司Mobileye和云端AI推理芯片Habana Labs等一系列芯片廠商,,充實(shí)了FPGA和AI專用芯片的產(chǎn)品線,。獨(dú)立顯卡的發(fā)布,不僅讓英特爾彌補(bǔ)了PC產(chǎn)品線的關(guān)鍵零部件,也補(bǔ)齊了XPU異構(gòu)計(jì)算架構(gòu)的關(guān)鍵拼圖,。
AMD對(duì)賽靈思的收購(gòu),,也釋放出強(qiáng)化異構(gòu)計(jì)算布局的信號(hào)。在具備“CPU+GPU”計(jì)算架構(gòu)的基礎(chǔ)上,,F(xiàn)PGA的可編程特質(zhì),,能進(jìn)一步提升計(jì)算平臺(tái)的靈活性,從而適應(yīng)AI時(shí)代根據(jù)不同工作負(fù)載進(jìn)行加速的需求,。同時(shí),,賽靈思在異構(gòu)計(jì)算上也有所積累,已推出Versal ACAP異構(gòu)計(jì)算平臺(tái),,以縮短車載多傳感器同步和融合所帶來(lái)的系統(tǒng)整體響應(yīng)時(shí)間,。據(jù)酆毅介紹,賽靈思圍繞異構(gòu)計(jì)算的布局已在兩年前開(kāi)始,,包括智能駕駛、專業(yè)音視頻,、工業(yè)等相關(guān)領(lǐng)域,,都緊密圍繞著異構(gòu)計(jì)算的數(shù)據(jù)需求進(jìn)行開(kāi)發(fā)。
對(duì)于英偉達(dá),,收購(gòu)ARM不僅彌補(bǔ)了缺乏CPU的短板,,也將英偉達(dá)的AI計(jì)算平臺(tái)拓展到移動(dòng)生態(tài)。值得注意的是,,ARM也在異構(gòu)計(jì)算有所著墨,。基于開(kāi)源的開(kāi)發(fā)框架ARM NN,,開(kāi)發(fā)者可以調(diào)動(dòng)ARM CPU,、GPU及NPU,實(shí)現(xiàn)異構(gòu)AI開(kāi)發(fā),。據(jù)悉,,在去年舉辦的ISC 2019國(guó)際超算大會(huì)上,英偉達(dá)宣布,,計(jì)劃利用其GPU與使用ARM架構(gòu)的CPU協(xié)作打造超級(jí)計(jì)算機(jī),。在宣布對(duì)ARM的收購(gòu)計(jì)劃后,英偉達(dá)再次強(qiáng)調(diào)將建造搭載ARM CPU的AI超級(jí)計(jì)算機(jī),?!俺恪庇型蔀橛ミ_(dá)與ARM合流異構(gòu)計(jì)算的第一個(gè)“練兵場(chǎng)”。
如何應(yīng)對(duì)“跨生態(tài)”挑戰(zhàn)
“軟件優(yōu)先,?!闭劶爱悩?gòu)計(jì)算的布局思路,謝曉清向記者表示,“在設(shè)計(jì)硬件,、芯片的時(shí)候,,甚至在設(shè)計(jì)指令集的時(shí)候,我們會(huì)以軟件優(yōu)先的原則去做,?!?/p>
異構(gòu)計(jì)算帶來(lái)的硬件復(fù)雜性,對(duì)編程人員提出了嚴(yán)苛的挑戰(zhàn),。如果異構(gòu)計(jì)算包含CPU,、GPU、FPGA,、ASIC四種硬件,,就意味著編程人員必須掌握四種硬件的優(yōu)化代碼,才能編寫(xiě)或遷移程序,。屏蔽硬件復(fù)雜性的軟件平臺(tái)已經(jīng)成為異構(gòu)計(jì)算的必備工具,。
oneAPI是英特爾為異構(gòu)計(jì)算架構(gòu)打造的開(kāi)源軟件平臺(tái),使開(kāi)發(fā)者可以選擇熟悉的語(yǔ)言,、單一的代碼庫(kù)以及統(tǒng)一的編程模型,,來(lái)開(kāi)發(fā)跨架構(gòu)的應(yīng)用程序。
“我們希望生成一個(gè)軟件生態(tài),,使應(yīng)用程序開(kāi)發(fā)商基于統(tǒng)一,、開(kāi)放的規(guī)范進(jìn)行開(kāi)發(fā)工作,不會(huì)因?yàn)檐浖腃PU遷移到GPU或者是FPGA而進(jìn)行任何的修改或重復(fù)投資,?!?謝曉清說(shuō)。
英特爾不是唯一意識(shí)到異構(gòu)計(jì)算需要“軟硬兼施”的廠商,。在軟件平臺(tái)方面,,英偉達(dá)推出了CUDA,AMD推出了ROCm,,華為也陸續(xù)推出了Atlas,、CANN等面向異構(gòu)場(chǎng)景的平臺(tái)及架構(gòu)。
異構(gòu)計(jì)算的復(fù)雜性和融合性,,意味著各大廠商一開(kāi)始就從生態(tài)競(jìng)爭(zhēng)的維度進(jìn)行布局,。那么,多種生態(tài)競(jìng)爭(zhēng)并存的關(guān)系,,是否會(huì)讓開(kāi)發(fā)者在免除跨架構(gòu)開(kāi)發(fā)的麻煩后,,又陷入“跨生態(tài)”開(kāi)發(fā)的困難?
對(duì)此,謝曉清認(rèn)為,,如果各家將中間平臺(tái)統(tǒng)一起來(lái),,形成相對(duì)統(tǒng)一的框架,,可以在保持差異性的同時(shí)降低上層應(yīng)用的開(kāi)發(fā)難度。
“如果各個(gè)芯片廠商都從最底層做軟件,,重復(fù)投資會(huì)非常大,。在理想情況下,應(yīng)當(dāng)有一個(gè)框架,,在這個(gè)框架下每家做好自己的硬件優(yōu)化,。對(duì)上層應(yīng)用開(kāi)發(fā)者來(lái)說(shuō),硬件復(fù)雜性被屏蔽掉,,且編譯器,、庫(kù)函數(shù)、接口等均已定義好,,在這個(gè)統(tǒng)一的框架下再開(kāi)發(fā)編程即可,。在運(yùn)行應(yīng)用的時(shí)候,負(fù)載會(huì)自動(dòng)流向最合適的硬件,,這可能是未來(lái)異構(gòu)計(jì)算的理想情況,。”謝曉清說(shuō),。