在第 56 屆 IEEE / ACM 微體系結(jié)構(gòu)國(guó)際研討會(huì)上,,美國(guó)加州大學(xué)河濱分校(UCR)的研究人員展示了一種全新的方法,,可以實(shí)現(xiàn)計(jì)算速度翻番,、能耗減半的效果,。
研究人員表示這項(xiàng)技術(shù)理論上適用于從智能手機(jī)到數(shù)據(jù)中心服務(wù)器的任何處理器和加速器,,但需要進(jìn)一步地開發(fā)適配。
加利福尼亞大學(xué)電氣與計(jì)算機(jī)工程系副教授,、本研究報(bào)告的共同作者曾宏偉(Hung-Wei Tseng)表示:
你不需要增加新的處理器,,可以在現(xiàn)有計(jì)算機(jī)平臺(tái)上部署。這項(xiàng)技術(shù)的核心,,是幫助你更合理高效地管理可用硬件資源,。
研究人員開發(fā)的平臺(tái)打破了傳統(tǒng)的編程模式,團(tuán)隊(duì)將其稱為同步異構(gòu)多線程(SHMT),。傳統(tǒng)編程模式是在一段時(shí)間內(nèi),,只向系統(tǒng)的一個(gè)計(jì)算組件(中央處理器、圖形處理器,、張量處理器或其他處理器或加速器)提供數(shù)據(jù),,而 SHMT 技術(shù)在所有組件之間同時(shí)并行執(zhí)行代碼。
傳統(tǒng),、現(xiàn)代異構(gòu)和 SHMT 的并行化方法比較
SHMT 采用質(zhì)量感知工作偷?。≦AWS)調(diào)度策略,保持平衡控制計(jì)算質(zhì)量和工作負(fù)載,,因此降低了資源調(diào)用,。
SHMT runtime 系統(tǒng)將創(chuàng)建一組虛擬操作(vOPS),并劃分為一個(gè)或多個(gè)高級(jí)操作(HLOP),以便同時(shí)使用多個(gè)硬件資源,。
根據(jù)所選政策加速 SHMT 計(jì)算
傳統(tǒng)計(jì)算與 SHMT 的活動(dòng)和閑置消耗比較
SHMT runtime 系統(tǒng)將 HLOPS 分配到任務(wù)隊(duì)列,,在目標(biāo)硬件上運(yùn)行。由于 HLOPS 與硬件無關(guān),,runtime 系統(tǒng)可根據(jù)需要將任務(wù)重定向到計(jì)算平臺(tái)的一個(gè)或另一個(gè)組件,。
研究人員以他們創(chuàng)建的測(cè)試平臺(tái)為例,展示了新軟件庫(kù)的有效性,。他們創(chuàng)造了一種混合體,,既可以被視為智能手機(jī),也可以被視為一種個(gè)人電腦,,甚至是服務(wù)器,。
該測(cè)試平臺(tái)基于一塊帶有 PCIe 接口的背板,,一臺(tái)搭載英偉達(dá) Nano Jetson 模塊組的“計(jì)算單元”,,通過 M.2 Key E 插槽連接谷歌 Edge 加速器(TPU)。該模塊帶有四核 ARM Cortex-A57 處理器(CPU)和 128 個(gè) Maxwell 架構(gòu)圖形內(nèi)核(GPU),。
本系統(tǒng)的主內(nèi)存為 4 GB LPDDR4,,頻率為 1600 MHz,速度為 25.6 Gbps,,用于存儲(chǔ)一般數(shù)據(jù),。Edge TPU 模塊額外包含 8 MB 內(nèi)存,并使用 Ubuntu Linux 18.04 作為操作系統(tǒng),。
在一個(gè)使用標(biāo)準(zhǔn)測(cè)試應(yīng)用程序的簡(jiǎn)易異構(gòu)平臺(tái)上運(yùn)行 SHMT 軟件包的結(jié)果表明,,與基本計(jì)算分配方法相比,采用最有效策略的 QAWS 框架的計(jì)算速度提高了 1.95 倍,,消耗顯著降低了 51%,。
這種方法如果應(yīng)用于數(shù)據(jù)中心,可以在保持現(xiàn)有硬件不變的情況下,,最大化性能收益,。目前,所提出的解決方案尚未準(zhǔn)備好付諸實(shí)施,,但肯定會(huì)有很多人對(duì)此感興趣,。