為AI/ML芯片提供更靈活、高效的運(yùn)算核心
SiFive產(chǎn)品副總裁Chris Jones指出,,AI技術(shù)快速演進(jìn),,各種演算法與架構(gòu)推陳出新,為了最佳化PPA,,特別是在邊緣端的推論引擎,業(yè)者普遍采用hard-wire的專用硬件加速器設(shè)計(jì),。但卻因此缺乏可編程性,,無(wú)法因應(yīng)演算法的未來(lái)變化,,這是目前主要的挑戰(zhàn)之一。
「我們認(rèn)為,,邊緣端的推論引擎有龐大商機(jī),,且其工作負(fù)載主要是AI、影像處理等,,非常適合采用矢量處理,。而矢量指令集擴(kuò)充是原生RISC-V架構(gòu)的一部分,對(duì)此深具優(yōu)勢(shì),?!?/p>
有監(jiān)于此,SiFive已于2021年推出首款專為AI/ML打造的矢量運(yùn)算核心X280,,企圖提供具可編程性的另一個(gè)選擇,。然而推出后雖有成功案例,卻發(fā)現(xiàn)許多客戶仍不愿放棄自訂加速器的做法,。因此決定進(jìn)一步擴(kuò)充核心功能,,真正滿足市場(chǎng)的需求。
「我們學(xué)習(xí)到,,客戶會(huì)把X280作為神經(jīng)網(wǎng)絡(luò)加速器的協(xié)同處理器,,NN相關(guān)運(yùn)算在加速器中執(zhí)行,再把數(shù)據(jù)傳到X280做基本的矢量運(yùn)算,。由于數(shù)據(jù)的往返傳輸,,不僅造成延遲,功耗也較高,,因此我們新增了矢量協(xié)同處理器界面擴(kuò)展(VCIX)功能,,使客戶的自訂加速器能與X280直接介接,加速矢量運(yùn)算的執(zhí)行,?!?/p>
由于無(wú)需再透過(guò)匯流排傳輸界面,此做法能顯著提升自訂加速器的執(zhí)行速度,。Google已是SiFive的重要成功案例,,透過(guò)采用此架構(gòu)來(lái)加速其AI運(yùn)算。Chris Jones強(qiáng)調(diào),,對(duì)Google來(lái)說(shuō),,他們可以專注于其專精的AI演算法運(yùn)算,并運(yùn)用我們優(yōu)異的矢量指令集架構(gòu),,結(jié)合兩家公司的強(qiáng)項(xiàng),,將能為AI運(yùn)算帶來(lái)更大的突破。
此外,為了提供更高效能,,X280也新增了多核心,、多叢集功能,最多可擴(kuò)展到4叢集,、共16個(gè)核心,,使其可適用于從一般的邊緣裝置,到更高端的應(yīng)用,。
X280自2021年推出以來(lái),,已取得了兩位數(shù)的設(shè)計(jì)成功案例,「今年我們還會(huì)再繼續(xù)推出新產(chǎn)品,,例如支持更寬位元的矢量長(zhǎng)度,,并提供更高的運(yùn)算效能,以持續(xù)推動(dòng)創(chuàng)新,。對(duì)我們來(lái)說(shuō),,AI應(yīng)用未來(lái)將觸及各領(lǐng)域,而這正符合我們的矢量運(yùn)算強(qiáng)項(xiàng),。因此,,我們會(huì)把矢量處理功能帶到更多的產(chǎn)品線,做整合性的強(qiáng)化,。此外,,車用市場(chǎng)也是一大重點(diǎn),去年我們已推出車用處理器,,2023年也將推出包含矢量運(yùn)算功能的新款車用處理器,。」
新推兩款核心,,推動(dòng)RISC-V架構(gòu)進(jìn)入高端消費(fèi)市場(chǎng)
另一方面,,SiFive亦為Performance系列核心推出了兩款具備矢量運(yùn)算功能的新產(chǎn)品,分別P670與P470,。Chris Jones表示,,「P670是目前市場(chǎng)上最高效能的可授權(quán)RISC-V處理器,已獲得市場(chǎng)的熱烈反應(yīng),,證明了RISC-V核心也能夠朝高端市場(chǎng)邁進(jìn),,足以與競(jìng)爭(zhēng)對(duì)手的A77及A78核心真正的競(jìng)爭(zhēng)。而P470則是鎖定穿戴裝置,,能針對(duì)這類應(yīng)用提供最佳的效能,、面積與功率之間的平衡?!?/p>
SiFive擁有架構(gòu)上的優(yōu)勢(shì),,能夠提供更高的運(yùn)算密度,,也就是說(shuō)在單位面積內(nèi),可提供比競(jìng)爭(zhēng)對(duì)手更高效能的運(yùn)算效能,,或是以相同功率能夠提供更高的效能,,這是真正符合業(yè)界所需的。舉例來(lái)說(shuō),,就單一執(zhí)行緒效能來(lái)比較,P470的運(yùn)算密度是Cortex-A55核心的四倍,,P670則是Cortex-A78核心的兩倍,。
「雖然ARM也有矢量擴(kuò)展功能,但僅限于高端核心才有,,其他應(yīng)用則須采用NEON處理器,。我們的方案可直接取代NEON,同時(shí)我們也提供了軟件工具來(lái)協(xié)助客戶從ARM架構(gòu)轉(zhuǎn)換到RISC-V架構(gòu),。此外,,即使客戶熟悉SVE架構(gòu),我們亦能提供更具成本效益的解決方案,?!?/p>
過(guò)去,純量處理器是主流,,但隨著進(jìn)入AI應(yīng)用時(shí)代,,Chris Jones認(rèn)為,業(yè)界將需要矢量處理來(lái)支持更多的平行運(yùn)算需求,,這是未來(lái)運(yùn)算的一個(gè)重要趨勢(shì),。我們相信,亂序(OoO),、矢量的低功耗高效能運(yùn)算處理器將會(huì)有廣大的市場(chǎng),,這將為SiFive帶來(lái)絕佳的成長(zhǎng)機(jī)會(huì),使RISC-V架構(gòu)被更廣泛地采用,。