《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 電源技術(shù) > 解決方案 > 瞬變對AI加速卡供電的影響

瞬變對AI加速卡供電的影響

2023-11-06
作者:Hamed Sanogo,終端市場專家
來源:ADI
關(guān)鍵詞: ADI AI XPU 電源設(shè)計(jì)

  摘要

  圖形處理單元(GPU),、張量處理單元(TPU)和其他類型的專用集成電路(ASIC)通過提供并行處理能力來實(shí)現(xiàn)高性能計(jì)算,,以滿足加速人工智能(AI)訓(xùn)練和推理工作負(fù)載的需求,。

  AI需要大量的算力,,尤其是在學(xué)習(xí)和推理時(shí),。這種需求不斷地將供電網(wǎng)絡(luò)的邊界推向前所未有的新水平,。這些高密度工作負(fù)載變得愈加復(fù)雜,,更高的瞬態(tài)需求推動(dòng)配電網(wǎng)絡(luò)的每個(gè)部分都必須高效運(yùn)行。AI加速卡嚴(yán)格的功耗要求對系統(tǒng)性能也有影響,。本文將討論AI加速卡的配電網(wǎng)絡(luò)要求,剖析瞬變的影響,,并介紹ADI公司針對這些需求提出的多相供電解決方案,。

  簡介

  AI技術(shù)完全改變了計(jì)算架構(gòu),以復(fù)現(xiàn)模仿人腦的神經(jīng)網(wǎng)絡(luò),。AI看似已廣泛存在,,但實(shí)際上,驅(qū)動(dòng)AI的技術(shù)仍在發(fā)展,。專門用于AI計(jì)算的處理器加速器IC包括GPU,、現(xiàn)場可編程門陣列(FPGA)、TPU和其他類型的ASIC,。本文將它們統(tǒng)稱為xPU,。

  隨著AI技術(shù)部署快速推進(jìn),數(shù)據(jù)中心將繼續(xù)批量購買AI加速卡,。根據(jù)Gartner的報(bào)告,,2021年AI芯片收入總計(jì)超過340億美元,預(yù)計(jì)到2026年將增長至860億美元,。1xPU采用大規(guī)模并行計(jì)算方案,,與普通CPU相比,在AI性能方面實(shí)現(xiàn)了巨大飛躍,。xPU擁有大量小內(nèi)核,,因此非常適合AI工作負(fù)載,有助于神經(jīng)網(wǎng)絡(luò)訓(xùn)練和AI推理,。然而,,xPU進(jìn)行AI計(jì)算和移動(dòng)數(shù)據(jù)通常會產(chǎn)生相對較大的功耗。簡而言之,,xPU是非常耗電的IC,。其嚴(yán)格的功耗要求對AI加速卡提出了新的挑戰(zhàn),這也會影響系統(tǒng)性能。本文將分析AI加速卡的供電網(wǎng)絡(luò)要求,,并介紹ADI公司針對這些嚴(yán)格要求提出的多相供電解決方案,。

  AI帶來的供電挑戰(zhàn)

  AI涉及許多方面,但能效不在其中,。AI工作時(shí),,尤其是處理深度學(xué)習(xí)和推理等AI工作負(fù)載時(shí),需要極高的計(jì)算功率,。在系統(tǒng)層面,,AI加速器對于提供近乎即時(shí)的結(jié)果(正是這些結(jié)果使其有價(jià)值)發(fā)揮著關(guān)鍵作用。所有xPU都有多個(gè)高端內(nèi)核,,這些內(nèi)核由數(shù)十億個(gè)晶體管構(gòu)成,,消耗數(shù)百安培電流。這些xPU的內(nèi)核電壓(VCORE)已降至低于1.0 V的水平,。圖1顯示了AI加速卡的通用框圖,。本文將重點(diǎn)介紹為此類系統(tǒng)提出的多相控制器和相應(yīng)的功率級IC。

42.JPG

  圖1.通用AI加速卡框圖

  AI加速卡所需的峰值電流密度對于任何主板來說都是非常沉重的負(fù)擔(dān),,難以處理,。工作負(fù)載的高度動(dòng)態(tài)特性和極高的電流瞬變會導(dǎo)致非常高的di/dt和持續(xù)數(shù)微秒的尖峰電壓瞬變,這些瞬變非常具有破壞性,,可能對xPU造成損害,。AI的平均工作負(fù)載會持續(xù)很長時(shí)間,解耦電容將無法始終提供滿足即時(shí)需求的能量,。本文的下一部分將介紹ADI公司提出的多相負(fù)載點(diǎn)(PoL)解決方案,,它會消除典型AI加速器的瞬變,避免給整個(gè)配電網(wǎng)絡(luò)產(chǎn)生壓力,。但首先,,我們來討論AI帶來的電源設(shè)計(jì)挑戰(zhàn)。

  AI帶來新的電源設(shè)計(jì)挑戰(zhàn)

  目前,,AI功率需求遠(yuǎn)遠(yuǎn)超過傳統(tǒng)供電網(wǎng)絡(luò)的能力,。xPU穩(wěn)壓器(VR)的要求與標(biāo)準(zhǔn)PoL穩(wěn)壓器有很大不同。業(yè)界發(fā)現(xiàn),,某些應(yīng)用要求在小于1 V的電壓下為xPU提供超過1000 A的電流,。重要的是,電源必須非常穩(wěn)定,,產(chǎn)生的噪聲非常小,,同時(shí)消除所有電壓瞬變可能性,以免導(dǎo)致xPU內(nèi)部誤觸發(fā),。為了應(yīng)對驚人的電流需求,,高性能AI加速器VR PoL的設(shè)計(jì)必須滿足某些關(guān)鍵要求,。

  電壓尖峰和瞬變管理

  AI加速卡的關(guān)鍵要求之一是VR的架構(gòu)應(yīng)能提供出色的瞬變電壓管理。向任何系統(tǒng)提供千瓦級功率始終是首要挑戰(zhàn),。輸出電壓(包括容差,、紋波以及負(fù)載瞬態(tài)驟降和峰值)必須始終高于xPU最小電壓以避免系統(tǒng)掛起,并且還必須始終低于xPU最大電壓以免損壞xPU,。加速卡的瞬態(tài)功率尖峰可能要求達(dá)到最大熱功率目標(biāo)的2倍甚至更高,。

  這里重要的是,PoL環(huán)路帶寬須足夠靈活,,以處理所遇到的各類更快速瞬變,。帶寬越高,環(huán)路響應(yīng)越快,,電壓偏差越小,。實(shí)現(xiàn)快速瞬態(tài)電源軌較直接的一種方法是選擇具有快速瞬態(tài)性能的穩(wěn)壓器。ADI AI VCORE系列IC具有非常低的頻率輸出噪聲,、快速瞬態(tài)響應(yīng)和高效率等特性,。除此之外,ADI AI電源芯片組還支持負(fù)載線路,,有助于電源設(shè)計(jì)人員有效管理AI工作負(fù)載引起的瞬變和尖峰。

  長電源路徑走線中的I2R損耗和熱管理

  隨著AI xPU處理器電流不斷提高,,PoL供電解決方案的密度已成為關(guān)鍵要素,。既要可靠地向xPU的每個(gè)部分供電,同時(shí)不用擔(dān)心散發(fā)的熱量會影響芯片的可靠性并導(dǎo)致熱失控,,現(xiàn)在變得極其困難,。換言之,熱管理是設(shè)計(jì)這種高功率電源所面臨的重大挑戰(zhàn)之一,。傳統(tǒng)的供電方法是將穩(wěn)壓器放置在xPU的一側(cè),,以便將電力橫向傳輸?shù)教幚砥鳌_@些走線的電阻哪怕再小,,也可能引起不可接受的電壓(I2R)下降,。PCB電源層電阻上的壓降會隨著xPU電流提高而成比例地增加。這意味著VR和BGA引腳之間幾厘米的PCB電源走線會產(chǎn)生大量的損耗,。PCB銅電源層中的此類損耗已成為計(jì)算穩(wěn)壓器設(shè)計(jì)效率和性能的主導(dǎo)因素,。傳統(tǒng)3芯片(分立式)供電解決方案需要大量高電流走線,與之相比,,使用集成了電流和溫度電路模塊的單芯片功率級IC,,可以大大減少PCB上的走線數(shù)量。

  ADI價(jià)值主張:MAX16602 + MAX20790 + 耦合電感

  AI穩(wěn)壓器的精度變得更加嚴(yán)格,。效率和尺寸是重中之重,。性能和功耗也受到嚴(yán)格審查,。正如上一節(jié)所述,解決AI加速卡VR設(shè)計(jì)問題已成為一項(xiàng)艱巨的任務(wù),。設(shè)計(jì)人員非常清楚,,若不能有效處理不必要的瞬態(tài)效應(yīng),就無法在所需電流中產(chǎn)生大的階躍,。解決這些瞬態(tài)效應(yīng)還需要某種類型的高精度動(dòng)態(tài)電壓定位或負(fù)載線路方案,。ADI公司大力投資AI市場,為48 V和12 V系統(tǒng)提供全套解決方案,。本節(jié)介紹ADI AI多相電源芯片組,,即MAX16602 多相控制器和MAX20790 功率級,以及我們獲得專利的耦合電感(CL)技術(shù),,以幫助解決這些AI PoL設(shè)計(jì)挑戰(zhàn),。圖2顯示了8相MAX16602CL8_EV 設(shè)計(jì)的MAX16602、MAX20790和CL簡化框圖連接,。這種相對簡潔的設(shè)計(jì)實(shí)現(xiàn)了每相約88 APK的高電流傳輸能力,。內(nèi)部補(bǔ)償和先進(jìn)的控制算法,加上功率級中集成的電流檢測電路以及耦合電感,,使其成為擁有出色效率的小尺寸解決方案,。

43.JPG

  圖2.采用ADI高集成度電源芯片組的8相VR設(shè)計(jì)有助于實(shí)現(xiàn)高密度設(shè)計(jì),同時(shí)減少外部連接

  更高集成度的單芯片智能功率級IC

  MAX20790是一款功能豐富的智能功率級IC,,旨在與MAX16602(以及該產(chǎn)品系列中的其他幾款A(yù)DI控制器)配合使用,,以實(shí)現(xiàn)高密度多相穩(wěn)壓器。這是一種單芯片集成,,幾乎消除了分立式設(shè)計(jì)中常見的FET和驅(qū)動(dòng)器之間的寄生電阻和電感,,從而實(shí)現(xiàn)高開關(guān)速度,而且功率損耗明顯低于傳統(tǒng)方案,。如果檢測到開關(guān)節(jié)點(diǎn)(VX)故障,,功率級會立即關(guān)閉,并將故障ID傳送給控制器,。該智能功率級IC還有一個(gè)片內(nèi)電流傳感器,。此電流檢測電路模塊顯然優(yōu)于使用電感直流電阻的方法。眾所周知,,DCR檢測不準(zhǔn)確,,需要溫度補(bǔ)償才能使電流測量結(jié)果可信。

  控制器IC

  MAX16602是一款用于xPU VCORE VR的多相控制器,。該IC提供高密度,、靈活且可擴(kuò)展的解決方案,可為AI xPU供電,。該器件支持脈沖寬度調(diào)制(PWM)并聯(lián),,可控制多達(dá)16個(gè)相位,。該IC的架構(gòu)簡化了設(shè)計(jì),減少了組件數(shù)量,,支持高級電源管理和遙測功能,,并在整個(gè)負(fù)載范圍內(nèi)提高了節(jié)能效果。它實(shí)現(xiàn)了自主切相,,在整個(gè)負(fù)載范圍內(nèi)保持高效率,。完整芯片組是一個(gè)高效率多相降壓轉(zhuǎn)換器,具有廣泛的狀態(tài)和參數(shù)測量特性,。保護(hù)和關(guān)斷參數(shù)通過串行PMBus?接口進(jìn)行設(shè)置和監(jiān)測,,甚至包括功率級IC中收集的故障。

  以下是該ADI控制器支持的其他幾個(gè)關(guān)鍵特性,,這些特性對于任何AI供電方案都很重要,。

  高級調(diào)制方案

  MAX16602利用高級調(diào)制方案(AMS)來提供更好的瞬態(tài)響應(yīng)。該調(diào)制方案支持以極短的延遲開啟和關(guān)閉相位,。根據(jù)負(fù)載需求,,當(dāng)負(fù)載增加時(shí),可以同時(shí)開啟多個(gè)相位,;當(dāng)負(fù)載釋放時(shí),,可以立即關(guān)閉多個(gè)相位。啟用AMS后,,系統(tǒng)閉環(huán)帶寬可以擴(kuò)展,,而不會造成相位裕量損失。因此,,PoL能夠更好地響應(yīng)AI VR的即時(shí)和動(dòng)態(tài)電流需求。

  負(fù)載線路控制

  負(fù)載線路允許VCORE根據(jù)輸出電流在最小值和最大值之間變換,。它實(shí)質(zhì)上是為輕負(fù)載設(shè)置高VCORE值,,為重負(fù)載設(shè)置低值。主要是為了讓控制環(huán)路可以處理更高的負(fù)載電流(這是讓計(jì)算順利進(jìn)行所必需的),。ADI控制器在整個(gè)輸出電流范圍內(nèi)提供準(zhǔn)確的輸出負(fù)載線路控制,。輸出電壓定位利用來自功率級IC的無損電流檢測信號進(jìn)行,這些信號會反饋到控制器,。負(fù)載線路是在控制器中通過對電壓控制環(huán)路誤差放大器的直流增益進(jìn)行數(shù)字編程來設(shè)置,。控制器的EC表和數(shù)據(jù)手冊的表6中提供了各種直流負(fù)載線路特性,,從0.105 mΩ到0.979 mΩ,。圖3顯示了16相PoL設(shè)計(jì)在40 A至360 A負(fù)載階躍和800 A/μs擺率下的瞬態(tài)曲線。結(jié)果表明過沖極小,。

  總而言之,,ADI的多相功率轉(zhuǎn)換和PoL產(chǎn)品提供高效率和高功率密度,。圖5顯示了我們的16相MAX16602 + MAX20790 + CLH1110-4評估板的效率曲線以及偏置和電感損耗。ADI公司為各種AI加速器應(yīng)用提供穩(wěn)壓器和其他電源轉(zhuǎn)換解決方案,。采用我們的多相控制器和集成功率級解決方案,,有助于ADI客戶滿足嚴(yán)苛的動(dòng)態(tài)xPU電源要求,應(yīng)對當(dāng)今AI應(yīng)用帶來的設(shè)計(jì)挑戰(zhàn),。

44.JPG

  圖3.16相VR在40 A至360 A階躍負(fù)載和800 A/μs擺率下的瞬態(tài)曲線

  設(shè)計(jì)中添加有源電壓定位可以降低對負(fù)載瞬態(tài)響應(yīng)的要求,,并更好地利用xPU總?cè)莶畲翱凇X?fù)載線路控制有助于降低給定階躍負(fù)載的峰峰值輸出電壓偏差,,同時(shí)可以減少輸出軌上的bulk電容量,。總電壓波動(dòng)將會減小,,從而降低xPU崩潰或損壞的風(fēng)險(xiǎn),。請注意,MAX16602中的負(fù)載線路電路模塊可以禁用,。

  耦合電感(CL)的優(yōu)勢

  十多年來,,ADI公司一直投資開發(fā)其專利CL技術(shù)。這項(xiàng)技術(shù)支持實(shí)現(xiàn)更高的密度,、更大的帶寬,、更快的瞬變解決方案,與分立式實(shí)現(xiàn)方案相比,,效率提高50%,,磁性元件尺寸縮小1.82倍。CL能夠有效地在穩(wěn)態(tài)中用作大電感,,在瞬態(tài)中用作小電感,,除了減小電感尺寸外,還能節(jié)省COUT,。2圖4顯示了ADI多相VR設(shè)計(jì)中常用的耦合電感系列,。

45.JPG

  圖4.ADI多相VR設(shè)計(jì)常用的耦合電感系列

  根據(jù)設(shè)計(jì)規(guī)格和優(yōu)先級,耦合電感消除電流紋波的優(yōu)勢可用來換取更小的尺寸或更高的效率,。1較大的系統(tǒng)優(yōu)勢以及ADI產(chǎn)品的與眾不同之處在于,,AI PoL設(shè)計(jì)人員可以使用CL相對輕松地實(shí)現(xiàn)VR總尺寸較小的解決方案。幾家知名磁性器件供應(yīng)商擁有ADI的免費(fèi)CL許可,,可以為我們提供所需的元件,。

  頂部散熱封裝

  頂部散熱為表面貼裝封裝提供了另一種散熱途徑。MAX16602和MAX20790都是倒裝芯片四方扁平無引線(FCQFN)封裝,,帶裸露的頂部散熱焊盤,。FCQFN是一種先進(jìn)的封裝,可提供設(shè)計(jì)人員青睞的出色熱性能,。這種無引線封裝不僅可以減少寄生電感,,還能從器件的結(jié)直接向周圍環(huán)境散熱,。MAX20790的結(jié)殼頂部(θJC-TOP)熱阻為0.25°C/W。AI電源設(shè)計(jì)利用頂端散熱配置,,可以提高系統(tǒng)的熱性能和設(shè)計(jì)靈活性,。

46.JPG

  圖5.16相AI VR評估板設(shè)計(jì)的效率曲線

  垂直供電

  隨著處理復(fù)雜AI功能的xPU問世,功耗隨之急劇增加,。具有高達(dá)650 A連續(xù)電流和超過1000 A峰值電流傳輸能力的VR開始普及,。為AI處理器供電的挑戰(zhàn)在于保持高效率。常規(guī)電源架構(gòu)無法跟上這些非常耗電的AI xPU的步伐,。VR芯片制造商和架構(gòu)師正在從根本上研究不同的供電方法,。業(yè)界正在討論一種為AI xPU供電的新趨勢,稱為垂直供電,,也稱為背面供電,。

  VR必須盡可能靠近負(fù)載輸入xPU電源引腳,以實(shí)現(xiàn)高電流輸送,。我們無法通過傳統(tǒng)的橫向供電方法實(shí)現(xiàn)這一目標(biāo),。垂直供電將電源調(diào)節(jié)器移到處理器正下方,從而消除了PCB上可能產(chǎn)生的所有損耗,。該結(jié)構(gòu)將電源轉(zhuǎn)換器,、功率級、電容和磁性元件放置在PCB的背面,,并通過過孔垂直地向xPU供電,。換言之,電流傳輸是從xPU BGA陣列下方垂直進(jìn)行,。這是一條長度縮短的垂直路徑,,可顯著降低阻抗并消除損耗。圖6顯示了安裝在PCB另一側(cè),、xPU下方的垂直供電模塊架構(gòu),。此示意圖僅用于說明。ADI公司擁有廣泛的AI xPU VCORE解決方案系列,,用于解決當(dāng)今的這些問題,。我們的電源解決方案能夠以非常小的外形尺寸實(shí)現(xiàn)出色的效率,。本文介紹的解決方案將多相控制器MAX16602和智能單芯片功率級MAX20790相結(jié)合,,可提供非常高的電源轉(zhuǎn)換效率、非??斓乃矐B(tài)響應(yīng)和非常準(zhǔn)確的遙測報(bào)告,。

  參考文獻(xiàn)

1 “Forecast: AI Semiconductors, Worldwide, 2021-2027.” Gartner, April 2023.

1“預(yù)測:2021-2027全球AI半導(dǎo)體?!盙artner,,2023年4月,。

2 “Utilizing the Benefits of Coupled Inductors.” Analog Devices, Inc.

2“利用耦合電感的優(yōu)勢?!盇DI公司,。

47.JPG

  圖6.垂直供電模塊架構(gòu)(僅用于說明目的)

  構(gòu)建垂直供電解決方案的難點(diǎn)包括解決模塊的重量和安裝問題。PCB另一側(cè)的xPU下方比較適合放置高頻解耦電容,,用于儲存能量以滿足瞬時(shí)能量需求,。垂直供電與ADI的CL技術(shù)相結(jié)合,可實(shí)現(xiàn)更高的電流密度,、功率密度和更快的瞬態(tài)性能,。垂直供電為ADI等PoL制造商提供了新的創(chuàng)新機(jī)會,并以自己的方式繼續(xù)支持摩爾定律的發(fā)展,。

  結(jié)語

  支持機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的加速卡通過提供加速訓(xùn)練和推理工作負(fù)載所需的并行處理能力,,將AI從理論變?yōu)楝F(xiàn)實(shí)。為高性能AI加速卡設(shè)計(jì)VR PoL是一項(xiàng)復(fù)雜的任務(wù),,尤其是在當(dāng)前先進(jìn)xPU的電源要求(表現(xiàn)在電流水平和電壓精度方面)不斷提高的情況下,。

  本文表明,xPU VR的要求與標(biāo)準(zhǔn)PoL調(diào)節(jié)器有很大不同,。xPU供電軌具有極快的負(fù)載變化,,需要?jiǎng)討B(tài)電壓定位或負(fù)載線路,并且必須很小,。



更多精彩內(nèi)容歡迎點(diǎn)擊==>>電子技術(shù)應(yīng)用-AET<<

mmexport1621241704608.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn),。轉(zhuǎn)載的所有的文章,、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者,。如涉及作品內(nèi)容、版權(quán)和其它問題,,請及時(shí)通過電子郵件或電話通知我們,,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失,。聯(lián)系電話:010-82306118,;郵箱:[email protected]