《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > EDA與制造 > 設(shè)計(jì)應(yīng)用 > 一種基于電壓島的DVFS控制算法
一種基于電壓島的DVFS控制算法
來(lái)源:電子技術(shù)應(yīng)用2012年第8期
劉 斌1, 張興明1, 閆佳佳2
1. 國(guó)家數(shù)字交換系統(tǒng)工程技術(shù)研究中心, 河南 鄭州 450002; 2. 鄭州大學(xué) 信息工程學(xué)院, 河南 鄭州450000
摘要: 提出一種基于島間隊(duì)列特征的動(dòng)態(tài)電壓頻率縮放控制算法,使用島間隊(duì)列增長(zhǎng)率和使用率來(lái)實(shí)現(xiàn)電壓島工作電壓/頻率的動(dòng)態(tài)控制,。該算法引入島間隊(duì)列增長(zhǎng)率實(shí)現(xiàn)了簡(jiǎn)單高效的負(fù)載預(yù)測(cè),提高了片上通信穩(wěn)定性。仿真分析表明,該算法能夠更好地節(jié)能降耗,。
中圖分類號(hào): TP301.6
文獻(xiàn)標(biāo)識(shí)碼: A
文章編號(hào): 0258-7998(2012)08-0122-04
DVFS control algorithm based on voltage/frequency islands
Liu Bin1, Zhang Xingming1, Yan Jiajia2
1. National Digital Switching System Engineering & Technological R&D Center, Zhengzhou 450002, China; 2. Information Engineering Department of Zhengzhou University, Zhengzhou 450000, China
Abstract: This paper proposed a DVFS control algorithm based on inter-island queue, using queue growth and utilization of inter-island to achieve the voltage and frequency control. Queue utilization rate is introduced to achieve simple and efficient workload forecast, the stability of the control algorithm is improved. The experimental result shows that: the algorithm proposed has a better power consumption performance.
Key words : NoC; voltage/frequently island; DVFS; energy effective; inter-island queue

    基于電壓島動(dòng)態(tài)電壓頻率縮放DVFS(Dynamic Voltage and Frequency Scaling)技術(shù)能夠大幅度地降低片上網(wǎng)絡(luò)NoC(Network on Chip)的能耗,從而受到廣泛關(guān)注[1]。在基于電壓島的NoC上,,電壓和頻率的改變以整個(gè)電壓島為單位,,DVFS設(shè)計(jì)需要全面考慮電壓島內(nèi)所有的IP核。與針對(duì)單個(gè)IP核的DVFS控制算法相比,基于電壓島的DVFS控制算法需要考慮的因素更多,,設(shè)計(jì)也更為復(fù)雜,。

    目前,針對(duì)基于電壓島的DVFS控制算法的研究并不多。為了應(yīng)對(duì)工作負(fù)載的快速變化,,參考文獻(xiàn)[2]提出一種基于全局電壓島輸入隊(duì)列使用率的反饋控制算法,。該算法使用反饋控制,較好地應(yīng)對(duì)了工作負(fù)載的變化,。而參考文獻(xiàn)[3]指出參考文獻(xiàn)[2]的控制算法邏輯資源消耗過(guò)高,,缺乏全局控制,在參考文獻(xiàn)[2]的基礎(chǔ)上提出CF-g反饋控制算法,,該算法利用片上的g個(gè)輸入隊(duì)列,實(shí)現(xiàn)了電壓島簡(jiǎn)單,、高效的工作電壓控制,達(dá)到了資源和效率的平衡,,但是該算法并沒(méi)有大幅度降低片上邏輯資源的開(kāi)銷,。同時(shí),參考文獻(xiàn)[2]和參考文獻(xiàn)[3]的算法存在的共同問(wèn)題是只能控制電壓島的一個(gè)輸入隊(duì)列,,導(dǎo)致整個(gè)系統(tǒng)的穩(wěn)定性較差,。
    針對(duì)上述問(wèn)題,,本文依據(jù)參考文獻(xiàn)[4]提出的輸入隊(duì)列包到達(dá)模型提出一種基于島間隊(duì)列特征的DVFS控制算法。該算法使用電壓島的所有輸入/輸出隊(duì)列參與電壓島的電壓/頻率控制,,提高了片上通信的穩(wěn)定性,,引入島間隊(duì)列使用率和增長(zhǎng)率進(jìn)行負(fù)載預(yù)測(cè),提高了算法的效率,。
1 算法設(shè)計(jì)
1.1 電壓島間隊(duì)列使用率的數(shù)學(xué)模型

    在基于電壓島的NoC上,,電壓島間的每個(gè)鏈路兩端各有一個(gè)緩存隊(duì)列,如圖1所示,,可將這種緩存隊(duì)列簡(jiǎn)稱為島間隊(duì)列[4],。電壓島VFI1是隊(duì)列q的輸入電壓島,電壓島VFI2是隊(duì)列q的輸出電壓島;相應(yīng)地,,隊(duì)列q是電壓島VFI1的輸出隊(duì)列,,也是電壓島VFI2的輸入隊(duì)列。設(shè)隊(duì)列q的平均包到達(dá)速率為f1λ,,包服務(wù)速率為f2 μ,f1和f2是第k個(gè)控制周期內(nèi)(即[(k-1)T,,kT))兩個(gè)電壓島的頻率,,隊(duì)列q的使用率q(k)∈[0,1]可表示為:
  

    島間隊(duì)列增長(zhǎng)率直接指示了當(dāng)前隊(duì)列使用率的變化:當(dāng)p(k)>0時(shí),增長(zhǎng)率為正,,這時(shí)使用率q(k)增加,,即隊(duì)列中待處理的數(shù)據(jù)包增加;當(dāng)p(k)<0時(shí),,使用率負(fù)增長(zhǎng),,此時(shí)的使用率減小,即隊(duì)列中待處理的數(shù)據(jù)包減少,;當(dāng)p(k)=0時(shí),,表示當(dāng)前隊(duì)列使用率不變,該隊(duì)列處于平衡狀態(tài),。
1.2 算法思想描述
    本文將電壓島的頻率和電壓劃分為幾個(gè)離散的等級(jí),,每次調(diào)整將增加或者降低一個(gè)等級(jí)。為了實(shí)現(xiàn)對(duì)工作負(fù)載的預(yù)測(cè),,引入島間隊(duì)列增長(zhǎng)率,。另外,島間隊(duì)列使用率準(zhǔn)確描述了當(dāng)前隊(duì)列的使用情況,,指示了當(dāng)前的片上通信狀況,。本算法綜合兩者的信息得到當(dāng)前島間隊(duì)列對(duì)電壓島的頻率需求(升頻、降頻),。
    針對(duì)當(dāng)前的控制算法無(wú)法達(dá)到控制所有島間隊(duì)列的問(wèn)題,,通過(guò)全面考慮電壓島的輸入,、輸出隊(duì)列對(duì)電壓島工作頻率的需求,綜合全局信息來(lái)配置電壓島的電壓和頻率,。在保證通信穩(wěn)定的前提下盡量降低能耗,,對(duì)于增頻請(qǐng)求和降頻請(qǐng)求,依據(jù)保證系統(tǒng)通信穩(wěn)定的原則,,優(yōu)先處理增頻請(qǐng)求,。
    本算法采用全局控制方式,整體結(jié)構(gòu)如圖2所示,。設(shè)控制周期為T,,在第k個(gè)控制周期開(kāi)始時(shí),對(duì)各個(gè)電壓島的頻率和島間隊(duì)列的使用率進(jìn)行采樣,;然后將采樣信息輸入全局電壓/頻率控制模塊進(jìn)行運(yùn)算,得到當(dāng)前的島間隊(duì)列增長(zhǎng)率,;之后,由全局電壓/頻率控制模塊依據(jù)DVFS控制算法得出各個(gè)電壓島在下個(gè)周期的電壓和頻率,;最后,,由電壓/頻率生成模塊對(duì)電壓和頻率進(jìn)行轉(zhuǎn)換,電壓和頻率轉(zhuǎn)換完成后,,進(jìn)入第k+1個(gè)周期,。

    電壓島的電壓和頻率采用離散值,算法每次將電壓島的工作頻率升高或者降低一個(gè)等級(jí),。
1.3 使用島間隊(duì)列的DVFS控制算法原理
    對(duì)于由J個(gè)電壓島組成的NoC,,假設(shè)電壓島i有m個(gè)輸入/輸出隊(duì)列。本算法根據(jù)電壓島的輸入/輸出隊(duì)列的使用率q(k)和增長(zhǎng)率p(k)來(lái)控制電壓島的工作電壓,以實(shí)現(xiàn)DVFS控制,??紤]到輸入/輸出隊(duì)列對(duì)電壓島工作頻率的不同需求,將兩者分開(kāi)考慮,,其對(duì)應(yīng)的控制請(qǐng)求可分為輸入隊(duì)列請(qǐng)求和輸出隊(duì)列請(qǐng)求,。
    本算法通過(guò)綜合q(k)和p(k)的信息控制電壓島的頻率,使p(k)在區(qū)間[0,,1)之內(nèi)變化,。其原理如下:
  在圖 1中,對(duì)于隊(duì)列q,,當(dāng)p(k)>0時(shí),,若保持電壓島VFI1的頻率f1和電壓島VFI2的頻率f2不變,則隊(duì)列的使用率q(k)會(huì)持續(xù)增加。這種情況下,,當(dāng)q(k)較小時(shí),,無(wú)需考慮降低頻率f2或者增加頻率f1;當(dāng)q(k)較大時(shí),,為避免隊(duì)列擁塞(即防止q(k)=1),,為其設(shè)置門限值ThH,, 當(dāng)q(k)到達(dá)門限值ThH時(shí),可以降低輸入電壓島的頻率f1或者增加輸出電壓島的頻率f2,;當(dāng)使用率q(k)很小時(shí),,若降低隊(duì)列的輸出電壓島頻率f2,則增長(zhǎng)率p(k)>0變大,,加快了q(k)增加的速率,。為了解決此時(shí)能否降低f2的問(wèn)題,設(shè)置了q(k)的可降頻門限ThD,。當(dāng)p(k)>0,,q(k)<ThD時(shí),可以降低隊(duì)列的輸出電壓島的頻率;當(dāng)增長(zhǎng)率p(k)>0時(shí),,如果隊(duì)列的輸入電壓島的頻率f1將在下一個(gè)控制周期被提高,,按照式(2)推斷增長(zhǎng)率p(k)會(huì)變大,此時(shí)有必要降低輸出電壓島的頻率f2的門限,,令這個(gè)門限值為ThI,本文稱之為輸出電壓島從動(dòng)升頻門限,。
    當(dāng)p(k)<0時(shí),若保持f1和f2不變,,隊(duì)列的使用率q(k)會(huì)持續(xù)減小,,此時(shí)不必考慮q(k)過(guò)高而導(dǎo)致隊(duì)列擁塞;當(dāng)使用率q(k)過(guò)低時(shí),,可以增加輸入電壓島的頻率f1或者降低輸出電壓島的頻率f2。為了降低能耗,,本算法不主動(dòng)增加輸入電壓島的頻率,, 這時(shí)設(shè)置隊(duì)列使用率q(k)的門限ThL,當(dāng)q(k)到達(dá)此門限值時(shí),,降低輸出電壓島的頻率,;若輸出電壓島的頻率f2降低,則增長(zhǎng)率變大,,使用率有可能會(huì)增加,,此時(shí),若q(k)&isin;[ThH,1],,則不能降低輸出電壓島的頻率f2,;若q(k)&isin;[ThL,ThH),則可以降低輸出電壓島頻率f2,。
    當(dāng)p(k)=0時(shí),,隊(duì)列的輸入輸出達(dá)到平衡,隊(duì)列對(duì)電壓島的頻率沒(méi)有升降請(qǐng)求,。
    本算法的控制方法如表1,、表2所示,。

 

 

    從圖3可以看出,本算法的總能耗和CF-g算法相近,。在五種應(yīng)用中,,相比于NOP,CF-g算法平均降低了16.19%的總能耗,,本文算法平均降低了19.85%的總能耗,。本文算法沒(méi)有獲得較大的能耗降低空間,這是由于算法采用了全局控制機(jī)制,,增加了可控的島間隊(duì)列的數(shù)量,,犧牲了一定的能耗降低空間。從圖4的EDP對(duì)比中可以看出,,本文算法的能耗性能大大提升,,相比于NOP,本算法獲得了21.82%的性能提高,。相比于CF算法,,本文算法也有6.14%的性能提高。

    本文提出了一種使用島間隊(duì)列的DVFS控制算法,,利用島間隊(duì)列增長(zhǎng)率和使用率兩個(gè)參數(shù)來(lái)控制電壓島的電壓/頻率變化,。仿真結(jié)果表明,本算法保障了片上通信的穩(wěn)定性,,明顯提高了系統(tǒng)吞吐量,。
參考文獻(xiàn)
[1] Liang Guang, LILJEBERG P, NIGUSSIE E, et al. A review of dynamic power management methods in NoC under emerging design considerations[C]. In:Norchip Conference, 2009. Trondheim, 2009.
[2] OGRARS U Y, MARCULESCU R, MARCULESCU D. Variation-adaptive feedback control for networks-on-chip  with multiple clock domains[C]. New York : Proceedings of  the 45th annual Design Automation Conference,2008:614-619.
[3] GARG S, MARCULESCU D,MARCULESCU R. Custom feedback control:enabling truly scalable on-chip power management for MPSoCs[C]. Austin: Low-Power Electronics  and Design, 2010 ACM/IEEE International Symposium on, 2010:425-430
[4] JUANG P, Wu Qian. Coordinated, distributed, formal energy management of chip multiprocessors[C].Princeton Univ:  Low Power Electronics and Design,2005.Proceedings of the  2005 International Symposium on, 2005:127-130.
[5] DICK R. Embedded system synthesis benchmarks suites(E3S)[EB/OL](2011.12.14).http://www.ece.northwestern.edu.
[6] ERIK B, VAN D T, JASPERS E G T Jaspers. Mapping of MPEG-4 decoding on flexible architecture platform[A]. In: SPIE Conference on Visualization and Data Analysis[C]. San Jose, CA, USA: IEEE, 2002: 1-13.
[7] HOWARD J, DIGHE S, SRIRAM R,et al.A 48-Core IA-32 processor in 45 nm CMOS using on-die messagepassing and DVFS for performance and power scaling[J]. IEEE Journal of Solid-State Circuits, 2011,46(1):173-183.
[8] RAHIMI A, SALEHI M E. MOHAMMADI S, et al. Dynamic voltage scaling for fully asynchronous NoCs using FIFO threshold levels[C]. Tehran: Computer Architecture and Digital Systems,2010 15th CSI International Symposium on, 2010:43-48.

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載,。