《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 測(cè)試測(cè)量 > 設(shè)計(jì)應(yīng)用 > 利用時(shí)鐘裕度技術(shù)早期故障預(yù)測(cè)
利用時(shí)鐘裕度技術(shù)早期故障預(yù)測(cè)
摘要: 計(jì)算機(jī)領(lǐng)域的超頻技術(shù)已存在多年,,其目的就是有意識(shí)地讓系統(tǒng)超越工作極限,,實(shí)現(xiàn)最大性能,,但這通常會(huì)減少設(shè)備的使用壽命且難以保證系統(tǒng)的穩(wěn)定性,。許多系統(tǒng)設(shè)計(jì)人員都認(rèn)為超頻技術(shù)除了影響系統(tǒng)穩(wěn)定性之外一文不值,但實(shí)際它也有一些潛在的好處:可以為我們確定實(shí)際系統(tǒng)總時(shí)序預(yù)算(TTB)裕度以及估算產(chǎn)品現(xiàn)場(chǎng)使用壽命提供有益信息,。超頻技術(shù)正在發(fā)展為一種稱為“時(shí)鐘裕度”的新技術(shù),,該技術(shù)可確保系統(tǒng)穩(wěn)定運(yùn)行,。此外,,本文還將探討如何利用可編程時(shí)鐘源來實(shí)現(xiàn)時(shí)鐘裕度技術(shù),,確保在臨界條件下的真正系統(tǒng)穩(wěn)定性。
Abstract:
Key words :

 

    計(jì)算機(jī)領(lǐng)域的超頻技術(shù)已存在多年,其目的就是有意識(shí)地讓系統(tǒng)超越工作極限,,實(shí)現(xiàn)最大性能,,但這通常會(huì)減少設(shè)備的使用壽命且難以保證系統(tǒng)的穩(wěn)定性,。許多系統(tǒng)設(shè)計(jì)人員都認(rèn)為超頻技術(shù)除了影響系統(tǒng)穩(wěn)定性之外一文不值,,但實(shí)際它也有一些潛在的好處:可以為我們確定實(shí)際系統(tǒng)總時(shí)序預(yù)算(TTB)裕度以及估算產(chǎn)品現(xiàn)場(chǎng)使用壽命提供有益信息。超頻技術(shù)正在發(fā)展為一種稱為“時(shí)鐘裕度”的新技術(shù),,該技術(shù)可確保系統(tǒng)穩(wěn)定運(yùn)行,。此外,本文還將探討如何利用可編程時(shí)鐘源來實(shí)現(xiàn)時(shí)鐘裕度技術(shù),,確保在臨界條件下的真正系統(tǒng)穩(wěn)定性,。


    很多讀者對(duì)上世紀(jì)80年代和90年代初期的PC平臺(tái)可能記憶猶新,這種平臺(tái)都帶有一個(gè)所謂加速模式(turbo mode)按鍵,。我喜歡按下加速模式按鍵,,并觀察顯示數(shù)字的變化??蛇@些數(shù)字到底意味著什么呢,?按下這個(gè)按鍵,首先是自我感覺良好,,認(rèn)為自己正在體驗(yàn)一種極限計(jì)算性能,,可謂物超所值,畢竟當(dāng)年的一部臺(tái)式機(jī)價(jià)值2500美元,。我也很清楚,,要是覺得加速模式下性能不穩(wěn)定,那么總可以返回正常模式,,以確保整個(gè)系統(tǒng)的穩(wěn)定性,。坦率地說,實(shí)際上我從未在正常模式下工作過,,相信其他人也一樣,。當(dāng)然,加速模式是一柄雙刃劍,,人們一直批評(píng)它會(huì)造成系統(tǒng)崩潰,,而且還會(huì)擔(dān)心一旦風(fēng)扇失靈,就會(huì)把CPU燒壞報(bào)廢掉,。 


    實(shí)際上,,過去的加速模式就是我們今天所說的超頻技術(shù)。其實(shí)基本概念并沒變,,都是要接近或超越系統(tǒng)的計(jì)算速度極限,,將系統(tǒng)推到穩(wěn)定與不穩(wěn)定的邊緣。想到超頻技術(shù)時(shí),,總是自然而然地想到PC,。除了超頻技術(shù)帶來的問題之外,,能不能通過超頻技術(shù)(即以超頻為工具)找到系統(tǒng)的弱點(diǎn)呢?能不能通過一種結(jié)構(gòu)化的“試驗(yàn)設(shè)計(jì)”,,讓邏輯中最薄弱的一環(huán)自動(dòng)暴露出來呢,?能不能通過超頻技術(shù)來準(zhǔn)確判斷系統(tǒng)穩(wěn)定與不穩(wěn)定的確切臨界點(diǎn)呢?我們的分析還會(huì)不會(huì)提供一些隱性的有價(jià)值信息,,有助于推測(cè)系統(tǒng)老化影響帶來的早期故障問題,?如果認(rèn)為超頻的好處是讓系統(tǒng)達(dá)到穩(wěn)定工作的極限,那么降頻又會(huì)怎么樣呢,?通常認(rèn)為超頻主要就是修改設(shè)置時(shí)間,,而降頻就是修改保存時(shí)間。要討論超頻或降頻,,就需要給系統(tǒng)“標(biāo)稱”響應(yīng)定義一個(gè)參考基準(zhǔn),。系統(tǒng)設(shè)計(jì)人員應(yīng)當(dāng)根據(jù)系統(tǒng)組件數(shù)據(jù)表提供的有關(guān)制造規(guī)范建立一個(gè)標(biāo)稱響應(yīng)的標(biāo)準(zhǔn)。


總時(shí)序預(yù)算


    首先介紹一些涵蓋關(guān)于超頻概念的新術(shù)語,??倳r(shí)序預(yù)算(TTB)與超頻系統(tǒng)的穩(wěn)定性條件密切相關(guān)??倳r(shí)序預(yù)算是指系統(tǒng)能夠?qū)崿F(xiàn)的性能,。根據(jù)這個(gè)定義,我們可以明確理性條件下系統(tǒng)的邊界時(shí)序性能限定,??倳r(shí)序預(yù)算是指系統(tǒng)的整體邊界性能極限條件下的,既包括超頻和降頻時(shí)的體驗(yàn)效果,。我們往往要通過實(shí)踐分析來獲得總時(shí)序預(yù)算參數(shù),,數(shù)據(jù)表中的內(nèi)容不能提供這種最大和最小容限規(guī)范。根據(jù)定義,,數(shù)據(jù)表提供的是系統(tǒng)“標(biāo)稱”的時(shí)鐘速度(位于最大和最小指標(biāo)之間),,是構(gòu)成整體系統(tǒng)的設(shè)備選擇的內(nèi)在特性。在分析系統(tǒng)總時(shí)序預(yù)算的時(shí)候,,會(huì)發(fā)現(xiàn)標(biāo)稱數(shù)值與總時(shí)序預(yù)算數(shù)值之間存在一定的性能差或者頻率差,。系統(tǒng)電壓與溫度都會(huì)影響總時(shí)序預(yù)算,為了獲得一致性的結(jié)果,,必須考慮這些影響因素,。


始終裕度


   時(shí)鐘裕度(clock margining)也是一個(gè)有趣的術(shù)語。其含義包含的不僅僅是超頻的概念,。時(shí)鐘裕度的概念是指我們通過全面的回歸測(cè)試,、根據(jù)總時(shí)序預(yù)算數(shù)據(jù)來探索并得出系統(tǒng)的穩(wěn)定性參數(shù)。通過時(shí)鐘裕度,讓小部分軟件超頻運(yùn)行,,能全面了解系統(tǒng)的工作性能極限,。可在產(chǎn)品壽命周期中隔一定時(shí)期就進(jìn)行一次時(shí)鐘裕度檢測(cè),,了解實(shí)際性能與標(biāo)稱性能的差別,,從而了解產(chǎn)品性能變化的趨勢(shì)。這種趨勢(shì)有助于估計(jì)系統(tǒng)什么時(shí)候會(huì)達(dá)到壽命終點(diǎn),。系統(tǒng)制造后不久,,會(huì)進(jìn)行一次參照時(shí)鐘裕度性能差檢測(cè),這通??山⑵鹨粋€(gè)極限性能基準(zhǔn)。隨著產(chǎn)品的老化,,在實(shí)際的測(cè)試中首次極限性能與標(biāo)稱的差距最大,,以后每次檢測(cè)都會(huì)發(fā)現(xiàn)差距在縮小。

 


系統(tǒng)老化


   系統(tǒng)老化這是一個(gè)老生常談的問題了,,也是一個(gè)有趣的問題,。世界上沒有完美的產(chǎn)品,硅芯片制造也一樣,。硅芯片的封裝會(huì)對(duì)產(chǎn)品使用壽命產(chǎn)生很大影響,,因?yàn)榉庋b技術(shù)密封性不好,硅芯片會(huì)暴露于外界環(huán)境,。從硅芯片的角度來說,,熱載流子注入的自然效應(yīng)與電子移動(dòng)的細(xì)微效果會(huì)對(duì)系統(tǒng)產(chǎn)生影響。熱量會(huì)加速硅芯片的老化,。老化作為一種靈敏度參數(shù)來說,,則體現(xiàn)在總時(shí)序預(yù)算數(shù)據(jù)上。通過超頻與降頻對(duì)比,,發(fā)現(xiàn)超頻對(duì)系統(tǒng)產(chǎn)生的壓力最大,,這也是性能差分析的基本方法。

時(shí)鐘裕度的實(shí)施


    上面談?wù)摿诉@么多關(guān)于時(shí)鐘裕度技術(shù)的話題,,那么怎樣才能實(shí)施時(shí)鐘裕度技術(shù)呢,?首先,我們要知道,,最先進(jìn)的系統(tǒng)通常包括眾多時(shí)鐘源,。在多數(shù)情況下,時(shí)鐘間存在相互依賴的關(guān)系,,但有時(shí)也會(huì)存在獨(dú)立的時(shí)鐘?,F(xiàn)在,常見的時(shí)鐘源通常采用鎖相環(huán)技術(shù),確保噪聲最小化,,這使得新一代鎖相環(huán)技術(shù)產(chǎn)生的時(shí)鐘源具有較小的抖動(dòng),,同時(shí)在相位噪聲性能方面優(yōu)于固定的時(shí)鐘源。鎖相環(huán)通常作為帶可編程分壓器的時(shí)鐘合成器,,可支持多種時(shí)鐘輸出的合成,,而且相互依賴的不同時(shí)鐘之間可建立不同的“分頻比”。分頻比是PC時(shí)鐘領(lǐng)域的過時(shí)術(shù)語,,但對(duì)任何相互依賴的時(shí)鐘問題來說仍然適用,。


    為了成功實(shí)現(xiàn)時(shí)鐘裕度功能,其必須內(nèi)置頻率調(diào)節(jié)的功能,。變頻功能在實(shí)際上可能比最初設(shè)想的要更困難,,因?yàn)槲覀儽仨毴媪私怄i相環(huán)技術(shù)的性能,不僅要了解工作期間可以實(shí)現(xiàn)的目標(biāo)頻率,,還要了解不同反饋編程條件下的相位噪聲與抖動(dòng)性能,。基于時(shí)域的抖動(dòng)是我們需要了解的重要內(nèi)容,,這樣才能確保不同頻率之間的一致性(不能突然斷開),,否則系統(tǒng)的穩(wěn)定性分析就會(huì)出錯(cuò)。如果發(fā)生了不連續(xù)的抖動(dòng)情況,,也不會(huì)出現(xiàn)太大麻煩,,可以通過多個(gè)特定的輸出頻率開槽或所需的分頻比來解決。此外,,應(yīng)當(dāng)確保開槽不要在頻率變化期間進(jìn)行,,除非鎖相環(huán)的設(shè)置在CPU對(duì)任何形式的開槽和短脈沖不敏感的間隔中進(jìn)行。


    確??倳r(shí)序預(yù)算正確的技巧就是,,應(yīng)當(dāng)了解哪些頻率范圍表現(xiàn)較好,這樣就能小心地通過逐步逼近的辦法接近總時(shí)序預(yù)算目標(biāo),,而每一步的變化量可能有差別,。如果頻率變化較大,那么通常會(huì)導(dǎo)致總時(shí)序預(yù)算差別結(jié)果較小,??倳r(shí)序預(yù)算邊界檢測(cè)要求最終肯定要突破系統(tǒng)的界限,然后重啟并略微后退一些,,直至獲得滿意的一致性閾值為止,。有許多沒有文件記載的“小竅門”可以完成此項(xiàng)工作。建立系統(tǒng)總時(shí)序預(yù)算的關(guān)鍵就是一致性與可重復(fù)性,。


    正如前面簡(jiǎn)單談到的那樣,,執(zhí)行時(shí)鐘裕度工作所發(fā)現(xiàn)的最重要信息就是在產(chǎn)品投入使用后估算出實(shí)際的產(chǎn)品使用壽命終結(jié)時(shí)間,。本文分析的目的就是要通過時(shí)鐘裕度來計(jì)算產(chǎn)品的標(biāo)稱性能與總時(shí)序預(yù)算之間的差異,以備后續(xù)之需,。在幾周,、幾個(gè)月乃至幾年的時(shí)間里,投入實(shí)際使用的產(chǎn)品運(yùn)行相同的回歸進(jìn)程,,重復(fù)計(jì)算性能差異,。我認(rèn)為,能夠體現(xiàn)產(chǎn)品使用壽命結(jié)束的情況就是在性能差為零或?yàn)樨?fù)值,。這并不是說系統(tǒng)出現(xiàn)故障,,而只是說沒有性能差了,說明產(chǎn)品已經(jīng)到了使用壽命的終點(diǎn),。無論采用何種產(chǎn)品支持方式,,如果性能差為零,則說明產(chǎn)品的使用壽命已經(jīng)結(jié)束了,,這一信息對(duì)那些需要全天候持續(xù)工作的系統(tǒng)來說是至關(guān)重要的,。如圖1所示,根據(jù)歷史性能差信息預(yù)測(cè)出了性能差為零的時(shí)間,。通過簡(jiǎn)單的線性分析或非線性曲線分析,可以估計(jì)得出產(chǎn)品使用壽命結(jié)束的時(shí)間,。

圖 1:系統(tǒng)使用壽命估算分析圖,。
圖 1:系統(tǒng)使用壽命估算分析圖。

 

 

    在溫度與電壓等外部因素已知,、記錄且匹配的情況下進(jìn)行未來回歸檢測(cè),,確保符合時(shí)鐘裕度技術(shù)的準(zhǔn)確性。圖1顯示了超頻工作情況下的時(shí)鐘裕度性能差為正值的變化圖,,此原理也適用于降頻工作的情況,。不過,在降頻工作情況下,,性能差的變動(dòng)不會(huì)太大且基本保持穩(wěn)定,。這里將降頻工作情況下的時(shí)鐘裕度差值設(shè)為正值。

 


    在時(shí)鐘裕度技術(shù)的實(shí)施過程中,,通過不斷調(diào)整來修正鎖相環(huán)時(shí)鐘源或其他時(shí)鐘源,。圖2顯示了一個(gè)采用時(shí)鐘裕度技術(shù)的簡(jiǎn)單的鎖相環(huán)進(jìn)程的一級(jí)方案。管理系統(tǒng)的最佳方法之一,,就是采用看門狗計(jì)時(shí)器,,成功完成回歸檢測(cè)后,軟件就會(huì)重新設(shè)置計(jì)時(shí)器,,而系統(tǒng)故障則會(huì)導(dǎo)致看門狗計(jì)時(shí)器超時(shí),。反復(fù)進(jìn)行上述工作,,重復(fù)檢測(cè)回歸計(jì)算,存儲(chǔ)鎖相環(huán)頻率內(nèi)容,,進(jìn)程不斷重復(fù)進(jìn)行直到出現(xiàn)故障,。如前所述,不斷趨近總時(shí)序預(yù)算極限的過程中,,可以了解鎖相環(huán)參數(shù)與系統(tǒng)步進(jìn)變化大小的靈敏度,,越接近總時(shí)序預(yù)算標(biāo)準(zhǔn)極限,步進(jìn)改變就越小,。這樣,,就要多次循環(huán)上述工作,直到取到最后一次成功檢測(cè)參數(shù)為止,,超過這個(gè)回歸檢測(cè)界限,,系統(tǒng)就會(huì)出故障。因此最后一個(gè)已知的成功回歸檢測(cè)結(jié)果就是總時(shí)序預(yù)算的極限,。

圖 2:采用時(shí)鐘裕度技術(shù)的簡(jiǎn)單的鎖相環(huán)進(jìn)程,。

圖 2:采用時(shí)鐘裕度技術(shù)的簡(jiǎn)單的鎖相環(huán)進(jìn)程。


本文小結(jié)


     測(cè)試時(shí)鐘裕度性能差的過程,,也就是了解總時(shí)序預(yù)算極限的過程,,對(duì)了解如何發(fā)掘系統(tǒng)的全部潛力很有用。時(shí)鐘裕度技術(shù)有助于找到系統(tǒng)最薄弱的環(huán)節(jié),,還能不斷調(diào)節(jié)并創(chuàng)建一個(gè)匹配的系統(tǒng),,以防止系統(tǒng)超過總時(shí)序預(yù)算極限發(fā)生災(zāi)難性后果??倳r(shí)序預(yù)算可以幫助我們明確時(shí)鐘裕度性能差,,估算出產(chǎn)品投入使用后的使用壽命。為了實(shí)現(xiàn)上述功能,,時(shí)鐘裕度技術(shù)的核心就是可編程的鎖相環(huán),。通過參考PLL環(huán)路編程進(jìn)程的有關(guān)討論,驗(yàn)證了使用硬件計(jì)時(shí)器與非易失性存儲(chǔ)設(shè)備有助于簡(jiǎn)化管理工作,,明確總時(shí)序預(yù)算極限,。

 

 

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載,。