??? 摘? 要:介紹了一種精簡的內(nèi)核崩潰信息記錄技術(shù),,該技術(shù)保存函數(shù)調(diào)用鏈并有選擇地記錄函數(shù)棧內(nèi)容。記錄下的內(nèi)容可有效地分析定位問題,,精簡的記錄存儲可滿足復(fù)位后快速重啟的要求,。?
??? 關(guān)鍵詞: Linux內(nèi)核; 崩潰轉(zhuǎn)儲; 嵌入式系統(tǒng)
?
??? 隨著嵌入式Linux系統(tǒng)的廣泛應(yīng)用,,對系統(tǒng)的可靠性提出了更高的要求,,尤其是涉及到生命財產(chǎn)等重要領(lǐng)域,要求系統(tǒng)達到安全完整性等級3級以上[1],,故障率(每小時出現(xiàn)危險故障的可能性)為10-7以下,,相當(dāng)于系統(tǒng)的平均故障間隔時間(MTBF)至少要達到1141年以上,因此提高系統(tǒng)可靠性已成為一項艱巨的任務(wù),。對某公司在工業(yè)領(lǐng)域14 878個控制器系統(tǒng)的應(yīng)用調(diào)查表明,,從2004年初到2007年9月底,隨著硬軟件的不斷改進,,根據(jù)錯誤報告統(tǒng)計的故障率已降低到2004年的五分之一以下,,但查找錯誤的時間卻增加到原來的3倍以上。?
??? 這種解決問題所需時間呈上升的趨勢固然有軟件問題,,但缺乏必要的手段以輔助解決問題才是主要的原因,。通過對故障的統(tǒng)計跟蹤發(fā)現(xiàn),難以解決的軟件錯誤和從發(fā)現(xiàn)到解決耗時較長的軟件錯誤都集中在操作系統(tǒng)的核心部分,,這其中又有很大比例集中在驅(qū)動程序部分[2],。因此,錯誤跟蹤技術(shù)被看成是提高系統(tǒng)安全完整性等級的一個重要措施[1],,大多數(shù)現(xiàn)代操作系統(tǒng)均為發(fā)展提供了操作系統(tǒng)內(nèi)核“崩潰轉(zhuǎn)儲”機制,,即在軟件系統(tǒng)宕機時,將內(nèi)存內(nèi)容保存到磁盤[3],,或者通過網(wǎng)絡(luò)發(fā)送到故障服務(wù)器[3],,或者直接啟動內(nèi)核調(diào)試器[4]等,以供事后分析改進,。?
??? 基于Linux操作系統(tǒng)內(nèi)核的崩潰轉(zhuǎn)儲機制近年來有以下幾種:?
??? (1) LKCD(Linux Kernel Crash Dump)機制[3];?
??? (2) KDUMP(Linux Kernel Dump)機制[4],;?
??? (3) KDB機制[5];?
??? (4) KGDB機制[6],。?
??? 綜合上述幾種機制可以發(fā)現(xiàn),這四種機制之間有以下三個共同點:?
??? (1) 適用于為運算資源豐富,、存儲空間充足的應(yīng)用場合,;?
??? (2) 發(fā)生系統(tǒng)崩潰后恢復(fù)時間無嚴格要求;?
??? (3) 主要針對較通用的硬件平臺,,如X86平臺,。?
??? 在嵌入式應(yīng)用場合想要直接使用上列機制中的某一種,卻遇到以下三個難點無法解決:?
??? (1) 存儲空間不足?
??? 嵌入式系統(tǒng)一般采用Flash作為存儲器,,而Flash容量有限,,且可能遠遠小于嵌入式系統(tǒng)中的內(nèi)存容量。因此將全部內(nèi)存內(nèi)容保存到Flash不可行,。?
??? (2) 記錄時間要求盡量短?
??? 嵌入式系統(tǒng)一般有復(fù)位響應(yīng)時間盡量短的要求,,有的嵌入式操作系統(tǒng)復(fù)位重啟時間不超過2s,而上述幾種可用于Linux系統(tǒng)的內(nèi)核崩潰轉(zhuǎn)儲機制耗時均不可能在30s內(nèi),。寫Flash的操作也很耗時間,,實驗顯示,寫2MB數(shù)據(jù)到Flash耗時達到400ms之多,。?
??? (3) 要求能夠支持特定的硬件平臺?
??? 嵌入式系統(tǒng)的硬件多種多樣,,上面提到的四種機制均是針對X86平臺提供了較好的支持,而對于其他體系的硬件支持均不成熟,。?
??? 由于這些難點的存在,,要將上述四種內(nèi)核崩潰轉(zhuǎn)儲機制中的一種移植到特定的嵌入式應(yīng)用平臺是十分困難的。因此,,針對上述嵌入式系統(tǒng)的三個特點,,本文介紹一種基于特定平臺的嵌入式Linux內(nèi)核崩潰信息記錄機制LCRT(Linux Crash Record and Trace),為定位嵌入式Linux系統(tǒng)中軟件故障和解決軟件故障提供輔助手段,。?
1 Linux內(nèi)核崩潰的分析?
??? 分析Linux內(nèi)核對于運行期間各種“陷阱”的處理可以得知,,Linux內(nèi)核對于應(yīng)用程序導(dǎo)致的錯誤可以予以監(jiān)控,在應(yīng)用程序發(fā)生除零,、內(nèi)存訪問越界,、緩沖區(qū)溢出等錯誤時,Linux內(nèi)核的異常處理例程可以對這些由應(yīng)用程序引起的異常情況予以處理,。當(dāng)應(yīng)用程序產(chǎn)生不可恢復(fù)的錯誤時,,Linux內(nèi)核可以僅僅終止產(chǎn)生錯誤的應(yīng)用程序,其他應(yīng)用程序仍然可以正常運行,。?
??? 如果Linux內(nèi)核本身或者新開發(fā)的Linux內(nèi)核模塊存在bug,,產(chǎn)生了“除零”,“內(nèi)存訪問越界”,、“緩沖區(qū)溢出”等錯誤,,同樣會由Linux內(nèi)核的異常處理例程來處理。Linux內(nèi)核通過在異常處理程序中判斷,,如果發(fā)現(xiàn)是“嚴重的不可恢復(fù)”的內(nèi)核異常,,則會導(dǎo)致“內(nèi)核恐慌”(kernel panic),,即Linux內(nèi)核崩潰。圖1所示為Linux內(nèi)核對異常情況的處理流程,。?
?
?
2 LCRT機制的設(shè)計與實現(xiàn)?
??? 通過對Linux內(nèi)核代碼的分析可知,,Linux內(nèi)核本身提供了一種“內(nèi)核通知機制”[7-8],并預(yù)定義了“內(nèi)核事件通知鏈”,,使得Linux內(nèi)核擴展開發(fā)人員可以通過這些預(yù)定義的內(nèi)核事件通知鏈在特定的內(nèi)核事件發(fā)生時執(zhí)行附加的處理流程,。通過對Linux內(nèi)核源代碼的研究發(fā)現(xiàn),對于上文中提到的“嚴重不可恢復(fù)的內(nèi)核異?!?,預(yù)定義了一個通知鏈和通知點,使得在發(fā)生Linux內(nèi)核崩潰之后,,可以在Linux內(nèi)核的panic函數(shù)中預(yù)定義的一個“內(nèi)核崩潰通知鏈”[7]上掛接LCRT機制來獲得Linux內(nèi)核崩潰現(xiàn)場的一些信息并記錄到非易失性存儲器中,,以便分析引起Linux內(nèi)核崩潰的原因。?
2.1 設(shè)計要點?
??? LCRT機制的設(shè)計和實現(xiàn)基于如下特定的機制:?
??? (1) 編譯器選項與內(nèi)核依賴?
??? Linux內(nèi)核及相應(yīng)的驅(qū)動程序都采用GNU[9]的開源編譯器GCC[9]編譯,,為了結(jié)合LCRT機制方便地提取信息和記錄信息,,需要采用特定的GCC編譯器選項來編譯Linux內(nèi)核和相關(guān)的驅(qū)動程序以及應(yīng)用程序。用到的選項為:-mpoke-function-name[9],。使用這個選項編譯出的二進制程序中可以包含C語言函數(shù)名稱的信息,以方便函數(shù)調(diào)用鏈回溯時記錄信息的可讀性,。?
??? (2) Linux內(nèi)核notify_chain機制[8]?
??? Linux內(nèi)核提供“通知鏈”功能,,并預(yù)定義了一個內(nèi)核崩潰通知鏈,在Linux內(nèi)核的異常處理例程中判斷出系統(tǒng)進入“不可恢復(fù)”狀態(tài)時,,會沿預(yù)定義的通知鏈順序調(diào)用注冊到相應(yīng)鏈中的通知函數(shù),。?
??? (3) 函數(shù)調(diào)用的棧布局?
??? Linux內(nèi)核的絕大部分由C語言實現(xiàn),而且C語言也多用來進行Linux內(nèi)核開發(fā),。Linux內(nèi)核及使用LKM擴展而加入Linux內(nèi)核執(zhí)行環(huán)境的代碼是有規(guī)律可循的,,這些代碼在執(zhí)行過程中產(chǎn)生的棧布局和這些規(guī)律的代碼相關(guān)聯(lián)。例如,,這些函數(shù)在執(zhí)行函數(shù)之前會保存本函數(shù)調(diào)用后的返回地址,、本函數(shù)被調(diào)用時傳遞過來的參數(shù)及調(diào)用本函數(shù)的函數(shù)所擁有的棧幀的棧底。?
2.2 LCRT機制的設(shè)計思想?
??? LCRT機制分為Linux內(nèi)核模塊[8]部分和Linux用戶程序部分,。內(nèi)核模塊部分的設(shè)計采用了Linux內(nèi)核模塊的模式而不是直接修改Linux內(nèi)核,。這樣的設(shè)計降低了Linux內(nèi)核和LCRT機制之間的耦合度,同時滿足了Linux內(nèi)核和LCRT機制獨立升級完善的便利性,。用戶程序部分完成從非易失性存儲器中讀取,、清除LCRT機制保存的信息等相關(guān)功能。?
??? 在LCRT機制的設(shè)計中,,針對嵌入式系統(tǒng)的特點,,其設(shè)計決策有:?
??? (1) 將對于解決和定位問題最具輔助意義的函數(shù)調(diào)用關(guān)系鏈記錄下來,。?
??? (2) 為了不占用過多的存儲空間,有選擇性地將函數(shù)調(diào)用序列上的函數(shù)各自用到的棧內(nèi)容保存起來,,而不是保存全部內(nèi)容,。?
??? (3) 將記錄的信息保存到非易失性存儲器中,這樣既達到了掉電保存的目的,、又縮短了寫入時間,。?
??? LCRT機制的設(shè)計包括以下五個方面。?
??? (1) 設(shè)計Linux內(nèi)核模塊,、動態(tài)地加載LCRT機制,、盡量少地修改Linux內(nèi)核代碼。?
??? (2)在相應(yīng),、預(yù)定義的Linux內(nèi)核通知鏈上掛接LCRT的通知函數(shù),。?
??? (3) 在LCRT機制的通知處理函數(shù)中進行堆棧回溯得到函數(shù)調(diào)用信息,。?
??? (4) 記錄回溯到的函數(shù)調(diào)用信息和堆??臻g內(nèi)容到非易失性存儲器。?
??? (5) 開發(fā)用戶空間的工具,,可以從非易失性存儲器中讀取保存的信息,。?
2.3 LCRT機制的實現(xiàn)?
??? LCRT機制的實現(xiàn)可參照2.2節(jié)的設(shè)計思想,分步予以實現(xiàn),。限于篇幅,,本文不過多涉及Linux內(nèi)核模塊的原理和實現(xiàn)相關(guān)的細節(jié),僅僅給出LCRT機制的內(nèi)核模塊實現(xiàn)偽代碼,。用偽代碼描述LCRT機制的加載函數(shù)如下:?
??? int lcrt_init(void) ?
??????? {?
??????????? printk("Registering my__panic notifier.\n");?
???? ?????? bt_nvram_ptr=(volatile unsigned char*)ioremap_?
nocache (BT_NVRAM_BASE,BT_NVRAM_LENGTH);?
???? ?????? bt_nvram_index+=sizeof(struct bt_info);?
???? ?????? *)bt_nvram_ptr,BT_NVRAM_LENGTH);?
???? ?????? notifier_chain_register(&panic_notifier_list,&my_?
??????????? panic_block);?
???? ?????? return 0;?
???? ?? }?
??? LCRT機制的通知處理函數(shù)完成函數(shù)調(diào)用關(guān)系回溯,、得到函數(shù)名稱、函數(shù)棧內(nèi)容等工作,,限于篇幅,,在這里用下面?zhèn)未a說明:?
??? void ll_bt_information(struct pt_regs *pr)?
??? {?
??? 變量定義等初始化工作?
??? do? {?
??????? reglist=*(unsigned long *)(*myfp-8);?
??????? //從函數(shù)棧幀的頂部獲取函數(shù)開始執(zhí)行時保存的寄存器信息?
??? //從函數(shù)的代碼區(qū)中取得函數(shù)的名稱?
??????? //從函數(shù)的棧幀里取出函數(shù)執(zhí)行函數(shù)體代碼之前保存的函數(shù)參數(shù)信息?
??? //從本函數(shù)的棧幀中得到調(diào)用本函數(shù)的代碼所在位置和調(diào)用本函數(shù)的函數(shù)棧幀的棧底?
??? }while(直到函數(shù)調(diào)用鏈的鏈頭);?
??? ?
? //取得函數(shù)調(diào)用棧幀的內(nèi)容?
??????? //填充信息記錄的記錄頭部?
??????? //將上面的循環(huán)中取得的信息保存到非易失性存儲器中?
??? write_to_nvram((void *)bt_nvram_ptr,&bt_record_header,sizeof(bt_info_t));?
??? }?
3 驗證評估LCRT機制?
3.1 部署LCRT機制?
??? 部署LCRT機制,使LCRT機制發(fā)揮作用前需要做的相關(guān)工作有:?
??? (1)針對目標Linux內(nèi)核編譯LCRT機制的Linux內(nèi)核模塊部分;?
??? (2) 將LCRT機制的內(nèi)核模塊部分載入Linux內(nèi)核,。?
3.2 實驗結(jié)果?
??? 為了實驗LCRT機制的作用效果,,構(gòu)造一個會造成Linux內(nèi)核崩潰的設(shè)備驅(qū)動模塊,記這個內(nèi)核驅(qū)動模塊為bugguy.ko,列出如下所示的bugguy.ko中會引起Linux內(nèi)核崩潰的代碼如下所示:?
??? irqreturn_t my_timer_interrupt(int irq,void *dev_id,struct?pt_regs* regs)?
??? {?
??? 確認硬件狀態(tài)并清除中斷狀態(tài)?
??? if(ujiffies > 5000) {?
??????? void * ill_pointer=NULL;?
??? *(unsigned long *)ill_pointer=0;?
??? }?
??? else?{?
??????? ujiffies++;?
??? }?
??? return IRQ_HANDLED;?
??? }?
??? 說明:用黑體標出的代碼即為產(chǎn)生bug的代碼?
??? 從上面的代碼可以看出,,這個錯誤是對空指針進行解析而造成的,。在一個中斷處理函數(shù)中如果發(fā)生對空指針的解析,將會引起Linux內(nèi)核的崩潰,。在部署完成LCRT機制的嵌入式linux系統(tǒng)上將這個bugguy.ko載入Linux內(nèi)核,,使得會引起Linux內(nèi)核崩潰的中斷處理程序得以運行,LCRT機制可以將相關(guān)的信息保存到非易失性存儲器中,在系統(tǒng)復(fù)位后,,通過LCRT機制的用戶空間工具,,可以將保存的信息讀取出來。實驗結(jié)果顯示,,可以得到如圖2所示的函數(shù)調(diào)用鏈信息,。?
?
?
??? 圖2標注即為會引起Linux內(nèi)核崩潰的錯誤代碼的中斷處理函數(shù)即真正引起系統(tǒng)宕機的“罪魁禍首”。而記錄下的所有信息僅僅占用了不到1KB的存儲空間,,寫入非易失性存儲器所耗用的時間控制在50ms以內(nèi),。在使用少量空間和少量時間的情況下,所記錄下的信息對于查找問題和解決問題都有較大的幫助,。?
??? 實驗結(jié)果表明,,在LCRT機制的作用下,可以快速地定位到嵌入式Linux系統(tǒng)中隱藏的可能會導(dǎo)致系統(tǒng)宕機的軟件缺陷,。這就為后續(xù)的故障解決和軟件完善提供了關(guān)鍵的輔助信息,。對嵌入式Linux內(nèi)核而言,即是為提高Linux內(nèi)核的穩(wěn)定性和可靠性提供了幫助,。?
??? 在基于ARM的嵌入式Linux應(yīng)用中,,開發(fā)LCRT機制來記錄系統(tǒng)內(nèi)核發(fā)生崩潰時引起崩潰的函數(shù)調(diào)用鏈和棧信息到非易失性存儲器中,截至目前為止,,LCRT機制可以記錄基于ARM的嵌入式Linux內(nèi)核發(fā)生崩潰時的函數(shù)調(diào)用鏈信息,,可直接得到函數(shù)名稱、函數(shù)調(diào)用鏈中單個函數(shù)被調(diào)用時的參數(shù)信息以及函數(shù)調(diào)用鏈中的函數(shù)各自的棧幀信息,。這些記錄下來的信息對于完善和發(fā)展基于ARM的嵌入式Linux應(yīng)用具有重要的輔助意義,。?
參考文獻?
[1] IEC international 61508-1 standard functional safety of?electrical/electronic/programmable electronic safety-related?systems-Part 1: General requirements,1998.?
[2] SWIFT M M, BERSHAD B N, LEVY H M. Improving?the reliability of commodity operating systems[OL].http://nooks.cs.washington.edu/nooks-tocs.pdf, 2005.?
[3] IBM Global Services, Linux education. LKCD?installation and configuration[OL].http://lkcd.sourceforge.net/doc/lkcd_tutorial.pdf, 2006.?
[4] GOYAL V, BIEDERMAN E W, KDUMP H N.A kexecbased kernel crash dumping mechanism[OL].http://lse.sourceforge.net/kdump/documentation/ols2oo5kdump-paper.pdf, 2005.?
[5] CORBET J, RUBINI A, HARTMAN G K. Linux device?drivers, Third Edition[M].魏永明譯. 北京:中國電力出版社,,2005.?
[6] LinSysSoft Technologies Pvt. Ltd. KGDB Documentation[OL].http://kgdb.linsyssoft.com/downloads/kgdb-2/kgdb_docu_full-2.4.pdf, 2006.?
[7] YAGBMOUR K.構(gòu)建嵌入式Linux系統(tǒng)[M].北京:中國電力出版社,2004.?
[8] RODRIGUEZ C S, FISCHER G, SMOLSKI S. Linux內(nèi)核編程必讀(英文版)[M].北京:機械工業(yè)出版社,,2006.?
[9] GRIFFITH A. GCC技術(shù)參考大全[M].胡恩華譯.北京:清華大學(xué)出版社,,2004.