《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 嵌入式技術(shù) > 業(yè)界動態(tài) > 這些技巧讓高可靠性嵌入式系統(tǒng)的開發(fā)更簡單

這些技巧讓高可靠性嵌入式系統(tǒng)的開發(fā)更簡單

2017-06-08

       就像很遙遠年代的人們思想還很保守,固守著自己一方凈土獨享著一份安逸,??傉J為天圓地方一直在平淡而充實的生活,又好似紅樓夢中的劉姥姥走進大觀園看得眼花繚亂,。對于75年以前人傳統(tǒng)觀念還比較濃重,,對于那個年代的人來講所受到教育和現(xiàn)在應(yīng)該說是不一樣的。對于那個時代物資相對比較匱乏,科技相對有些落后沒有現(xiàn)在所謂的大數(shù)據(jù),、云計算,、互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)。

timg.jpg

  從規(guī)范完善的開發(fā)周期到嚴格執(zhí)行和系統(tǒng)檢查,,開發(fā)高可靠性嵌入式系統(tǒng)的技術(shù)有許多種,。本文介紹了7個易操作且可以長久使用的技巧,它們對于確保系統(tǒng)更加可靠地運行并捕獲異常行為大有幫助,。

  技巧1——用已知值填充ROM

  軟件開發(fā)人員往往都是非常樂觀的一群人,,只要讓他們的代碼忠實地長時間地運行就可以了,僅此而已,。微控制器跳出應(yīng)用程序空間并在非預(yù)想的代碼空間中執(zhí)行這種情況似乎是相當少有的,。然而,這種情況發(fā)生的機會并不比緩存溢出或錯誤指針失去引用少,。它確實會發(fā)生!發(fā)生這種情況后的系統(tǒng)行為將是不確定的,,因為默認情況下內(nèi)存空間都是0xFF,或者由于內(nèi)存區(qū)通常沒有寫過,,其中的值可能只有上帝才知道,。

  不過有相當完備的linker或IDE技巧可以用來幫助識別這樣的事件并從中恢復(fù)系統(tǒng)。技巧就是使用FILL命令對未用ROM填充已知的位模式,。要填充未使用的內(nèi)存,,有很多不同的可能組合可以使用,但如果是想建立更加可靠的系統(tǒng),,最明顯的選擇是在這些位置放置ISR fault handler,。如果系統(tǒng)出了某些差錯,處理器開始執(zhí)行程序空間以外的代碼,,就會觸發(fā)ISR,,并在決定校正行動之前提供儲存處理器、寄存器和系統(tǒng)狀態(tài)的機會,。

  技巧2——檢查應(yīng)用程序的CRC

  對嵌入式工程師來說一個很大的好處是,,我們的IDE和工具鏈可以自動產(chǎn)生應(yīng)用程序或內(nèi)存空間校驗和(Checksum),從而根據(jù)這個校驗和驗證應(yīng)用程序是否完好,。有趣的是,,在許多這些案例中,只有在將程序代碼加載到設(shè)備時,,才會用到校驗和,。

  然而,如果CRC或校驗和保持在內(nèi)存中,,那么驗證應(yīng)用程序在啟動時(或甚至對長時間運行的系統(tǒng)定期驗證)是否仍然完好是確保意外之事不會發(fā)生的極好途徑?,F(xiàn)在一個編程過的應(yīng)用程序發(fā)生改變的概率是很小的,,但考慮每年交付的數(shù)十億個微控制器以及可能惡劣的工作環(huán)境,應(yīng)用程序崩潰的機會并不是零,。更有可能的是,,系統(tǒng)中的一個缺陷可能導(dǎo)致某一扇區(qū)發(fā)生閃存寫入或閃存擦除,從而破壞應(yīng)用程序的完整性,。

  技巧3——在啟動時執(zhí)行RAM檢查

  為了建立一個更加可靠和扎實的系統(tǒng),,確保系統(tǒng)硬件正常工作非常重要。畢竟硬件會發(fā)生故障,。(幸運的是軟件永遠不會發(fā)生故障,,軟件只會做代碼要它做的事,不管是正確的還是錯誤的),。在啟動時驗證RAM的內(nèi)部或外部沒有問題,,是確保硬件可以如預(yù)期般運作的一個好方法。

  有許多不同的方法可用于執(zhí)行RAM檢查,,但常用的方法是寫入一個已知的模式,,然后等上一小段時間再回讀。結(jié)果應(yīng)該是所讀就是所寫,。真相是,,在大多數(shù)情況下RAM檢查是通過的,,這也是我們想要的結(jié)果,。但也有極小的可能性檢查不通過,這時就為系統(tǒng)標示出硬件問題提供了極好的機會,。

  技巧4——使用堆棧監(jiān)視器

  對許多的嵌入式開發(fā)者而言,,堆棧似乎是一股相當神秘的力量。當奇怪的事情開始發(fā)生,,工程師終于被難倒了,,他們開始思考,也許堆棧中發(fā)生了什么事,。結(jié)果是盲目地調(diào)整堆棧的大小和位置等等,。但該錯誤往往是與堆棧無關(guān)的,但怎能如此確定?畢竟,,有多少工程師真的實際執(zhí)行過最壞情況下的堆棧大小分析?

  堆棧大小是在編譯時就靜態(tài)分配好的,,但堆棧是以動態(tài)的方式使用的。隨著代碼的執(zhí)行,,應(yīng)用程序需要的變量,、返回的地址和其它信息被不斷存儲在堆棧中。這種機制導(dǎo)致堆棧在其分配的內(nèi)存中不斷增長,。然而,,這種增長有時會超出編譯時確定的容量極限,導(dǎo)致堆棧破壞相鄰內(nèi)存區(qū)域的數(shù)據(jù)。

  絕對確保堆棧正常工作的一種方法是實現(xiàn)堆棧監(jiān)視器,,將它作為系統(tǒng)“保健”代碼的一部分(有多少工程師會這樣做?),。堆棧監(jiān)視器會在堆棧和“其它”內(nèi)存區(qū)域之間創(chuàng)建一個緩沖區(qū)域,并填充已知的位模式,。然后監(jiān)視器會不斷的監(jiān)視圖案是否有任何變化,。如果該位模式發(fā)生了改變,那就意味著堆棧增長得太大了,,即將要把系統(tǒng)推向黑暗地獄!此時監(jiān)視器可以記錄事件的發(fā)生,、系統(tǒng)狀態(tài)以及任何其它有用的數(shù)據(jù),供日后用于問題的診斷,。

  大多數(shù)實時操作系統(tǒng)(RTOS)或?qū)崿F(xiàn)了內(nèi)存保護單元(MPU)的微控制器系統(tǒng)中都提供有堆棧監(jiān)視器,。可怕的是,,這些功能默認都是關(guān)閉狀態(tài),,或者經(jīng)常被開發(fā)人員有意關(guān)閉。在網(wǎng)絡(luò)上快速搜尋一下可以發(fā)現(xiàn),,很多人建議關(guān)閉實時操作系統(tǒng)中的堆棧監(jiān)視器以節(jié)省56字節(jié)的閃存空間,。等等,這可是得不償失的做法!

  技巧5 - 使用MPU

  在過去,,是很難在一個小而廉價的微控制器中找到內(nèi)存保護單元(MPU)的,,但這種情況已經(jīng)開始改變。現(xiàn)在從高端到低端的微控制器都已經(jīng)有MPU,,而這些MPU為嵌入式軟件開發(fā)人員提供了一個可以大幅提高其固件(firmware)魯棒性(robustness)的機會,。

  MPU 已逐漸與操作系統(tǒng)耦合,以便建立內(nèi)存空間,,其中的處理都分開,,或任務(wù)可執(zhí)行其代碼,而不用擔心被stomped on,。倘若真有事情發(fā)生,,不受控制的處理會被取消,也會執(zhí)行其他的保護措施,。請留意帶有這種組件的微控制器,,如果有,請多加利用它的這種特性,。

  技巧6 - 建立一個強大的看門狗系統(tǒng)

  你經(jīng)常會發(fā)現(xiàn)的一種總是最受喜愛的看門狗(watchdog)實現(xiàn)是,,在看門狗被啟用之處(這是一個很好的開始),但也是可以用周期性定時器將該看門狗清零之處;定時器的啟用是完全與程序中出現(xiàn)的任何情況隔離的,。使用看門狗的目的是協(xié)助確保如果出現(xiàn)錯誤,,看門狗不會被清零,,即當工作暫停,系統(tǒng)會被迫去執(zhí)行硬件重設(shè)定(hardware reset),,以便恢復(fù),。使用與系統(tǒng)活動獨立的定時器可以讓看門狗保持清零,即使系統(tǒng)已失效,。

  對應(yīng)用任務(wù)如何整合到看門狗系統(tǒng)中,,嵌入式開發(fā)人員需要仔細考慮和設(shè)計。例如,,有種技術(shù)可能可以讓每個在一定時期內(nèi)運行的任務(wù)標示它們可以成功地完成其任 務(wù),。在此事件中,看門狗不被清零,,強制被復(fù)位,。還有一些比較先進的技術(shù),像是使用外部看門狗處理器,,它可用來監(jiān)視主處理器如何表現(xiàn),,反之亦然。

  對一個可靠的系統(tǒng)而言,,建立一個強大的看門狗系統(tǒng)是很重要的,。由于有太多的技術(shù),難以在這幾個段落中完全涵蓋,,但針對此一議題,,筆者未來還會發(fā)表相關(guān)的文章。

  技巧7 - 避免易失存儲器分配

  不習(xí)慣在資源有限環(huán)境下工作的工程師,,可能會試圖使用其編程語言的特性,,這種語言讓他們可以使用易失存儲器分配,。畢竟,,這是一種常在計算器系統(tǒng)中使用的技術(shù),在計算器系統(tǒng)中,,只有在有必要時,,內(nèi)存才會被分配。例如,,以C開發(fā)時,,工程師可能傾向于使用malloc來分配在堆(heap)上的空間。有一個操 作會執(zhí)行,,一旦完成,,可以使用free將被分配的內(nèi)存返回,以便堆的使用,。

  在資源受限的系統(tǒng),,這可 能是一場災(zāi)難!使用易失存儲器分配的其中一個問題是,,錯誤或不當?shù)募夹g(shù)可能會導(dǎo)致內(nèi)存泄漏或內(nèi)存碎片。如果出現(xiàn)這些問題時,,大多數(shù)的嵌入式系統(tǒng)并沒有 資源或知識來監(jiān)視堆或妥善地處理它,。而當它們發(fā)生時,如果應(yīng)用程序提出對空間的要求,,但卻沒有所請求的空間可以使用,,會發(fā)生什么事呢?

  使用易失存儲器分配所產(chǎn)生的問題是很復(fù)雜的,要妥善處理這些問題,,可以說是一個噩夢!一種替代的方法是,,直接以靜態(tài)的方式,簡化內(nèi)存的分配,。例如,,只要在 程序中簡單地建立一個大小為256字節(jié)長的緩沖區(qū),而不是經(jīng)由malloc請求這樣大小的內(nèi)存緩沖區(qū),。此一分配的內(nèi)存可在整個應(yīng)用程序的生命周期期 間保持,,且不會有堆或內(nèi)存碎片問題方面的顧慮。

  結(jié)論

  這些都只是一些可以讓開發(fā)人員開始建立更可靠嵌入式系統(tǒng)的方法,。另外還有很多其他技術(shù),,例如利用良好的編碼標準、位翻轉(zhuǎn)的監(jiān)測,、執(zhí)行數(shù)組和指針邊界檢查,,及使用斷言等。所有這些技術(shù)都是讓設(shè)計者可以開發(fā)出可靠性更高嵌入式系統(tǒng)的秘訣,。

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點,。轉(zhuǎn)載的所有的文章,、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者,。如涉及作品內(nèi)容、版權(quán)和其它問題,,請及時通過電子郵件或電話通知我們,,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失,。聯(lián)系電話:010-82306118,;郵箱:[email protected]