摘 要: 結(jié)合星載計算機的開發(fā),,從FMECA,、抗輻照設(shè)計,、ESD防護,、結(jié)構(gòu)力學(xué)設(shè)計與分析,、熱設(shè)計與分析,、可靠性預(yù)計等方面闡述了星載計算機設(shè)計過程中的可靠性設(shè)計與分析方法,。
關(guān)鍵詞: 星載計算機,;可靠性; FMECA,; ESD,; 抗輻照; 可靠性預(yù)計,; 熱分析,; 力學(xué)分析
?
作為工控計算機的一個成員,星載計算機是航天器重要系統(tǒng)的核心部件,,特別是控制系統(tǒng)的控制計算機是航天器中十分重要的部件,,其可靠性直接決定了控制系統(tǒng)乃至整個航天器的成敗。
與其他領(lǐng)域工業(yè)控制計算機的區(qū)別在于,,星載計算機在空間飛行,,承受惡劣的空間輻照環(huán)境而且不可維修,因此,要求星載計算機在規(guī)定的時間內(nèi)必須具有高可靠性:出現(xiàn)單故障不影響任務(wù)的執(zhí)行,,出現(xiàn)雙故障情況下不應(yīng)該對飛行器和航天員造成危險,。而且星載計算機必須具有很高的故障檢查覆蓋率,并且能夠快速實現(xiàn)故障的自動檢測,、隔離和恢復(fù)(FDIR),。
本文以某星載計算機的可靠性設(shè)計為背景,介紹了可靠性設(shè)計與分析技術(shù)在星載計算機設(shè)計中的應(yīng)用,,特別是FMECA分析技術(shù),、抗輻照設(shè)計技術(shù)和結(jié)構(gòu)力學(xué)分析與設(shè)計技術(shù)、ESD防護技術(shù),。
1 星載計算機的組成與功能
星載計算機的主要功能是負責采集互聯(lián)部件的狀態(tài)和信息,,根據(jù)設(shè)定的算法進行互聯(lián)部件的控制,確保特定功能的可靠實現(xiàn),。星載計算機屬于典型的嵌入式計算機,,一般采用冗余備份設(shè)計以提高可靠性。圖1描述了一臺典型的的星載計算機的組成,。該星載計算機采用雙機冷備份容錯結(jié)構(gòu),,由OBCA、OBCB,、FT板,、PDUA、PDUB、總線背板和機箱組成,,其中, PDUA中各功能板和PDUB中對應(yīng)功能板完全一致,負責星載計算機內(nèi)部電源的分配,、切換。OBCA和OBCB是完全相同的兩個單機,,每個單機包括以高可靠性處理器為核心的嵌入式計算機系統(tǒng),。FT模塊為星載計算機的核心單元,負責故障的檢測,、單機切換,、當班仲裁等容錯功能的實現(xiàn)。
?
星載計算機屬于關(guān)鍵項目產(chǎn)品,,對任務(wù)成敗至關(guān)重要,。可靠性工作貫穿方案設(shè)計,、詳細設(shè)計,、生產(chǎn)、試驗等各個環(huán)節(jié),。
在星載計算機的設(shè)計過程中,,需要開展FMECA、抗輻照設(shè)計,、ESD防護,、EMC設(shè)計、結(jié)構(gòu)力學(xué),、熱設(shè)計與分析以及可靠性預(yù)計等工作,。在試驗階段需要完成各種環(huán)境試驗,包括應(yīng)力篩選,、力學(xué)振動和沖擊,、熱真空和真空放電、熱循環(huán)和高低溫老煉,、熱平衡試驗以及EMC試驗,。只有通過上述試驗的星載計算機,才能參與飛行任務(wù),。
本文主要從FMECA,、抗輻照設(shè)計、結(jié)構(gòu)力學(xué),、熱設(shè)計與分析以及可靠性預(yù)計等方面介紹星載計算機的可靠性設(shè)計與分析工作,。
2 FMECA
故障模式、影響及危害性分析FMECA(Failure Mode,,Effects and Criticality Analysis)是在工程實踐中總結(jié)出來的,,以故障模式為基礎(chǔ),以故障影響或后果為中心,根據(jù)分析層次,,并通過因果關(guān)系推理,、歸納進行的分析活動。
?FMECA通過逐一分析星載計算機各組成部分的故障對系統(tǒng)整體工作的影響,,可以得到產(chǎn)品的I、II類故障清單,,單點失效清單以及可靠性關(guān)鍵項目清單,,從而識別出設(shè)計中的薄弱環(huán)節(jié)和關(guān)鍵項目,并為評價星載計算機及其各組成部分設(shè)計的可靠性提供參考和依據(jù),。同時,,適時地、有效地應(yīng)用FMECA技術(shù),,還能夠為預(yù)防和控制故障,、改進產(chǎn)品設(shè)計和生產(chǎn)工藝、降低研制風(fēng)險提供有價值的信息,。實施FMECA 的步驟如圖2所示,。
FMECA是一個反復(fù)循環(huán)迭代的過程,其原理應(yīng)作為設(shè)計人員的基本思維方式,,貫穿整個設(shè)計過程,。FMECA的結(jié)果應(yīng)隨研制工作的進展加以更新。FMECA還特別強調(diào)“事前預(yù)防”,,即盡可能在產(chǎn)品設(shè)計確定之前實施分析和改進,,以最大限度地降低故障危害。
FMECA包括故障模式及影響分析(FMEA)和危害性分析(CA)兩部分內(nèi)容,。FMEA的基本分析方法包括硬件分析法和功能分析法,。硬件分析法是目前星載計算機研制中實施FMEA的主要分析方法。該方法列出每個獨立的硬件產(chǎn)品,,分析每個硬件可能的故障模式及其影響,,一般是以自下而上的方式進行,分析從最低層次產(chǎn)品開始,,逐級向上,。CA是FMEA的擴展和繼續(xù),因此,,它要求在FMEA結(jié)果的基礎(chǔ)上進行,。CA的內(nèi)容是根據(jù)每一個故障模式所造成后果的嚴酷度類別及故障模式的發(fā)生可能性,對其進行綜合度量并排序,。
3 抗輻射設(shè)計與分析
空間輻射是造成航天器電子設(shè)備異?;蚬收系闹匾颍瑖鴥?nèi)外對航天故障的統(tǒng)計顯示:40%左右的故障源自太空輻射[1]??臻g輻射對星載計算機影響較大的輻射效應(yīng)主要有:總劑量效應(yīng),、單粒子效應(yīng)和高能電子的內(nèi)帶電效應(yīng)。
3.1 總劑量效應(yīng)防護
總劑量效應(yīng)一般指“電離總劑量效應(yīng)”,,即空間帶帶電粒子入射到吸收體后,,產(chǎn)生電離作用,吸收體通過原子電離而吸收入射粒子能量,,從而使對電子元器件及材料產(chǎn)生總劑量損傷,。目前在星載計算機設(shè)計過程中采取的措施包括:
(1) 電子元器件選用。在條件允許的情況下,,盡量選用自身耐輻射總劑量能力高于其使用位置的輻射劑量分析值的元器件,,這是提高產(chǎn)品抗總劑量能力的首選方法,可以從根本上提升產(chǎn)品的抗輻射電離總劑量能力,。
(2) 總劑量局部屏蔽防護,。根據(jù)輻射屏蔽防護的原理,可針對產(chǎn)品的輻射敏感區(qū)域或元器件,,在局部采用具有一定質(zhì)量面密度的屏蔽材料(如鉭等),,使該敏感區(qū)域內(nèi)的輻射總劑量得到一定程度衰減。
(3) 多機冷備份交替工作,。研究表明,,電子元器件在加電偏置與不加電偏置的狀態(tài)下,受輻射損傷的程度不同,,有的元器件在加電偏置狀態(tài)更易受損傷,,而有的元器件則相反。根據(jù)這種現(xiàn)象,,在產(chǎn)品設(shè)計時可以采用多機冷備份,,使其交替工作,每個單機工作的時間應(yīng)小于其受輻射劑量而失效的時間,。這樣就能保證任何一臺單機都不會工作在最易受輻射損傷的狀態(tài),,從而延長產(chǎn)品在空間輻射環(huán)境下的使用壽命。
(4) 系統(tǒng)容差設(shè)計,。電子元器件遭受電離總劑量損傷時,,往往最先表現(xiàn)為某些性能參數(shù)的漂移。而系統(tǒng)往往在某些元器件參數(shù)漂移達到一定程度時才發(fā)生故障,。因此,,在系統(tǒng)設(shè)計時,采用良好的容差設(shè)計,,就能夠使系統(tǒng)在遭受較大總劑量輻射,,某些元器件已經(jīng)開始出現(xiàn)參數(shù)漂移的情況下,,仍然能夠正常工作,最大程度地挖掘系統(tǒng)的抗總劑量輻射的潛力,。
(5) 空間輻射劑量分析,。在星載計算機產(chǎn)品設(shè)計過程中,要保證產(chǎn)品能夠耐受軌道空間輻射劑量,,首先應(yīng)對產(chǎn)品在壽命期內(nèi)所受的輻射劑量進行分析和估算,,以確定該產(chǎn)品抗總劑量效應(yīng)設(shè)計的目標,避免設(shè)計不足和過設(shè)計,。
3.2 單粒子效應(yīng)防護設(shè)計
單粒子效應(yīng)是單個高能質(zhì)子或重離子入射到電子器件上所引發(fā)的輻射效應(yīng),,根據(jù)效應(yīng)機理的不同,分為單粒子翻轉(zhuǎn)(SEU),、單粒子鎖定(SEL)、單粒子燒毀(SEB),、單粒子?xùn)艙舸?SEGR)等多種類型,,其中影響星載計算機的效應(yīng)主要是單粒子翻轉(zhuǎn)和單粒子鎖定。星載計算機主要從以下幾個方面進行防護設(shè)計:
(1) 電子元器件選用,。選用具有抗單粒子效應(yīng)能力的加固器件,,可以從根本上大幅度提高航天器電子系統(tǒng)的單粒子效應(yīng)防護能力。
(2) 存儲器單粒子翻轉(zhuǎn)防護,。星載計算機存儲器的抗單粒子翻轉(zhuǎn)設(shè)計應(yīng)遵循以下原則:重要程序和數(shù)據(jù)以及不再更改的程序放在ROM存儲器中,;采用EDAC(Error Detected And Corrected)技術(shù)對重要數(shù)據(jù)存儲器進行SEU防護;采用三重冗余存儲及表決系統(tǒng)對存儲的數(shù)據(jù)進行保護,。
(3) 控制器件單粒子翻轉(zhuǎn)防護:采用多級冗余和容錯系統(tǒng),;采用看門狗電路(WDT);軟件自診斷程序,;程序卷回,;程序模塊間隔離;建立健康和安全模式,;地面遙控注入,。
(4) 單粒子鎖定(SEL)防護設(shè)計:采用CMOS/SOS或CMOS/SOI器件,其工藝特性保證不會發(fā)生單粒子鎖定效應(yīng),;電源端限流,,抑制鎖定發(fā)生或減輕鎖定造成的危害;定時監(jiān)視,,可解決單粒子引起的微鎖定問題,;多機系統(tǒng)單獨供電,以避免鎖定危害擴大,;遙控斷電能力,,通過斷電來解除鎖定,。
3.3 高能電子的內(nèi)帶電效應(yīng)防護設(shè)計
空間高通量高能電子(主要是能量大于1 MeV的電子)穿透航天器的蒙皮、結(jié)構(gòu)及設(shè)備外殼,,在航天器內(nèi)部的電路板,、導(dǎo)線絕緣層等深層絕緣介質(zhì)中堆積電荷,造成介質(zhì)深層帶電,,即所謂的內(nèi)帶電效應(yīng),。只需嚴格遵循一定的防護原則,內(nèi)帶電效應(yīng)的防護就能獲得滿意的效果,。采取的措施包括:
(1) 采用足夠厚度的屏蔽,,阻擋引發(fā)內(nèi)帶電的高能電子,以減少內(nèi)帶電效應(yīng)的發(fā)生,。
(2) 所有航天器結(jié)構(gòu)必須接地良好,,尤其絕緣性能較好的部件。
(3) 所有電路板應(yīng)設(shè)置與航天器結(jié)構(gòu)相連的接地路徑,,以提供良好的電荷泄放路徑,。
(4) 在航天器上限制使用絕緣性能良好的介質(zhì)材料,尤其不要大面積使用,。
(5) 介質(zhì)材料須具備一定的導(dǎo)電性,,以增加累計電荷的泄放能力,當介質(zhì)材料的電阻率小于1012 Ω.cm時,,可有效防止內(nèi)帶電效應(yīng)發(fā)生,。
4 結(jié)構(gòu)力學(xué)分析
從航天器發(fā)射到入軌之間的這段時間內(nèi),星載計算機要承受很大的振動和沖擊,,因此,在結(jié)構(gòu)設(shè)計方面對星載計算機提出了更高的要求,。
為了對星載計算機的機箱結(jié)構(gòu)設(shè)計進行初步的分析和評價,以產(chǎn)品的鑒定級試驗條件作為輸入?yún)?shù),,使用有限元分析軟件ANSYS對星載計算機整機級和印制板組件級進行結(jié)構(gòu)靜力和動力分析,,得到印制板組件的基頻、整機的基頻以及整機和印制板組件的靜動力的應(yīng)力和應(yīng)變響應(yīng)情況,,進而對結(jié)構(gòu)和電路板進行了安全裕度計算和分析結(jié)果評價,,根據(jù)其評價結(jié)果對設(shè)計進行優(yōu)化。
有限元分析法就是將連續(xù)的結(jié)構(gòu)離散化,,把結(jié)構(gòu)劃分成有限個單元體,,將相鄰單元在單元體的節(jié)點處連接起來形成一個與原來結(jié)構(gòu)構(gòu)形相同的有限單元組成的網(wǎng)絡(luò)結(jié)構(gòu)。利用單元的力學(xué)性能和質(zhì)量特性參數(shù),,求得結(jié)構(gòu)的剛度矩陣和質(zhì)量矩陣,。在給定的整體邊界條件下輸入結(jié)構(gòu)載荷,用迭代計算求解結(jié)構(gòu)力學(xué)方程,,即可求得所需的分析數(shù)據(jù),,如結(jié)構(gòu)的前m階固有頻率,、節(jié)點的響應(yīng)加速度、單元的應(yīng)力等,。針對星載計算機設(shè)備結(jié)構(gòu)設(shè)計而言,,用有限元法分析技術(shù)主要進行如下分析工作:
(1) 靜力分析。在飛行過載條件下,,分析設(shè)備結(jié)構(gòu)的應(yīng)力和變形,,以對產(chǎn)品結(jié)構(gòu)進行強度校核。
(2) 模態(tài)分析,。分析機箱與電路板組件的模態(tài)頻率和振型,,為合理設(shè)計電路板組件和機箱的結(jié)構(gòu)、尺寸和邊界的支撐連接提供依據(jù),。
(3) 動力分析,。在規(guī)定的外力載荷或試驗的環(huán)境載荷條件下,分析機箱與電路板組件的各關(guān)心部位的響應(yīng)情況,,為合理設(shè)計機箱和電路板組件的結(jié)構(gòu),、尺寸、邊界的支撐連接和調(diào)整元器件布局提供依據(jù),。圖3和圖4描述了不同工況下的力學(xué)分析云圖。
5 熱設(shè)計與分析
電子產(chǎn)品的熱設(shè)計是指在給定的邊界條件下,,通過調(diào)節(jié)元器件散熱路徑和熱阻,,或采用冷卻、加熱或恒溫控制等措施,,將元器件工作時產(chǎn)生的廢熱傳給機箱殼體或周圍環(huán)境,,保證電子產(chǎn)品及其元器件能夠正常工作的設(shè)計技術(shù)。
航天電子產(chǎn)品與普通電子產(chǎn)品熱設(shè)計的主要區(qū)別就在于航天電子產(chǎn)品絕大多數(shù)都工作在真空環(huán)境下,,因此基本不存在空氣對流散熱的熱傳導(dǎo)路徑,。根據(jù)航天電子產(chǎn)品的工作環(huán)境及特點,其熱設(shè)計應(yīng)遵循以下基本原則:
(1) 元器件選擇,。應(yīng)優(yōu)先選擇耐溫范圍寬的元器件,、功耗低和熱阻較低的元器件。
(2) 元器件布局,。元器件的布局應(yīng)力求熱功耗分布均衡,,避免局部區(qū)域熱功耗過于集中;熱功耗大的元器件,,應(yīng)與機箱殼體有良好的散熱路徑,。
(3) 元器件安裝。增大元器件與印制板的接觸面積,,降低接觸表面的粗糙度,,增大接觸壓力,,在接觸界面間填充導(dǎo)熱填料是減小安裝面接觸熱阻的有效途徑;為減小傳導(dǎo)熱阻,,熱功耗大的元器件也可借助于導(dǎo)熱條,、導(dǎo)熱板或?qū)峁苌帷?BR> 為驗證熱設(shè)計的有效性,盡早找出熱設(shè)計中的薄弱之處,,一般在產(chǎn)品設(shè)計初期應(yīng)對產(chǎn)品進行熱分析:根據(jù)熱設(shè)計輸入條件,,利用Flotherm軟件建立印制板和電子產(chǎn)品整機的熱分析模型,計算電子元器件的溫度,,檢查元器件的結(jié)溫(或殼溫)是否低于允許的值,。必要時,對產(chǎn)品進行熱平衡試驗,,驗證并修改整機的熱分析模型,。圖5和圖6分別描述了某星載計算機整機和某單板溫度云圖。
6 可靠性預(yù)計
可靠性預(yù)計是定量地估算設(shè)備或系統(tǒng)設(shè)計是否滿足規(guī)定的可靠性要求的過程,。預(yù)計結(jié)果可給出影響可靠性的因素,,為設(shè)計決策提供產(chǎn)品可靠性的相對度量,作為決策依據(jù)之一,。在研制階段的早期進行可靠性預(yù)計是最有用,、最經(jīng)濟的??煽啃灶A(yù)計是產(chǎn)品設(shè)計的一部分,。
可靠性預(yù)計步驟流程圖如圖7所示??煽啃灶A(yù)計的主要目的是對系統(tǒng),、分系統(tǒng)及設(shè)備的可靠性進行預(yù)測,以確定設(shè)計是否能滿足規(guī)定的可靠性要求,,是否需要對設(shè)計進行適當?shù)男薷?。可靠性預(yù)計是從可靠性角度出發(fā),,對不同的設(shè)計方案進行比較,,為設(shè)計決策提供依據(jù);發(fā)現(xiàn)設(shè)計中的薄弱環(huán)節(jié),,為設(shè)計改進或生產(chǎn)過程控制以及可靠性試驗方案設(shè)計提供依據(jù),。可靠性預(yù)計步驟如下:
(1) 根據(jù)系統(tǒng)組成及功能,,建立系統(tǒng)可靠性模型,,確定任務(wù)階段應(yīng)力和環(huán)境因素。
(2) 元器件清單:系統(tǒng)各設(shè)備,、功能模塊所包含的元器件類型,、數(shù)量,、質(zhì)量等。
(3) 元器件熱分析及應(yīng)力分析:得到可靠性預(yù)計元器件應(yīng)力分析法所需要的溫度,、電應(yīng)力等信息,。
(4) 根據(jù)元器件失效率手冊收集可靠性預(yù)計用數(shù)據(jù)源:如采用美軍標MIL-HDBK-217F 收集元器件失效率預(yù)計有關(guān)的數(shù)據(jù)。
(5) 元器件失效率預(yù)計:根據(jù)相關(guān)標準規(guī)范(如美軍標MIL-HDBK-217F)進行預(yù)計,,或根據(jù)實際經(jīng)驗和試驗數(shù)據(jù)確定,。
(6) 按可靠性模型預(yù)計系統(tǒng)可靠性:根據(jù)任務(wù)時間、環(huán)境因子等逐級進行預(yù)計,,直至系統(tǒng),。
(7) 檢驗與系統(tǒng)要求的一致性:預(yù)計結(jié)果滿足要求,則預(yù)計結(jié)束,;否則,,指出可靠性薄弱環(huán)節(jié),提出設(shè)計改進建議,,待設(shè)計改進完成后再重新進行可靠性預(yù)計,,直至滿足任務(wù)要求。
以某型號的雙機冷備份星載計算機為例,,其可靠性預(yù)計采用“元器件應(yīng)力分析預(yù)計法”,,其元器件失效率計算依據(jù)是《電子設(shè)備可靠性預(yù)計手冊——美軍標MIL-HDBK -217F》,采用了Relex Reliability Software V7.6進行計算,。圖8是某星載計算機的可靠性模型,。按照工作壽命2年進行計算,計算結(jié)果如圖9所示,可靠度R=0.994 749,滿足星載計算機可靠性指標要求,。
?
本文介紹了星載計算機設(shè)計過程中采用的可靠性設(shè)計和分析方法,通過這些方法提高了星載計算機的可靠性,,確保了星載計算機在軌飛行的可靠與安全,。這些方法不僅適合星載計算機的設(shè)計與分析,對其他工業(yè)領(lǐng)域的工業(yè)控制計算機的可靠性設(shè)計也具有借鑒意義,。
參考文獻
[1] ?BEDINGFIELD K, LEACJ R, ALEXANDER M. Spacecraft ?system failures and anomalies attributed to the natural?space environment. NASA Reference Publication-1390,?August, 1996.
[2] ?航天器電子產(chǎn)品可靠性設(shè)計.航天科技集團五院科研質(zhì)量部.
[3] ?Design guidelines for assessing and controlling spacecraft?charging effects. NASA Technical Paper, 2361.
[4] ?GJB 1649-93. 電子產(chǎn)品防靜電放電控制大綱,,1993.
[5] ?衛(wèi)星可靠性設(shè)計指南.中華人民共和國航天行業(yè)標準QJ2172A, 2005.