文獻(xiàn)標(biāo)識碼: A
DOI:10.16157/j.issn.0258-7998.172872
中文引用格式: 劉雪峰,,馬州生,,趙艷陽,等. 基于MSE-PCA的腦電睡眠分期方法研究[J].電子技術(shù)應(yīng)用,,2017,,43(9):22-24,29.
英文引用格式: Liu Xuefeng,,Ma Zhousheng,,Zhao Yanyang,et al. Research on sleep staging method of EEG based on MSE-PCA[J].Application of Electronic Technique,,2017,,43(9):22-24,,29.
0 引言
隨著現(xiàn)代生活節(jié)奏的逐步加快,,人們生活壓力的不斷加大,由睡眠問題引起的疾病越來越多,,所以基于交叉學(xué)科發(fā)展起來的睡眠醫(yī)學(xué),,得到了很多醫(yī)學(xué)研究機(jī)構(gòu)以及高校的關(guān)注,致力于了解機(jī)體睡眠過程并解決睡眠功能障礙[1],。目前,,在睡眠醫(yī)學(xué)領(lǐng)域內(nèi)有人工睡眠分期和自動睡眠分期兩種方法來分析睡眠過程,人工睡眠分期方法需要專家親臨現(xiàn)場分析,,該方法會因?yàn)榭陀^原因以及專家主觀原因?qū)е抡`判率高,。自動睡眠分期方法是目前睡眠醫(yī)學(xué)領(lǐng)域內(nèi)主要的睡眠分析方法,該方法需要建立算法處理模型,,對睡眠過程進(jìn)行有效的特征提取和分類,,常用的方法有樣本熵(Sample Entropy,SE)[2],、Hilbert-huang變換(HHT)[3],、離散小波變換(Discrete Wavelet Transform,DWT)[4]等,,但是SE運(yùn)行速度較慢,,不適合大量數(shù)據(jù)的處理;HHT存在端點(diǎn)效應(yīng),、模態(tài)混疊,;DWT無法提取信號的非線性特征等問題,。所以本文提出使用多尺度熵(Multi-scale Entropy,MSE)和主成分分析(Principe Component Analysis,,PCA)的復(fù)合算法進(jìn)行特征提取和降維,,并在此基礎(chǔ)上采用反饋神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network,BPNN)實(shí)現(xiàn)對EEG睡眠狀態(tài)的非線性映射和高分期準(zhǔn)確率,,同時(shí),,多尺度熵和主成分分析融合方法也是首次應(yīng)用到自動睡眠分期領(lǐng)域,為自動睡眠分期提供了新的思路,。
1 材料與方法
1.1 數(shù)據(jù)的獲取和預(yù)處理
仿真數(shù)據(jù)來自MIT-BIH生理信息庫中Sleep-EDF的8組腦電(Electroencephalogram,,EEG)實(shí)測數(shù)據(jù),其中4組健康志愿者的睡眠數(shù)據(jù)(sc4002e0,,sc4012e0,,sc4102e0,sc4112e0),,另外4組是有輕微失眠志愿者的睡眠數(shù)據(jù)(st7022j0,,st7052j0,st7121j0,,st7132j0),,均采用Fpz-Cz導(dǎo)聯(lián)方式。受試者包括男性和女性,,年齡在21~35歲,,未使用任何藥物干擾,采樣率均為100 Hz,。數(shù)據(jù)庫中每30 s EEG信號的睡眠分期結(jié)果已由經(jīng)驗(yàn)豐富的睡眠專家人工標(biāo)注[5],。
本文首先使用小波濾波方法實(shí)現(xiàn)對原始EEG信號去噪,根據(jù)EEG頻率范圍0.5~40 Hz,,采用db4小波基和分解層數(shù)為8的自適應(yīng)小波濾波,。濾波完成后根據(jù)專家的分期結(jié)果將睡眠EEG數(shù)據(jù)(30 s)分為清醒期(Awake)、淺睡期(Light Sleep,,LS),、深睡期(或慢波睡眠期Slow Wave Sleep,SWS)和快速眼動期(Rapid eyes movement,,REM)共4個集合,為模式分類提供先驗(yàn)知識[6],。
1.2 多尺度熵
多尺度熵(MSE)是基于樣本熵(SE)在不同尺度下的非線性分析方法,,它能夠描述信號在不同尺度下的復(fù)雜度和相關(guān)性[7]。在睡眠分期特征提取中,,通過計(jì)算EEG不同尺度的熵值來反映不同睡眠期之間的非線性特征,。
假設(shè)數(shù)據(jù)樣本為N的某一離散時(shí)間序列{Xi}={x1,,x2,…,,xN},,嵌入維數(shù)m和相似容限r(nóng)(根據(jù)MSE的應(yīng)用研究,在實(shí)驗(yàn)中優(yōu)先選擇m=2,,r=0.15SD[8]),,原始數(shù)據(jù)的樣本熵為:
1.3 PCA降維
上述方法中采集到的多尺度熵值為睡眠期(30 s睡眠數(shù)據(jù))在增加單位尺度的樣本熵值,即一個維數(shù),。而EEG信號中包含大量的睡眠期,,當(dāng)增加過多尺度時(shí),MSE維度過高將導(dǎo)致睡眠期的自動識別和運(yùn)行速度上存在較大難度,,因此本文采用主成分分析法(PCA)對MSE特征進(jìn)行降維處理,。
PCA作為一種多元統(tǒng)計(jì)分析技術(shù),首先對數(shù)據(jù)去相關(guān),,根據(jù)方差最大化原理,,通過正交變換將原變量轉(zhuǎn)換為一組線性不相關(guān)的主成分變量,壓縮變量個數(shù),,最大化保存有效信息的同時(shí)剔除冗余信息,,實(shí)現(xiàn)對數(shù)據(jù)的降維,一般主成分的選取標(biāo)準(zhǔn)是累計(jì)貢獻(xiàn)率達(dá)到80%以上[9-10],。
1.4 分類算法
反饋神經(jīng)網(wǎng)絡(luò)(BPNN)的基本思想是根據(jù)最速下降法,,對網(wǎng)絡(luò)權(quán)值和閾值的不斷調(diào)整,得到最小的網(wǎng)絡(luò)誤差平方和實(shí)現(xiàn)反向傳播,。在分類模型中,,BPNN將PCA所包含主要信息的主成分作為輸入?yún)?shù),通過BP算法訓(xùn)練和實(shí)現(xiàn)對4種睡眠期的自動識別分類,。
BPNN的節(jié)點(diǎn)輸出為:
式(1)中xi是節(jié)點(diǎn)輸入,,wij為輸入節(jié)點(diǎn)j至隱含層節(jié)點(diǎn)i的連接權(quán)值,θj是隱含層節(jié)點(diǎn)的閾值,,f是激活函數(shù),,一般選用Sigmoid函數(shù),yj是隱含層節(jié)點(diǎn)的輸出,,其結(jié)果為4種睡眠狀態(tài),。
2 實(shí)驗(yàn)結(jié)果
2.1 多尺度熵結(jié)果
序列的熵指數(shù)可以表征序列的復(fù)雜程度[9],圖1為樣本(sc4002e0,,sc4012e0,,st7022j0,st7052j0)的Awake、LS,、SWS和REM四種睡眠期的多尺度熵值曲線,,其結(jié)果在整體趨勢上區(qū)別相對明顯。同時(shí),,在相同尺度下,,Awake、REM,、LS,、SWS的熵值逐漸遞減,說明睡眠程度的加深與腦電信號的復(fù)雜程度呈負(fù)相關(guān)的變化趨勢,,其在特定尺度t下的主要統(tǒng)計(jì)分布如圖2所示,。圖2顯示出4種尺度下睡眠期的統(tǒng)計(jì)分布與MSE的結(jié)果保持一致,并且睡眠階段之間存在顯著性差異,,因此多尺度熵可以區(qū)分四種不同的睡眠階段,。根據(jù)統(tǒng)計(jì)結(jié)果,為了不丟失信號的有效成分,,采用尺度1-13的MSE值表征腦電EEG不同睡眠期的主要非線性動力學(xué)特征,。
2.2 PCA降維結(jié)果
為實(shí)現(xiàn)進(jìn)一步對四種睡眠期的識別分類,采用PCA對MSE特征進(jìn)行降維分析[11],。通過MSE方法對EEG信號進(jìn)行非線性特征提取,,得到13個尺度下Awake、LS,、SWS和REM的熵值特征,,利用PCA對該特征進(jìn)行降維,保證降低數(shù)據(jù)冗余的同時(shí)保留絕大多數(shù)EEG非線性特征,,各成分所對應(yīng)的累計(jì)貢獻(xiàn)率如圖3所示,。
由圖3可知PCA前兩個主成分的累計(jì)貢獻(xiàn)率達(dá)到93.1%,表明它們已經(jīng)包含了原變量的主要信息,。因而選用PCA的前兩個向量作為新的特征向量,,代替原變量13個尺度的MSE特征,實(shí)現(xiàn)特征降維,。
當(dāng)利用前2個主成分向量取代MSE特征,,測試集樣本為sc4002e0,sc4012e0,,st7022j0,,st7052j0的60組熵值特征,其中包含Awake,、LS,、SWS和REM各15組,PCA降維后的前2個主成分得分圖如圖4所示[10]。圖4顯示四種睡眠階段的熵值特征分布區(qū)域較為明顯,,說明通過前兩個主成分已可以完全區(qū)分四種睡眠狀態(tài)。
2.3 BPNN分類結(jié)果
將受試者的1500個測試睡眠期輸入已訓(xùn)練的BPNN分類模型,,自動睡眠分期與專家人工分期的對比如圖5所示,,其結(jié)果的詳細(xì)數(shù)據(jù)如表1。其中,,專家分期結(jié)果在數(shù)據(jù)庫中已由臨床經(jīng)驗(yàn)豐富的專家人工識別分類標(biāo)注,,該結(jié)果可以作為自動睡眠分期模型的性能評測依據(jù)。
3 討論
本研究通過MSE算法提取EEG信號的非線性動力學(xué)特征,,利用PCA降維和BPNN分類,,建立一種有效的自動睡眠分期方法。在表1中顯示出本文模型相對于專家人工分期結(jié)果,,自動分期模型Awake,、LS、SWS和REM的識別準(zhǔn)確率均在85%以上,,平均準(zhǔn)確率為87.9%,,相比同類研究,達(dá)到較高的分期準(zhǔn)確率,。通過與專家分期結(jié)果的一致性檢測,,模型的kappa系數(shù)保持在了0.77,表明本文方法的自動分期結(jié)果相對于專家分期結(jié)果已達(dá)到高度的一致性,,系統(tǒng)魯棒性強(qiáng),。
本文主要對比了AARON等人[2]、GUO等人[3],、謝等人[4]提出的自動睡眠分期方法,,自動睡眠分期方法的對比如表2所示。發(fā)現(xiàn)本文所提方法對EEG信號睡眠階段的分類準(zhǔn)確性較高,,同時(shí)PCA降低了系統(tǒng)的復(fù)雜性,,模型的結(jié)構(gòu)更為簡單提升了系統(tǒng)的穩(wěn)定性。
4 結(jié)論
由于生理信號的特征提取和分類算法較為復(fù)雜,,自動睡眠分期的準(zhǔn)確率沒有得到較大的提升,。本文將MIT-BIH腦電EEG信號作為睡眠分期的生理數(shù)據(jù)樣本,通過MSE-PCA模型將前2個主成分向量替代睡眠階段的多尺度熵特征,,不僅提取了EEG的非線性動力學(xué)特征,,降低了模型的復(fù)雜性,而且更利于BPNN分類器對睡眠期的訓(xùn)練和分類,。同時(shí),,自動分期的結(jié)果與數(shù)據(jù)庫中的專家判定達(dá)到高度的一致性,說明MSE-PCA的融合方法能有效實(shí)現(xiàn)對EEG非線性特征的提取和降維,對睡眠過程的分析和研究有較大幫助,。
參考文獻(xiàn)
[1] 高群霞,,周靜,吳效明.基于腦電信號的自動睡眠分期研究進(jìn)展[J].生物醫(yī)學(xué)工程學(xué)雜志,,2015,,32(05):1155-1159.
[2] AARON R S,LIANG C K.A study on sleep EEG using sample entropy and power spectrum analysis[C].Defense Science Research Conference and Expo(DSR),,Singapore,,2011:1-4.
[3] GUO C,LU F,,LIU S,,et al.Sleep EEG staging based on Hilbert-Huang Transform and Sample Entropy[C].International Conference on Computational Intelligence and Communication Networks(CICN),Jabalpur,,2015:442-445.
[4] 謝宏,,施小南.基于離散小波變換的腦電信號睡眠分期研究[J].微型機(jī)與應(yīng)用,2015,,34(432):18-20.
[5] KEMP B.The sleep-edf database online.[Online].Available:http://www.physionet.org/physiobank/database/sleep-edf/
[6] STOCHHOLM A,,MIKKELSEN K,KIDMOSE P.Automatic sleep stage classification using EEG[C].Annual International Conference of the IEEE Engineering in Medicine and Biology Society(EMBC),,Orlando,,2016:4751-4754.
[7] FRAIWAN L,LWEESY K.Newborn sleep stage identification using multi-scale entropy[C].IEEE 2nd Middle East Conference on Biomedical Engineering,,Doha,,2014:361-364.
[8] LIANG S F,KUO C E,,HU Y H,,et al.Automatic stage scoring of single-channel sleep EEG by using multi-scale entropy and autoregressive models[J].IEEE Transactions on Instrumentation and Measurement,2012,,42(13):1649-1657.
[9] 周鵬,,李向新,張翼,,等.基于主成分分析和支持向量機(jī)的睡眠分期研究[J].生物醫(yī)學(xué)工程學(xué)雜志,,2013,30(6):1176-1179.
[10] 楊靜,,王成,,謝成穎,等.基于主成分分析和反向傳播神經(jīng)網(wǎng)絡(luò)的肝癌細(xì)胞后向散射顯微光譜判別[J].生物醫(yī)學(xué)工程學(xué)雜志,,2017,,34(2):246-252.
[11] 王金甲,,周麗娜.基于PCA和LDA數(shù)據(jù)降維的腦磁圖腦機(jī)接口研究[J].生物醫(yī)學(xué)工程學(xué)雜志,2011(6):1069-1074.
作者信息:
劉雪峰1,,馬州生2,,趙艷陽3,余傳奇1,,范文兵1
(1.鄭州大學(xué) 信息工程學(xué)院,,河南 鄭州450001;2.河南省經(jīng)貿(mào)學(xué)院,,河南 鄭州450046;
3.河南工業(yè)大學(xué) 電氣工程學(xué)院,,河南 鄭州450001)