摘 要: 提出基于腦電信號(hào)(EEG)的睡眠分期研究,。利用離散小波變換(DWT)的db8小波分解得到的細(xì)節(jié)分量作為信號(hào)新的表達(dá),,把各個(gè)細(xì)節(jié)分量能量作為特征,建立帶高斯徑向基核函數(shù)(RBF)的非線性支持向量機(jī)(SVM)模型,。研究發(fā)現(xiàn),,其對(duì)睡眠分期研究的方案是可行的,滿足模型對(duì)泛化能力的要求,。
關(guān)鍵詞: 睡眠分期,;離散小波變換;支持向量機(jī)
0 引言
睡眠是人體一種非常重要且不可或缺的生理活動(dòng),,但工作壓力,、疾病,、不良的生活習(xí)慣等因素會(huì)影響人的睡眠質(zhì)量,,長(zhǎng)期睡眠質(zhì)量低下會(huì)引發(fā)各種心理、生理疾病,。依據(jù)生理信號(hào)數(shù)據(jù)自動(dòng)識(shí)別睡眠,,分期對(duì)睡眠狀態(tài)與睡眠質(zhì)量的科學(xué)評(píng)估以及相關(guān)疾病的診斷及治療有很重要的意義和參考價(jià)值。
對(duì)睡眠的研究往往是基于相關(guān)生理數(shù)據(jù),。在清醒和不同睡眠階段,,人的腦電信號(hào)(Electroencephalogram,EEG)在不同的腦區(qū)會(huì)出現(xiàn)不同的節(jié)律變化分布,,可以表征人體的不同睡眠階段,。參考文獻(xiàn)[1-3]提取最小值、最大值,、均值,、標(biāo)準(zhǔn)差等頻域特征和排列組合熵、樣本熵等非線性動(dòng)力學(xué)參數(shù),,但其樣本較少,,模型推廣性能不足,。參考文獻(xiàn)[4]分別使用Choi–Williams分布、連續(xù)小波變換和Hilbert-Huang變換(Hilbert-Huang Transform,,HHT)提取特征,,利用隨機(jī)森林分類器說(shuō)明不同方法提取特征對(duì)分類器的準(zhǔn)確率有一定影響,其中使用CWT提取特征的分類器準(zhǔn)確率最高,。參考文獻(xiàn)[5-6]分別建立復(fù)發(fā)性神經(jīng)分類器和支持向量機(jī)(Support Vector Machine,,SVM)模型,對(duì)非快速眼動(dòng)深睡期沒有細(xì)分,。而參考文獻(xiàn)[7]使用EEG各個(gè)節(jié)律波頻帶的相對(duì)功率作為特征,,所建立的SVM模型準(zhǔn)確率高于神經(jīng)網(wǎng)絡(luò)(Neural Network,NN)模型,,該研究只是將睡眠分為4個(gè)階段,,未具體區(qū)分非快速眼動(dòng)睡眠各個(gè)階段,且清醒期的識(shí)別率偏低,,并沒有突出提高清醒期識(shí)別率的基礎(chǔ)作用,。參考文獻(xiàn)[8]研究了25位受試者睡眠EEG、眼電(Electrooculogram,,EOG)和肌電(Electromyogram,,EMG)信號(hào),提取特征后在深度信念網(wǎng)絡(luò)(Deep Belief Networks,,DBN)基礎(chǔ)上建立的馬爾科夫模型準(zhǔn)確率高于未提取特征的模型準(zhǔn)確率,,說(shuō)明提取特征是建立模型的重要步驟。由于樣本來(lái)自疑似睡眠呼吸障礙者,,該模型具有較強(qiáng)的針對(duì)性和局限性,。
由于人的生理信號(hào)存在個(gè)體差異,當(dāng)被試者人數(shù)增加時(shí)與信號(hào)特征離散性增大,,而導(dǎo)致模型的推廣能力下降,。本文使用Sleep-EDF數(shù)據(jù)庫(kù)EEG Fpz-Cz、EEG Pz-Oz這2個(gè)通道的數(shù)據(jù),。采樣頻率為100 Hz,,由專家根據(jù)R&K標(biāo)準(zhǔn)[9],基于經(jīng)驗(yàn)標(biāo)定受試者每30 s區(qū)間的狀態(tài),。R&K標(biāo)準(zhǔn)將睡眠分為6個(gè)階段,,分別是清醒期(Wake)、非快速眼動(dòng)期(Non-Rapid Eye Movement,,NREM)和快速眼動(dòng)期(Rapid Eye Movement,,REM),其中NREM又可分為淺睡期(包括NREM1,、NREM2)和深睡期(包括NREM3,、NREM4),。
1 離散小波變換
利用EEG將睡眠分期的關(guān)鍵是對(duì)能表征各個(gè)睡眠階段的特征進(jìn)行提取。受試者在長(zhǎng)時(shí)間的測(cè)試過(guò)程中,,電極松動(dòng)或移動(dòng)會(huì)帶來(lái)基線漂移,,而對(duì)頻譜圖的研究發(fā)現(xiàn),低頻信號(hào)的幅值相對(duì)較大,,尤其以1 Hz以內(nèi)的幅值最為顯著,,據(jù)此可以判斷,信號(hào)主要存在基線漂移現(xiàn)象,。通過(guò)離散小波變換處理數(shù)據(jù),,在消除基線漂移之后提取各個(gè)分量的能量作為模型特征。
小波變換是在傅里葉變換的基礎(chǔ)上發(fā)展起來(lái)的一種時(shí)頻分析方法,,在處理非平穩(wěn)信號(hào)方面,,具有良好的時(shí)頻特性。由于實(shí)驗(yàn)采集到的信號(hào)大多是經(jīng)過(guò)采集系統(tǒng)采集的離散數(shù)據(jù),,因此離散小波變換的應(yīng)用非常廣泛[10],。將信號(hào)f(t)進(jìn)行k尺度離散小波變換,計(jì)算公式如下:
原始時(shí)域信號(hào)經(jīng)由離散小波變換得到逼近分量 Ai(t)和細(xì)節(jié)分量Di(t)(i=1,,2,,...,k),。本文使用db8小波分解,,分別得到細(xì)節(jié)分量Di(t)(i=1,2,,...,,8)和逼近分量A8(t)。細(xì)節(jié)分量Di(t)(i=1,,2,,...,,8)從D1(t)到 D8(t)的頻率逐次降低,。其中,D7(t)和D8(t)的頻譜主要集中在1 Hz以內(nèi),,故可以將其作為基線漂移分量,,置零即可。圖1顯示了一名受試者在REM期的EEG Fpz-Cz通道的30 s信號(hào)經(jīng)離散小波變換得到細(xì)節(jié)分量Di(t)(i=1,,2,,…,6)的頻域信號(hào),。
在不同睡眠階段,,各個(gè)細(xì)節(jié)分量的能量不同,,可以作為特征區(qū)分各個(gè)睡眠階段。本文使用細(xì)節(jié)分量Di(t)(i=1,,2,,...,6)的能量信息作為部分特征實(shí)現(xiàn)睡眠分期,。
2 非線性SVM模型分析
SVM在解決小樣本,、非線性及高維模式識(shí)別中表現(xiàn)出許多特有的優(yōu)勢(shì)。非線性SVM問題的基本思想是,,通過(guò)非線性變換,,將輸入變量x轉(zhuǎn)化到某個(gè)高維空間,然后再變換空間求最優(yōu)分類面,。非線性SVM問題的最優(yōu)化目標(biāo)是:
相應(yīng)的判決函數(shù)為:
如果y≥0,,判為一類,類別為1,;否則,,類別為-1。
式(2)和式(3)中K(xi,,x)為核函數(shù),,本文選擇使用了高斯徑向基核函數(shù):
參數(shù)C、選擇對(duì)模型的準(zhǔn)確性有很大的影響,,本文使用了基于交叉驗(yàn)證的網(wǎng)格搜索法來(lái)進(jìn)行SVM參數(shù)尋優(yōu),。
3 實(shí)驗(yàn)結(jié)果
選取Sleep-EDF數(shù)據(jù)庫(kù)中8位受試者的數(shù)據(jù)。將6位受試者的數(shù)據(jù)作為一組,,其中的75%用來(lái)建立非線性SVM模型,,剩余的25%用來(lái)測(cè)試模型精度,驗(yàn)證模型是否出現(xiàn)過(guò)擬合問題,。利用額外2位受試者的數(shù)據(jù)測(cè)試模型的精度,,驗(yàn)證模型的泛化能力。本研究的整體流程如圖2所示,。
使用臺(tái)灣林智仁的LIBSVM作為研究平臺(tái),。模型測(cè)試精度如表1所示。
本文模型的分期平均準(zhǔn)確率為85.72%,,說(shuō)明模型沒有出現(xiàn)過(guò)擬合,。實(shí)際有以下方面對(duì)模型精度存在較大的影響:原始時(shí)域EEG信號(hào)中的干擾成分過(guò)多;專家標(biāo)定狀態(tài)本身就有一定誤差,;睡眠的各個(gè)階段是連續(xù)的,;等等。
使用已經(jīng)建立的SVM模型,將剩余2名受試者的數(shù)據(jù)經(jīng)測(cè)試對(duì)比,,平均精度為81.65%,。因此,本文的模型滿足了對(duì)泛化能力的要求,,驗(yàn)證了本研究的可行性,。
4 結(jié)論
使用腦電信號(hào)研究睡眠分期對(duì)數(shù)據(jù)預(yù)處理、降維處理,、提取特征,、分類器的選擇都是很重要的環(huán)節(jié)。本文對(duì)db8小波分解EEG得到的各個(gè)層次小波提取能量特征,,使用SVM進(jìn)行睡眠分期,。本文的模型經(jīng)過(guò)測(cè)試之后,達(dá)到比較理想的分類效果,,即具有良好的推廣能力,。
本文的研究只是基于EEG。在今后的研究中,,還有很多工作需要進(jìn)一步深入研究,,也可將其他的生理指標(biāo)引入睡眠分期的研究,如EOG,、心電(Electrocardiogram,,ECG)、EMG,,相信也會(huì)有好的研究前景,。
參考文獻(xiàn)
[1] GNE?S, POLAT K,, YOSUNKAYA . Efficient sleep stage recognition system based on EEG signal using K-means clustering based feature weighting[J]. Expert Systems with Applications,, 2010,37(12):7922-7928.
[2] 李谷,,范影樂,,龐全.基于排列組合熵的腦電信號(hào)睡眠分期研究[J].生物醫(yī)學(xué)工程學(xué)雜志,2009,,26(4):869-872.
[3] 周鵬,,李向新,張翼,,等.基于主成分分析和支持向量機(jī)的睡眠分期研究[J].生物醫(yī)學(xué)工程學(xué)雜志,,2013,,30(6):1176-1179.
[4] FRAIWAN L,, LWEESY K, KHASAWNEH N, et al. Automated sleep stage identification system based on time–frequency analysis of a single EEG channel and random forest classifier[J]. Computer Methods and Programs in Biomedicine,, 2012,,108(1):10-19.
[5] HSU Y L, YANG Y T,, WANG J S,, et al. Automatic sleep stage recurrent neural classifier using energy features of EEG signals[J]. Neurocomputing, 2013,,104:105-114.
[6] KOLEY B,, DEY D. An ensemble system for automatic sleep stage classification using single channel EEG signal[J]. Computers in Biology and Medicine, 2012,,42(12):1186-1195.
[7] LEE J,, YOO S K. Electroencephalography analysis using neural network and support vector machine during sleep[J]. Engineering, 2013(5):88-92.
[8] L?魧NGKVIST M,, KARLSSON L,, LOUTFI A. Sleep stage classification using unsupervised feature learning[J]. Advances in Artificial Neural Systems, 2012,,2012:9.
[9] RECHTSCHAFFEN A,, KALES A. A manual of standardized terminology, techniques and scoring systems for sleep stages of human subjects[M]. Los Angeles: UCLA Brain Information Service/Brain Research Institute,, 1968.
[10] OCAK H. Automatic detection of epileptic seizures in EEG using discrete wavelet transform and approximate entropy[J]. Expert Systems with Applications,, 2009, 36(2): 2027-2036.