基于EOG的睡眠分期研究-AET-電子技術應用

基于EOG的睡眠分期研究

2016年微型機與應用第13期

王丹丹，夏斌

(上海海事大學，上海 201306）

摘要： 隨著模式識別技術的發(fā)展與應用，睡眠自動分期方法正在逐漸取代手動分期研究。文章使用深度置信網(wǎng)絡（Deep Belief Network, DBN）和長短時記憶遞歸神經(jīng)網(wǎng)絡(Long ShortTerm Memory Recurrent Neural Network, LSTMRNN)這兩種方法對眼電(Electrooculogram, EOG)通道的數(shù)據(jù)進行睡眠自動分期。LSTMRNN方法(平均準確率83.4%)相對DBN(平均準確率75.6%)在基于眼電信號的睡眠分期問題上取得了更好的效果。

關鍵詞： DBN LSTM-RNN 睡眠自動分期 EOG

Abstract：

Key words :

　　王丹丹，夏斌

　　(上海海事大學，上海 201306）

　　摘要：隨著模式識別技術的發(fā)展與應用，睡眠自動分期方法正在逐漸取代手動分期研究。文章使用深度置信網(wǎng)絡（Deep Belief Network, DBN）和長短時記憶遞歸神經(jīng)網(wǎng)絡(Long ShortTerm Memory Recurrent Neural Network, LSTMRNN)這兩種方法對眼電(Electrooculogram, EOG)通道的數(shù)據(jù)進行睡眠自動分期。LSTMRNN方法(平均準確率83.4%)相對DBN(平均準確率75.6%)在基于眼電信號的睡眠分期問題上取得了更好的效果。

　　關鍵詞：DBN；LSTM-RNN；睡眠自動分期；EOG

0引言

　　睡眠與人的健康息息相關。充足的睡眠可以消除疲勞，保證日常生活的正常進行，但是由于生活節(jié)奏的加快和壓力的增大，現(xiàn)代人通常都存在不同程度的睡眠障礙。有調(diào)查顯示，成年人存在睡眠障礙的比例高達30%。睡眠障礙會導致大腦功能紊亂，對身體造成多種危害，嚴重影響身心健康。因此對睡眠狀況進行研究，了解睡眠質(zhì)量，可以及早地診斷和治療隱藏疾病。睡眠分期是將睡眠過程分為不同的狀態(tài)。根據(jù)參考文獻［1］，睡眠過程分為三種狀態(tài)：清醒狀態(tài)(Awake)、非眼球快速運動睡眠狀態(tài)(NonRapid Eye Movements, NREMS)和眼球快速運動睡眠狀態(tài)(Rapid Eye Movements, REMS)。其中NREMS細分為四個狀態(tài)：S1~S4，分別代表淺度睡眠、輕度睡眠、中度睡眠和深度睡眠。

　　睡眠分期的方法主要有兩類：一類是基于R&K準則，需要經(jīng)驗豐富的專家對數(shù)據(jù)進行目測分類，這種方法不僅耗時費力，而且易受專家主觀因素影響。另一類是睡眠的自動分期方法，其用模式識別算法自動對數(shù)據(jù)提取特征和進行分類。目前使用較多的有支持向量機(Support Vector Machine, SVM)、隨機森林(Random Forest)、人工神經(jīng)網(wǎng)絡等。

　　由于深度學習可以自動提取特征，通過組合低層特征形成更加抽象的高層特征［2］，因此本文利用兩種深度學習網(wǎng)絡分別對EOG進行分期研究，并對分期結(jié)果進行比較。

1方法概述

　　1.1深度置信網(wǎng)絡

　　深度置信網(wǎng)絡（Deep Belief Network,DBN)是Hinton在2006年提出的［3］。它由一系列受限玻爾茲曼機(Restricted Boltzmann Machines, RBM)組成。DBN網(wǎng)絡的核心思想是將RBM堆疊在一起，訓練出權值，將這個權值作為神經(jīng)網(wǎng)絡權值的初始值，再用經(jīng)典的梯度法去訓練網(wǎng)絡。本文中用到的DBN結(jié)構如圖1所示。DBN網(wǎng)絡共有5層：輸入層、3個隱層、標簽層。隱層的單元個數(shù)分別為500、200、100。DBN的訓練過程包括三步：(1) RBM的訓練，需將數(shù)據(jù)劃分為小批量的數(shù)據(jù)，HINTON G E在參考文獻［4］中提出小批量數(shù)據(jù)的大小minibatche設置為10~100，本文中設置為60，訓練迭代次數(shù)epoch設為10。 (2)將RBM訓練得到的權重作為DBN網(wǎng)絡的初始值進行訓練。設置minibatche為1 000，epoch為30。(3)進行有監(jiān)督微調(diào)，學習率設置為0.03。

　　1.2長短時記憶遞歸神經(jīng)網(wǎng)絡

　　將每個受試的EOG數(shù)據(jù)看做一個序列，由于序列節(jié)點之間存在時序相關性，因此預測模型要具有記憶功能，能夠包含序列的遠距離信息。而遞歸神經(jīng)網(wǎng)絡(Recurrent Neural Network，RNN)恰好滿足這一要求。RNN含有從單元的輸出到單元的輸入的連接（即含有遞歸連接），因此可以利用其內(nèi)部的記憶來處理具有時序的輸入序列。然而，傳統(tǒng)的RNN存在梯度消失和梯度激增的問題，導致遠距離的信息不能有效地被利用。為了解決這一問題，HOCHREITER S和SCHMIDHUBER J在1997年提出了一種新的RNN網(wǎng)絡——長短時記憶遞歸神經(jīng)網(wǎng)絡（LSTMRNN），它使用記憶模塊取代傳統(tǒng)RNN的隱層單元，通過記憶細胞內(nèi)部狀態(tài)的自反饋和輸入輸出門對誤差的截斷，解決了梯度消失和激增的問題。LSTMRNN可以學習長度超過1 000的序列［5］。本文中使用的是具有忘記門的記憶模塊，結(jié)構如圖2所示。

　　LSTM層的權重的計算主要包括兩個過程：前向傳播和后向傳播。

　　Xt表示t時刻的輸入向量，W表示輸入權重矩陣，R表示遞歸權重矩陣，b表示偏置單元。門的激活函數(shù)σ通常指的是sigmoid函數(shù)。記憶細胞的輸入輸出激活函數(shù)(g和h)通常是tanh函數(shù)。E表示損失函數(shù)，兩個向量之間的點乘用“·”表示。

　　前向傳播就是依次按照順序計算模塊內(nèi)部各個組成部分的輸入輸出直至得到記憶模塊的輸出。

　　模塊輸入：

　　zt=g(WzXt+Rzyt－1+bz)(1)

　　輸入門輸出：

　　it=σ(WiXt+Riyt－1+bi)(2)

　　忘記門輸出：

　　ft=σ(WfXt+Rfyt－1+bf)(3)

　　記憶細胞輸出：

　　ct=zt·it+ct－1·ft(4)

　　輸出門輸出：

　　ot=σ(WoXt+Royt－1+bo)(5)

　　模塊輸出：

　　yt=h(ct)·ot(6)

　　后向過程就是從最后一個時間將積累的殘差E傳遞回來。在此過程中采用的是BPTT［6］(Back Propagation Through Time)算法。

　　在本文中，將每30 s的數(shù)據(jù)作為一個時間步長進行輸入，輸出長度為6的向量，因此使用到LSTMRNN的網(wǎng)絡結(jié)構如圖3所示，其中TimeDistributedDense層是一個基于時間維度的全連接層。學習率和網(wǎng)絡單元個數(shù)是圖3LSTMRNN 網(wǎng)絡模型網(wǎng)絡的最重要的參數(shù)，而且各參數(shù)之間的調(diào)整可以看做是獨立的［7］，因此可以獨立地對各個參數(shù)進行調(diào)優(yōu)。最終參數(shù)的設置為第一層全連接層單元數(shù)為500，兩層LSTM的單元個數(shù)為200、100，最后一層全連接層與第一層全連接層單元相同但是單元數(shù)設為6，batchsize為1，迭代次數(shù)epoch為128，學習率為0.003。

2實驗數(shù)據(jù)

　　本文用到的數(shù)據(jù)是圖賓根大學采集到的9名受試者晚上的睡眠數(shù)據(jù)，他們的平均年齡為23.5歲，其中包括3名女性。在實驗前的6周，要求受試者們保持規(guī)律的作息時間并禁止喝咖啡。在本項研究中使用EOG通道，信號的采樣率是500 Hz，專家將每30 s的數(shù)據(jù)對應于一個標簽。由于本文對數(shù)據(jù)做6分類(AWAKE、S1、S2、S3、S4、REM)分析，因此只保留此6個狀態(tài)的數(shù)據(jù)。首先對數(shù)據(jù)進行預處理操作：(1)去除兩個不同狀態(tài)轉(zhuǎn)換時對應的數(shù)據(jù)，得到處理后各子類數(shù)據(jù)比例如表1所示。(2)將數(shù)據(jù)進行快速傅里葉變換，取0.5~35 Hz之間的頻域數(shù)據(jù)。(3)進行歸一化后得到用于分期的數(shù)據(jù)。表1處理后睡眠數(shù)據(jù)各子類比例狀態(tài)Awake S1S2S3S4REM百分比/%5.600.8154.256.2011.9821.16

3實驗結(jié)果

　　本文中使用留一驗證的方法，圖4展示了每個受試者DBN和LSTMRNN的分類結(jié)果。表2和表3展示的是兩種方法對應的混淆矩陣。通過分析結(jié)果可以得到以下結(jié)論：(1)EOG數(shù)據(jù)可以用作睡眠分期研究。(2)DBN和LSTMRNN在睡眠分期研究中都取得了較好的結(jié)果，但是LSTMRNN無論是在每個受試者的準確率還是在每個狀態(tài)的分類準確率上都要優(yōu)于DBN。(3)在混淆矩陣中，S2、S4和REM的準確率比其他狀態(tài)的準確率高，這與處于S2、S4、REM狀態(tài)的數(shù)據(jù)在總數(shù)據(jù)中占得比例較高和各個狀態(tài)具有相似特征有關。

4結(jié)論

　　本文通過基于EOG通道的睡眠分期研究可以得出，DBN和LSTMRNN作為睡眠自動分期方法，可以很好地自動提取特征并進行分類，在處理時序序列的分類時，LSTMRNN可以更好地利用長距離信息對睡眠數(shù)據(jù)進行分期，其分類效果優(yōu)于DBN。

參考文獻

　　［1］ RECHTSCHAFFEN A，KALES A. A manual of standardized terminology，techniques and scoring system for sleep stages of human subjects［M］. Los Angeles: Brain Information Service/Brain Research Institute,1977.

　　［2］ BENGIO Y，DELALLEAU O. On the expressive power of deep architectures［C］.Proc of the 14th International Conference on Discovery Science. Berlin: SpringVerlag，2011：1836.

　　［3］ HINTON G E，OSIJDERO S，TEH Y W. A fast learning algorithm for deep belief nets［J］. Neural Computation，2006，18(7) ：15271554.

　　［4］ HINTON G E. A practical guide to training restricted Boltzmann machines［J］.Momentum，2010， 9(1)：599619.

　　［5］ HOCHREITER S， SCHMIDHUBER J. Long shortterm memory［J］.Neural Computation， 1997，9(8)：17351780.

　　［6］ GRAVES A. Supervised sequence labelling with recurrent neural networks［M］. Berlin: Springer, 2012.

　　［7］ GREFF K， SRIVASTAVA R K，KOUTNI＇K J，et al. LSTM：a search space odyssey［J/OL］. arXiv preprint. (20150313)［20160301］.http://arxiv.org/abs/1503.04069.

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權禁止轉(zhuǎn)載。

相關內(nèi)容