摘? 要: 隨著醫(yī)院信息化的進程加快,,醫(yī)院信息的積累越來越豐富,,為醫(yī)學(xué)研究提供了方便和研究價值,。以出院病患者的隨訪記錄建立數(shù)據(jù)庫,,依靠數(shù)據(jù)挖掘技術(shù),,篩選出有價值的信息,,建立一個能夠為以后的治療提供有價值的參考作用的醫(yī)院醫(yī)療方案庫,。從而形成一個對患者更負責(zé)任的體系,,完善醫(yī)院服務(wù),提高醫(yī)院診斷就醫(yī)效率,。
關(guān)鍵詞: 數(shù)據(jù)挖掘,;隨訪;醫(yī)療方案庫
?
1 數(shù)據(jù)挖掘
1.1? 數(shù)據(jù)挖掘概念
??? 數(shù)據(jù)挖掘[1-2]是指從數(shù)據(jù)庫中提取出隱含的人們事先未知的,、潛在的有用信息和知識,,所提取的知識可以表示為概念規(guī)則、規(guī)律,、模式等形式,。它具備有效性、新穎性,、潛在有用性及最終可理解性,,即發(fā)現(xiàn)的知識可接受、可理解,、可運用,,最好能用自然語言表達發(fā)現(xiàn)的結(jié)果。處理的原始數(shù)據(jù)可以是結(jié)構(gòu)化的,,如關(guān)系數(shù)據(jù)庫中的數(shù)據(jù),;也可以是半結(jié)構(gòu)化的,如文本,、圖形、圖像數(shù)據(jù);甚至是分布在網(wǎng)絡(luò)上的Web數(shù)據(jù)和異構(gòu)型數(shù)據(jù),。獲取的知識可用于信息管理,、查詢優(yōu)化、決策支持,、過程控制等,,還可以用于數(shù)據(jù)自身的維護。因此,,數(shù)據(jù)挖掘是一個介于統(tǒng)計學(xué),、模式識別、人工智能,、機器學(xué)習(xí),、數(shù)據(jù)庫技術(shù)以及高性能并行計算等領(lǐng)域的交叉新學(xué)科,已在經(jīng)濟,、商業(yè),、金融、天文等行業(yè)得到了成功的應(yīng)用,,在國際上掀起了一股空前的研究熱潮即所謂的“數(shù)據(jù)淘金潮”,。我國學(xué)者在這個領(lǐng)域也已開展了很多研究,主要來自計算機科學(xué)及相關(guān)領(lǐng)域[1-3],?! ?BR>1.2? 數(shù)據(jù)挖掘過程
數(shù)據(jù)挖掘過程主要由3個階段組成:數(shù)據(jù)準備、數(shù)據(jù)開采,、結(jié)果表達和解釋,。
(1)數(shù)據(jù)準備
這個階段又可以進一步分成3個子步驟:數(shù)據(jù)集成、數(shù)據(jù)選擇,、數(shù)據(jù)預(yù)處理[2-4],。數(shù)據(jù)集成將多文件或多數(shù)據(jù)庫運行環(huán)境中的數(shù)據(jù)進行合并處理,解決語義模糊性,、處理數(shù)據(jù)中的遺漏和清洗臟數(shù)據(jù)等,;數(shù)據(jù)選擇的目的是辨別出需要分析的數(shù)據(jù)集合,縮小處理范圍,,提高數(shù)據(jù)挖掘的質(zhì)量,;數(shù)據(jù)預(yù)處理是為了克服目前數(shù)據(jù)挖掘工具的局限性。
(2)數(shù)據(jù)開采
在這個階段進行實際的數(shù)據(jù)開采操作,,主要包括:
?、偃绾萎a(chǎn)生假設(shè),是讓數(shù)據(jù)挖掘系統(tǒng)為用戶產(chǎn)生假設(shè),,還是用戶自己對于數(shù)據(jù)倉庫中可能包含的知識提出假設(shè),。前一種稱為發(fā)現(xiàn)型(Discovery-Driven)的數(shù)據(jù)挖掘,,后一種稱為驗證型(Verification)的數(shù)據(jù)挖掘;
?、谶x擇合適的工具,;
③挖掘知識的操作,;
?、馨l(fā)現(xiàn)知識。
(3)結(jié)果的表達和解釋
根據(jù)最終用戶的決策目的對提取的信息進行分析,,把最有價值的信息區(qū)分出來,,并且通過決策支持工具提交給決策者。因此,,這一步驟的意義不僅是把結(jié)果表達出來(例如采用信息可視化方法),,還要對信息進行過濾處理。如果不能令決策者滿意,,則需要重復(fù)以上數(shù)據(jù)挖掘的過程,。數(shù)據(jù)挖掘過程如圖1所示。
?
?
2? 醫(yī)院隨訪現(xiàn)狀
隨訪是醫(yī)療衛(wèi)生部門為定期或不定期了解門診或出院病人在院期間醫(yī)療處理的愈后,、康復(fù)情況及遠期療效通常采用的一種工作手段,。隨著醫(yī)療技術(shù)的日新月異,隨訪工作的開展與否已成為衡量一家醫(yī)院醫(yī)療管理是否先進的重要指標(biāo)之一,。隨訪,,作為醫(yī)療及醫(yī)學(xué)信息應(yīng)用的主要內(nèi)容, 為醫(yī)院的醫(yī)療、教學(xué),、科研提供了不可多得的寶貴資料,。患者隨訪服務(wù)將成為醫(yī)院在今后市場競爭中的重要因素,,通過為患者提供有效的服務(wù),,設(shè)法吸引患者成為醫(yī)院經(jīng)營的焦點之一。然而,,由于各種原因,,患者隨訪依然是當(dāng)前醫(yī)院管理中的薄弱環(huán)節(jié)之一。本文建立的隨訪數(shù)據(jù)庫,,提供全面的患者隨訪管理,,完成以患者為中心的服務(wù)轉(zhuǎn)變,以為“完善醫(yī)院服務(wù),,提高病人滿意度,,降低病人流失率”最終目標(biāo),全面提高醫(yī)院的服務(wù)效果,。
3?數(shù)據(jù)挖掘在醫(yī)院醫(yī)療中的應(yīng)用
3.1?數(shù)據(jù)挖掘在隨訪信息庫中的應(yīng)用
醫(yī)院作為一個龐大的社會服務(wù)機構(gòu),,在過去若干年的時間里積累了海量的,、以不同形式存儲的數(shù)據(jù)資料,但是如果對其中的每個數(shù)據(jù)都仔細處理是不可能的,,也沒有實效和用處,。本文以電子病歷系統(tǒng)的數(shù)據(jù)為原始庫,接收電子病歷系統(tǒng)數(shù)據(jù),,通過數(shù)據(jù)清理,建立一個隨訪信息庫,,用于對出院病人的跟蹤調(diào)查,。在隨訪信息庫的基礎(chǔ)之上,進一步進行有價值的信息挖掘,,建立一個醫(yī)院治療方案庫,,以便總結(jié)治療經(jīng)驗,對以后醫(yī)療方案的實施有重要的指導(dǎo)意義[6-8],。
3.2?原始電子病例資料庫
電子病歷包含病人的基本資料,、醫(yī)生信息、檢查情況,、診斷情況,、醫(yī)囑、手術(shù)情況,、護理信息等數(shù)據(jù)信息,,隨訪病人資料主要有病人的基本資料、病人出院情況記錄,、出院后的用藥記錄,、病人的復(fù)診情況等。
病人的基本資料包括姓名,、年齡,、性別、身高,、體重,、血型、醫(yī)保費用類別等,;醫(yī)生信息包括科室,、姓名、職稱,、診療時間等,;檢查情況包括主要癥狀的描述;檢查報告書包括放射,、超聲波,、心電圖,、內(nèi)窺鏡等;醫(yī)技檢查診斷情況包括診斷依據(jù),、門診診斷,、入院診斷、出院診斷等,;醫(yī)囑包括日期,、主治醫(yī)師姓名、臨時醫(yī)囑,、長期醫(yī)囑等,;手術(shù)情況包括手術(shù)時間、參與人員,、手術(shù)方案,、手術(shù)記錄等;護理信息包括護士姓名,、護理日期,、護理計劃、床位設(shè)置,、護理情況等,。
將以上信息納入隨訪信息數(shù)據(jù)庫中,是對病案信息資源的二次開發(fā),。隨著醫(yī)院醫(yī)療工作的開展,,隨訪工作量日益加大,設(shè)計完善的隨訪系統(tǒng)是科學(xué),、準確地做好隨訪工作的前提和保障,。根據(jù)原始電子病例資料庫,運用適當(dāng)?shù)乃惴ㄟM行信息的清理,,把對病患隨訪的無效的數(shù)據(jù)清理掉,,然后通過各種隨訪手段進行隨訪,建立起一個隨訪病人資料庫,。隨訪庫建立流程如圖2所示,。
3.3??隨訪病人資料
隨訪病人的基本資料應(yīng)該與醫(yī)院中的電子病例數(shù)據(jù)庫中病人的基本信息一致。病人的出院情況記錄疾病的種類,、治療時間,、出院時間、主治醫(yī)生以及隨訪人員編號,。出院后的用藥記錄包括用藥種類,、時間以及用藥效果等,病人的復(fù)診記錄包括復(fù)診時間,、復(fù)診主診醫(yī)生,、檢查情況,、回復(fù)情況等。當(dāng)然,,具體到每一個病例,,不一定會包括所有的內(nèi)容,可能會涉及到新的內(nèi)容,,這就需要具體情況具體分析,。
醫(yī)院信息系統(tǒng)蘊藏著海量數(shù)據(jù),全部調(diào)用既不可能,,也無功效,。所以通過現(xiàn)代的數(shù)據(jù)挖掘技術(shù)將隨訪庫和原始數(shù)據(jù)庫結(jié)合,進行數(shù)據(jù)分析,、清理和挖掘,得出具有代表性和指導(dǎo)意義的病例,,并將其添加到治療方案庫當(dāng)中,,逐漸形成一個大規(guī)模的、有價值的醫(yī)院治療指導(dǎo)信息庫,,使得以后其他病例有所借鑒,,最終形成信息的共享?;卺t(yī)院數(shù)據(jù)倉庫的數(shù)據(jù)挖掘功能如圖3所示,。
?
?
通過醫(yī)院原始的信息庫建立一個隨訪庫,對患者進行跟蹤隨訪,,記錄出院后的數(shù)據(jù),,收集病人的隨訪數(shù)據(jù),然后通過對隨訪數(shù)據(jù)庫進行數(shù)據(jù)挖掘,,建立起一個有價值和指導(dǎo)意義的醫(yī)院醫(yī)療庫,。醫(yī)生通過查閱醫(yī)院醫(yī)療庫中信息資料,可以了解某種疾病或某種手術(shù)方案以及以往病人的治療情況,,并結(jié)合自己的臨床經(jīng)驗,,形成治療某種疾病可選擇的手術(shù)方案。最終,,提高醫(yī)療療效,,達到提高醫(yī)療質(zhì)量的目的。
參考文獻
[1]?范明,孟小峰. 數(shù)據(jù)挖掘概念與技術(shù)[ M].北京:機械工業(yè)出版社,2001.
[2]?康曉東. 基于數(shù)據(jù)倉庫的數(shù)據(jù)挖掘技術(shù)[M].北京:機械工業(yè)出版社,2004.
[3]?普通高等學(xué)校本科專業(yè)目錄和專業(yè)介紹[M].北京:高等教育出版社,1997.
[4]?范明,范宏建. 數(shù)據(jù)挖掘?qū)д揫M].北京:人民郵電出版社.2006.
[5]?JIAWei Han, MICHELINE K.Data mining concepts and techniques[M].China Machine Press,2005.
[6]?LECH P,SHUSAKU T,TSAU Y. Rough set method and applicaions: new deverlopments in knowledge discovery in information systems[M].Physica-Verlag,2000.
[7]?谷建軍,,王洪國,,丁艷輝.粗糙理論及其在數(shù)據(jù)歸約中的應(yīng)用[J].信息技術(shù)與信息,2006(3).
[8]?傘冶,,葉玉玲.粗糙理論及其在智能系統(tǒng)中的應(yīng)用[J].智能系統(tǒng)學(xué)報,,2007,,4(2).