一直以來(lái),,我國(guó)醫(yī)療都存在醫(yī)生培養(yǎng)周期長(zhǎng),,誤診率高,優(yōu)質(zhì)醫(yī)療資源供配不均等痛點(diǎn),,這使得看病難,、看病貴已成不易根治的“頑疾”。而近兩年來(lái),,隨著人工智能走進(jìn)醫(yī)療領(lǐng)域,,醫(yī)療成了AI落地的又一萬(wàn)億級(jí)場(chǎng)景,成為眾多企業(yè)競(jìng)相涌入的風(fēng)口,,然而AI的賦能真的能有效地消除這些“頑疾”嗎,?AI+醫(yī)療的痛點(diǎn)又在哪里呢?
五年前,,IBM Watson高調(diào)進(jìn)軍醫(yī)療領(lǐng)域,,并于2015年實(shí)現(xiàn)Watson系統(tǒng)的商用,為醫(yī)院提供癌癥的輔助診療服務(wù),,成為全球AI醫(yī)療行業(yè)的領(lǐng)導(dǎo)者,。然而近幾年,IBM Watson的發(fā)展并不如預(yù)期那般順利,,2017年2月,,休斯敦安德森癌癥研究中心(MD Anderson Cancer Center)終止了與IBM Watson的合作,稱其輔助診療效果始終達(dá)不到預(yù)期,。2018年5月24日,,IBM Watson又傳出對(duì)醫(yī)療部門大幅度裁員的消息,其背后暴露的問(wèn)題不禁令人反思,。
數(shù)據(jù)是AI醫(yī)療發(fā)展一大瓶頸
實(shí)際上,,當(dāng)人工智能打破了算法算力的技術(shù)壁壘之后,也愈發(fā)凸顯其對(duì)數(shù)據(jù)的依賴性,,而Watson系統(tǒng)在醫(yī)療診斷時(shí)頻頻出錯(cuò)的根本原因之一正是數(shù)據(jù)問(wèn)題,。雖然X光掃描識(shí)別惡性腫瘤并不算太難,但要制定出某種癌癥的治療方案是一件很復(fù)雜的事情,,影像診斷需要經(jīng)過(guò)大量專業(yè)醫(yī)師標(biāo)注的數(shù)據(jù)進(jìn)行模型訓(xùn)練才行,。但根據(jù)IBM的內(nèi)部文件,Watson使用的訓(xùn)練數(shù)據(jù)并不豐富,,例如,,訓(xùn)練肺癌治療方案的數(shù)據(jù)僅有635例,況且這些數(shù)據(jù)并非全部來(lái)自真實(shí)患者,,有些是來(lái)自合成的案例或假設(shè)的患者,。
此外,北美對(duì)醫(yī)療數(shù)據(jù)有嚴(yán)格的隱私保護(hù)機(jī)制,,并且每種疾病所需要的數(shù)據(jù)都不同,,數(shù)據(jù)碎片化問(wèn)題嚴(yán)重,,這些因素便導(dǎo)致了數(shù)據(jù)獲取途徑困難且成本高昂。醫(yī)療數(shù)據(jù)成為了影像診斷行業(yè)發(fā)展的瓶頸,。
而在我國(guó),,數(shù)據(jù)歸醫(yī)療機(jī)構(gòu)和患者所共有,并且在2017年的《“十三五”全國(guó)人口健康信息化發(fā)展規(guī)劃》中,,國(guó)家提出了要有序推動(dòng)人口健康信息基礎(chǔ)資源大數(shù)據(jù)的開放和共享的政策方針,。在政策支持下,三家醫(yī)療大數(shù)據(jù)公司也開始積極建設(shè)醫(yī)療數(shù)據(jù)庫(kù),,這給AI醫(yī)療的發(fā)展提供了很大的技術(shù)和數(shù)據(jù)支持,。因此解決數(shù)據(jù)問(wèn)題,是助推我國(guó)AI醫(yī)療實(shí)現(xiàn)彎道超車的關(guān)鍵點(diǎn),。
我國(guó)醫(yī)療大數(shù)據(jù)在質(zhì)量上也不容樂(lè)觀
然而在我國(guó)醫(yī)療領(lǐng)域,,作為AI醫(yī)療發(fā)展基石的醫(yī)療大數(shù)據(jù)在質(zhì)量上也不容樂(lè)觀。
就電子醫(yī)療記錄而言,,雖然目前醫(yī)院普及率很高,,但其可及性和數(shù)據(jù)質(zhì)量都并非最優(yōu),并且不同醫(yī)院使用的信息系統(tǒng)提供者達(dá)300多家,,其數(shù)據(jù)結(jié)構(gòu)和標(biāo)準(zhǔn)都有所差異,。
除此之外,由于醫(yī)療資源分配不均衡,,我國(guó)各地區(qū)醫(yī)生水平參差不齊,,醫(yī)療欠發(fā)達(dá)地區(qū)的誤診率遠(yuǎn)超一線城市,從而導(dǎo)致了整體疾病診斷正確率偏差很大,。
“就像十年前我們討論用數(shù)據(jù)做知識(shí)研究的時(shí)候,中國(guó)面臨一個(gè)最大的問(wèn)題就是中國(guó)的數(shù)據(jù)質(zhì)量目前是不太可靠的,,不可靠的原因就是疾病診斷不對(duì),。以我們拿到的北京中風(fēng)病人數(shù)據(jù)為例,北京能夠收中風(fēng)病人的醫(yī)院是130家,,大概每年住院病人14萬(wàn)人,,診斷正確率是72%,另外的28%診斷都是錯(cuò)的,?!保本┨靿t(yī)院王擁軍院長(zhǎng)在GMIC生命科學(xué)如是說(shuō)道,。
我國(guó)醫(yī)療大數(shù)據(jù)之所以質(zhì)量低下,,一方面是因?yàn)楦哒`診率,另一方面則是因?yàn)槿狈?biāo)準(zhǔn)化的臨床術(shù)語(yǔ)語(yǔ)義體系,。雖然自2002年我國(guó)已采用了國(guó)際疾病編碼和國(guó)際手術(shù)編碼,,但單憑這兩大術(shù)語(yǔ)并不能覆蓋醫(yī)療記錄中所有臨床信息,,并且目前應(yīng)用較為廣泛的醫(yī)學(xué)系統(tǒng)命名法在我國(guó)并不使用。因此只有做好醫(yī)學(xué)術(shù)語(yǔ)管理,,才能挖掘出醫(yī)療大數(shù)據(jù)背后的真正含義,。
除此之外,醫(yī)療大數(shù)據(jù)的隱私問(wèn)題也不容忽視,,但目前我國(guó)并無(wú)相關(guān)具體法律或指引,,在不影響數(shù)據(jù)完整性的基礎(chǔ)上出臺(tái)隱私保護(hù)規(guī)則也很必要。
醫(yī)療大數(shù)據(jù)對(duì)人工智能在醫(yī)療領(lǐng)域的發(fā)展至關(guān)重要,,在提高診斷準(zhǔn)確性和優(yōu)化臨床決策等方面發(fā)揮著巨大作用,,我國(guó)AI醫(yī)療行業(yè)要想取得實(shí)質(zhì)性發(fā)展,進(jìn)一步完善數(shù)據(jù)系統(tǒng),,發(fā)展大數(shù)據(jù)收集,、儲(chǔ)存、整合,、管理和應(yīng)用等各種新技術(shù)是關(guān)鍵一步,。