作者 | 蔣寶尚
編輯 | 賈偉
人工智能從來(lái)沒(méi)有像現(xiàn)在這么重要過(guò),!
這段時(shí)間的疫情猛烈,,AI每一次在醫(yī)療領(lǐng)域的落地都在幫助白衣天使拯救生命,。從疫情預(yù)測(cè)到檢測(cè)體溫再到藥物開(kāi)發(fā),,人工智能爭(zhēng)分奪秒,,蓄勢(shì)待發(fā),。
更為準(zhǔn)確的說(shuō)是醫(yī)療AI公司們站了出來(lái),為醫(yī)護(hù)人員鑄造了一面堅(jiān)強(qiáng)的后盾,。
1月28日,,依圖醫(yī)療的第一版新冠肺炎產(chǎn)品在上海公衛(wèi)上線(xiàn),2月5日在武漢的協(xié)和醫(yī)院,、中南醫(yī)院,、武漢大學(xué)人民醫(yī)院以及荊州市第一人民醫(yī)院完成部署。
1月31日,,推想科技宣布推出針對(duì)新冠肺炎篩查產(chǎn)品,。
2月15日,阿里巴巴宣布:達(dá)摩院聯(lián)合阿里云針對(duì)新冠肺炎臨床診斷研發(fā)了一套全新AI診斷技術(shù),,AI可以在20秒內(nèi)準(zhǔn)確地對(duì)新冠疑似案例CT影像做出判讀,,分析結(jié)果準(zhǔn)確率達(dá)到96%。
.... ...
相對(duì)于巡邏機(jī)器人的檢測(cè)體溫,,CT影像的自動(dòng)檢測(cè)才能代表AI在醫(yī)療領(lǐng)域的最高水準(zhǔn),,但也更難大規(guī)模應(yīng)用,這里面不僅包含算法難關(guān),,更存在著不斷迭代的需求,。
但此技術(shù)又不得不加緊落地,!因?yàn)樵?月5日,國(guó)家衛(wèi)健委發(fā)文表示:在湖北省內(nèi),,CT影像結(jié)果要作為新型冠狀病毒感染“臨床診斷病例”的判定依據(jù),。
那么AI技術(shù)在從算法到應(yīng)用層面有哪些難點(diǎn)呢?
具體算法,,遍地開(kāi)花
在2017年春節(jié)期間,斯坦福大學(xué)工程學(xué)院和醫(yī)學(xué)院合作團(tuán)隊(duì)在《自然》上發(fā)布了在皮膚癌診斷領(lǐng)域的最新突破,。他們?cè)诠雀栌糜?a class="innerlink" href="http://forexkbc.com/tags/識(shí)別" target="_blank">識(shí)別貓和狗算法的基礎(chǔ)上,,經(jīng)過(guò)13萬(wàn)張皮膚病變的圖像訓(xùn)練后,開(kāi)發(fā)出了可用于識(shí)別皮膚癌的AI系統(tǒng),。
吳恩達(dá)教授也在2017年發(fā)表相關(guān)研究,,其使用CheXNet算法訓(xùn)練的模型可以診斷14種病癥,尤其在肺炎診斷方面,,比放射科專(zhuān)家單獨(dú)診斷的準(zhǔn)確率更高,。
2018年Google的Gulshan團(tuán)隊(duì)采用近13萬(wàn)張已由54位美國(guó)專(zhuān)家標(biāo)注過(guò)的視網(wǎng)膜眼底圖像,對(duì)深度學(xué)習(xí)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,,檢測(cè)準(zhǔn)確率達(dá)到曲線(xiàn)下面積91%,。
同年, 國(guó)家千人計(jì)劃“入選者張康教授率領(lǐng)中國(guó)研究團(tuán)隊(duì)在頂級(jí)期刊《細(xì)胞》上發(fā)表了一篇AI在醫(yī)療領(lǐng)域應(yīng)用,,即基于深度學(xué)習(xí)開(kāi)發(fā)出一個(gè)能診斷眼病和肺炎兩大類(lèi)疾病的AI系統(tǒng),,就準(zhǔn)確性來(lái)說(shuō)能夠匹敵頂尖醫(yī)生。
值得一提的是,,張康教授的那項(xiàng)研究也是世界范圍內(nèi)首次使用龐大的標(biāo)注好的高質(zhì)量數(shù)據(jù)進(jìn)行遷移學(xué)習(xí),。
遷移學(xué)習(xí)可以解決訓(xùn)練數(shù)據(jù)不足的局限。
那么這么多突破性的研究,,這么多表現(xiàn)良好的算法模型為什么卻在實(shí)際應(yīng)用效果不佳呢,。
首先在胸片上發(fā)現(xiàn)肺炎非常困難,即使對(duì)放射科醫(yī)師來(lái)說(shuō),,他們眼中的胸透圖像的肺炎特征也是模糊的,,容易和許多其他的良性異常相混淆。
也就是說(shuō)人工智能系統(tǒng)對(duì)肺部CT影像的片狀陰影不夠敏感,,而片狀陰影是新型冠狀病毒肺炎的主要病灶,。
而要想要鑒別新冠肺炎影像與普通病毒性肺炎影像也并不容易,臨床上影像科的醫(yī)生有自己的判別標(biāo)準(zhǔn),,擁有這個(gè)標(biāo)準(zhǔn)的開(kāi)發(fā)人員會(huì)嘗試不同的方法提升自己的模型,,但是一些算法的訓(xùn)練研究員并不具有放射科的背景,另外這個(gè)標(biāo)準(zhǔn)也并不是容易量化,。
對(duì)于訓(xùn)練數(shù)據(jù)來(lái)說(shuō),,數(shù)據(jù)量的多少不是關(guān)鍵,,關(guān)鍵的是有代表性的以及疑難的數(shù)據(jù)有多少,一個(gè)基于學(xué)習(xí)而不是規(guī)則的算法本身需要大量的類(lèi)似數(shù)據(jù)才能學(xué)習(xí)到正確的知識(shí),。在A(yíng)I在檢測(cè)新冠狀肺炎肺炎的時(shí)候,,由于缺少“疑難雜癥”樣本數(shù)據(jù),即使識(shí)別了99%的病人,,但是可能真正有威脅的是那沒(méi)有識(shí)別出了1%,。
目前深度學(xué)習(xí)訓(xùn)練過(guò)程中所采用的解釋性的方法基本都是可視化方法,看哪些部位對(duì)患病概率的貢獻(xiàn)比較大,,而這個(gè)概率只根據(jù)CT影像獲得的,。但是醫(yī)生在具體判斷時(shí)候,還要結(jié)合病史,,遺傳,,生活習(xí)慣等等做出推斷。
再有,,如果疾病發(fā)生新的變異或變化,,那么原來(lái)的算法模型還能使用么?
考慮到實(shí)際情況,,各地的CT設(shè)備并不是非常統(tǒng)一,,也就是說(shuō)對(duì)原算法模型的驗(yàn)證效果很難都達(dá)標(biāo),甚至可能非常低,。即使在原模型基礎(chǔ)上進(jìn)行微調(diào),,也可能需要某個(gè)型號(hào)的CT設(shè)備提供的非常多的數(shù)據(jù)。各地的檢測(cè)環(huán)境也不是非常統(tǒng)一,,最差的情況可能會(huì)需要對(duì)每一臺(tái)機(jī)器進(jìn)行微調(diào)來(lái)保證準(zhǔn)確率,,但這樣特殊的數(shù)據(jù)真的很好采集嗎?
參考來(lái)源:
https://www.zhihu.com/question/372335557
https://mp.weixin.qq.com/s/Q0H0s1aL8V06p7o2rlf2MQ