《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 可編程邏輯 > 業(yè)界動態(tài) > 神經(jīng)網(wǎng)絡(luò)診斷皮膚癌超越人類專家,?來自醫(yī)療界的這篇論文給出了證明

神經(jīng)網(wǎng)絡(luò)診斷皮膚癌超越人類專家?來自醫(yī)療界的這篇論文給出了證明

2018-05-29

今日,,一篇關(guān)于皮膚癌診斷的文章發(fā)表在醫(yī)療期刊《腫瘤學年鑒》(Annals of Oncology)上,這篇出自醫(yī)療界高級管理醫(yī)師的研究首次表明:深度學習卷積神經(jīng)網(wǎng)絡(luò)CNN)在檢測皮膚癌方面的表現(xiàn)優(yōu)于有經(jīng)驗的皮膚科醫(yī)生,。對比對象是來自 17 個國家的 58 位皮膚科醫(yī)生,,其中包括 30 位專家。


這是人工智能又一次在醫(yī)療圖像識別上實現(xiàn)「超越人類」的水平,。盡管如吳恩達這樣的著名機器學習學者領(lǐng)導的 AI 醫(yī)療影像研究也正在受到質(zhì)疑,,但隨著技術(shù)的發(fā)展,越來越多基于人工智能的醫(yī)療成果正在出現(xiàn),,此類技術(shù)或許很快就可以幫助我們更好地應(yīng)對疾病,。


研究人員首次表明,深度學習卷積神經(jīng)網(wǎng)絡(luò)(CNN)在檢測皮膚癌方面的表現(xiàn)優(yōu)于有經(jīng)驗的皮膚科醫(yī)生,。


今天發(fā)表在國際著名癌癥期刊《腫瘤學年鑒》(Annals of Oncology)上的一項研究中,,德國、美國和法國的研究人員使用 10 萬多幅惡性黑色素瘤(最致命的皮膚癌)和良性痣的圖像訓練了一個 CNN 來識別皮膚癌,。他們將其診斷與 58 位國際皮膚科醫(yī)生的診斷進行了比較,,發(fā)現(xiàn) CNN 比皮膚科醫(yī)生漏診的黑色素瘤更少,誤診良性痣的幾率更低,。


CNN 是一種人工神經(jīng)網(wǎng)絡(luò),,受到大腦中神經(jīng)細胞(神經(jīng)元)相互連接并對眼睛看到的東西做出反應(yīng)時的生物過程的啟發(fā)。CNN 能夠從它「看到」的圖像中快速學習,并根據(jù)所學知識自學來提高其性能(這一過程被稱為機器學習),。


這項研究的第一作者,,德國海德堡大學皮膚科高級管理醫(yī)師 Holger Haenssle 教授解釋說:「CNN 的工作原理就像一個孩子的大腦。為了訓練它,,我們向 CNN 展示了 10 萬多幅惡性皮膚癌和良性痣的圖像,,并標出每幅圖像的診斷結(jié)果。我們僅用了皮膚鏡圖像,,即以 10 倍放大倍率成像的病變圖像,。CNN 通過學習每幅訓練圖像提高了區(qū)分良性和惡性病變的能力。


「訓練結(jié)束后,,我們借用海德堡大學圖書館的數(shù)據(jù)創(chuàng)建了兩套從未用于訓練的測試圖像,,因此 CNN 對此一無所知。一組 300 幅圖像的數(shù)據(jù)集專門用來單獨測試 CNN 的性能,。在此之前,,我們選擇了 100 種最難判斷的病變來測試真正的皮膚科醫(yī)生,并與 CNN 的結(jié)果進行比較,?!?/p>


來自世界各地的皮膚科醫(yī)生受邀參加,17 個國家的 58 位專家同意參加會議,。其中 17 人(29%)表示他們在皮膚鏡檢查方面的經(jīng)驗不足兩年,,11 人(19%)表示他們擁有 2 至 5 年的經(jīng)驗,30 人(52%)表示他們擁有 5 年以上的經(jīng)驗,。


開始時,,這些醫(yī)生被要求僅根據(jù)皮膚鏡圖像(I 級)診斷惡性黑色素瘤或良性痣,并決定如何處理該狀況(手術(shù),、短期隨訪或不需要采取行動),。四周后,他們拿到了患者的臨床信息(包括年齡,、性別和病變位置)和相同的 100 例特寫圖像(II 級),,并被要求再次診斷并作出決定。


在 I 級中,,皮膚科醫(yī)生準確地檢測到平均 86.6% 的黑色素瘤,,正確地識別出平均 71.3% 的非惡性病變。然而,,當 CNN 與醫(yī)生水平持平,,即正確識別出 71.3% 的良性痣時,它檢測到 95% 的黑色素瘤,。在 II 級中,,皮膚科醫(yī)生的表現(xiàn)有所提高,,準確診斷出了 88.9% 的惡性黑色素瘤和 75.7% 的非惡性病變。


「CNN 漏診的黑色素瘤更少,,表明它比皮膚科醫(yī)生有更高的敏感度,,并且它將良性痣誤診為惡性黑色素瘤的次數(shù)也更少,這意味著它的專業(yè)性更強,;這將幫我們省去更多不必要的手術(shù),。」Haenssle 教授說,。


「當皮膚科醫(yī)生接收更多 II 級的臨床信息和圖像時,,他們的診斷結(jié)果得到提升。然而,,CNN 僅使用皮膚鏡圖像,,并且沒有接收額外的臨床信息,仍然超越了醫(yī)生的診斷能力,?!?/p>


專業(yè)的皮膚科醫(yī)生在 I 級中能超越經(jīng)驗較少的皮膚科醫(yī)生,在檢測惡性黑色素瘤中表現(xiàn)得更好,。然而,他們做出準確診斷的平均水平在兩個等級中仍然低于 CNN,。


「這些發(fā)現(xiàn)表明深度學習卷積神經(jīng)網(wǎng)絡(luò)在檢測黑色素瘤的任務(wù)中有能力超越皮膚科醫(yī)生,,包括那些受過大量訓練的專家?!顾f,。


惡性黑色素瘤的發(fā)病率越來越高,全世界每年估計有 232000 名新病例和大約 55500 名死亡病例,。如果能在早期檢測出來是可以被治愈的,,但很多病例僅在癌癥進一步惡化和更難治療的時候才被診斷出來。


Haenssle 教授說:「我曾經(jīng)參加一個研究項目將近 20 年,,它旨在改善黑色素瘤在可治愈階段的早期檢測,。我的團隊和我聚焦于非侵入式技術(shù),希望幫助醫(yī)生在執(zhí)行皮膚癌檢查時不漏診黑色素瘤,。當發(fā)現(xiàn)近期關(guān)于深度學習算法在特定任務(wù)上超越人類的報告時,,我立刻意識到可以在診斷黑色素瘤上探索這些人工智能算法?!?/p>


研究者并沒有設(shè)想用 CNN 取代皮膚科醫(yī)生診斷皮膚癌,,但可以將其作為一項額外輔助技術(shù)。


「這種 CNN 技術(shù)有望在皮膚癌檢查中輔助幫助醫(yī)生決定是否要做活檢病變,。大多數(shù)皮膚科醫(yī)生已經(jīng)使用數(shù)字皮膚鏡系統(tǒng)來對病變進行拍照,、歸檔和跟進,。然后 CNN 可以輕易和快速地評估已保存的影像,得到黑色素瘤概率的『專家意見』,。我們目前正計劃前瞻性研究來評估 CNN 對醫(yī)生和病患的現(xiàn)實影響,。」


該研究有一定的局限性,,包括:皮膚科醫(yī)生是在一個人工環(huán)境中,,他們知道自己沒有作出「生死」攸關(guān)的決定;測試集沒有涵蓋所有類型的皮膚損傷,;非白種人皮膚類型和遺傳背景的有效圖像較少,;事實上,醫(yī)生可能不會一直遵循他們不信任的 CNN 的建議,。


在隨后的社論 [4] 中,,Victoria Mar 博士(澳大利亞墨爾本莫納什大學)和 H. Peter Soyer 教授(澳大利亞布里斯班昆士蘭大學)寫道:「目前,黑色素瘤的診斷準確性取決于治療醫(yī)生的經(jīng)驗和培訓,?!璈aenssle 等人……已經(jīng)表明使用卷積神經(jīng)網(wǎng)絡(luò)的計算機算法優(yōu)于所測試的 58 名皮膚科醫(yī)生中的大多數(shù)……這表明人工智能保證了更標準化的診斷準確性水平,使得所有人,,無論他們住在哪里或看哪個醫(yī)生,,都能夠獲得可靠的診斷評估?!?/p>


他們強調(diào)了 AI 在成為臨床標準之前需要解決的一些問題,,包括在手指、腳趾和頭皮等部位的黑色素瘤難以成像,,以及如何訓練 AI 充分識別非典型和患者沒有發(fā)現(xiàn)的黑色素瘤,。


他們的結(jié)論是:「目前,沒有什么技術(shù)可以替代徹底的臨床檢查,。然而,,2D 和 3D 全身攝影能夠捕獲大約 90%~95% 的皮膚表面。鑒于成像技術(shù)的指數(shù)發(fā)展,,我們設(shè)想自動診斷遲早將改變皮膚病學的診斷模式,。但是,要將這一激動人心的技術(shù)安全地應(yīng)用到常規(guī)臨床護理中,,還有很多工作要做,。」


論文:Man against machine: diagnostic performance of a deep learning convolutional neural network for dermoscopic melanoma recognition in comparison to 58 dermatologists

微信圖片_20180529225215.jpg


論文鏈接:https://academic.oup.com/annonc/advance-article/doi/10.1093/annonc/mdy166/5004443


摘要


背景


深度學習卷積神經(jīng)網(wǎng)絡(luò)(CNN)可能促進黑色素瘤檢測,,但是仍缺乏 CNN 與大量皮膚科醫(yī)生診斷表現(xiàn)的對比數(shù)據(jù),。


方法


研究者使用皮膚鏡圖像和對應(yīng)診斷結(jié)果訓練谷歌的 Inception v4 CNN 架構(gòu)。在對比橫斷面研究中,,研究者使用了包含 100 張圖像的測試集(I 級:只有皮膚鏡圖像,;II 級:皮膚鏡圖像和臨床信息),。研究中主要的衡量指標包括:敏感度、特異性和 CNN 對病灶進行診斷分類(二分類)的 ROC 曲線下面積(AUC),,以及 58 名國際皮膚科醫(yī)生,。次要指標包括皮膚科醫(yī)生管理決策的診斷效果,以及他們的不同診斷表現(xiàn),。此外,,CNN 的表現(xiàn)還與 2016 生物醫(yī)學成像國際會議(ISBI)挑戰(zhàn)賽中的 top-five 算法進行了對比。


結(jié)果


在 I 級診斷中,,皮膚科醫(yī)生對病變分類的敏感性和特異性的平均得分(±標準差)分別為 86.6% (±9.3%) 和 71.3% (±11.2%),。獲得更多臨床信息后(level-II),得分分別提升到了 88.9% (±9.6%, P = 0.19) 和 75.7% (±11.7%, P < 0.05),。相比于皮膚科醫(yī)生在 I 級,、 II 級的特異性與敏感性得分,CNN 的 ROC 曲線顯示出更好的特異性(82.5%),。CNN 的 ROC 曲線下面積要比皮膚科醫(yī)生的平均 ROC 面積(0.86 vs 0.79, P < 0.01)大,。CNN 的得分接近 ISBI 2016 挑戰(zhàn)賽的 3 大頂級算法結(jié)果。

微信圖片_20180529225256.jpg


結(jié)論


我們首次對 CNN 與國際皮膚科醫(yī)生團隊(共 58 位,,其中包括 30 位專家)的診斷表現(xiàn)進行了對比,。大部分皮膚科醫(yī)生的表現(xiàn)都不如 CNN。有了 CNN 圖像分類輔助,,任何內(nèi)科醫(yī)生(無論經(jīng)驗多么豐富)都有可能從中受益,。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章,、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者,。如涉及作品內(nèi)容,、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,,以便迅速采取適當措施,,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118,;郵箱:[email protected],。