百度硅谷AI Lab發(fā)表新的深度學習算法NCRF(Neural CondiTIonal Random Field),,據(jù)稱可改善目前活體組織切片檢查WSI(Whole Slide Image)分析的結(jié)果,協(xié)助病理學家提升腫瘤辨識效率與正確性,。百度并以開源方式,,在GitHub釋出該算法,。
據(jù)報導,WSI是數(shù)GB大的影像檔,,通常包含數(shù)十億畫素(pixel),,病理學家必須仔細檢視病理切片影像尋找腫瘤細胞,但微轉(zhuǎn)移(micrometastases)的小群腫瘤細胞直徑可小到1,000畫素,,因此要從巨大的病理切片影像中有效分析辨識猶如大海撈針,。即使運用深度學習算法,也僅能檢驗WSI影像的一部分,。
目前許多WSI的深度學習算法,,選擇將影像分割為如256x256畫素較小的尺寸獨立進行分析,但腫瘤周圍特別是腫瘤與正常細胞交界處的影像會影響預測結(jié)果,,由于這些算法的深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)無法將周圍的影像一并納入分析,,反而增加從分割影像預測腫瘤的難度,經(jīng)常導致偽陽性誤判,。
百度的NCRF算法運用CRF建立分割后相鄰影像之間空間相關(guān)性(spaTIal correlaTIon)模型,,不需經(jīng)過前置或后續(xù)處理,即可以標準back-propagaTIon算法進行端對端訓練,。CNN會從影像擷取特征,,然后運用機率圖形模式(probabilistic graphical model)聚合相鄰影像的信息納入分析,因此能改善腫瘤預測,、減少偽陽性誤判,。
以Camelyon16資料集(dataset)測試百度的NCRF算法,腫瘤定位準確度(FROC)平均分數(shù)可達0.8096,,優(yōu)于專業(yè)病理學家的0.7240與Camelyon16挑戰(zhàn)賽的前記錄0.8074,。不過百度研究人員認為,NCRF最合適的應用方式還是做為人類專家的輔助工具,,讓病理學家有更多時間專注于算法標記出的腫瘤區(qū)域,。
NCRF算法為通用技術(shù),但受限于訓練用資料集的數(shù)量與規(guī)模,,目前主要使用乳癌的公共資料,,百度希望大陸醫(yī)院能提供更多更大型的資料集,進行近一步的臨床研究,,以徹底評估算法,,并驗證在其它類型腫瘤的應用。然而要將NCRF算法集成至現(xiàn)有病理切片分析儀器需要配套法規(guī),,但目前尚缺具體指導原則,,實際應用于臨床病例還要一段時間,。