百度硅谷AI Lab發(fā)表新的深度學(xué)習(xí)算法NCRF(Neural CondiTIonal Random Field),,據(jù)稱可改善目前活體組織切片檢查WSI(Whole Slide Image)分析的結(jié)果,,協(xié)助病理學(xué)家提升腫瘤辨識(shí)效率與正確性,。百度并以開源方式,,在GitHub釋出該算法。
據(jù)報(bào)導(dǎo),,WSI是數(shù)GB大的影像檔,,通常包含數(shù)十億畫素(pixel),病理學(xué)家必須仔細(xì)檢視病理切片影像尋找腫瘤細(xì)胞,,但微轉(zhuǎn)移(micrometastases)的小群腫瘤細(xì)胞直徑可小到1,000畫素,,因此要從巨大的病理切片影像中有效分析辨識(shí)猶如大海撈針。即使運(yùn)用深度學(xué)習(xí)算法,,也僅能檢驗(yàn)WSI影像的一部分,。
目前許多WSI的深度學(xué)習(xí)算法,選擇將影像分割為如256x256畫素較小的尺寸獨(dú)立進(jìn)行分析,,但腫瘤周圍特別是腫瘤與正常細(xì)胞交界處的影像會(huì)影響預(yù)測結(jié)果,,由于這些算法的深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)無法將周圍的影像一并納入分析,反而增加從分割影像預(yù)測腫瘤的難度,,經(jīng)常導(dǎo)致偽陽性誤判,。
百度的NCRF算法運(yùn)用CRF建立分割后相鄰影像之間空間相關(guān)性(spaTIal correlaTIon)模型,不需經(jīng)過前置或后續(xù)處理,,即可以標(biāo)準(zhǔn)back-propagaTIon算法進(jìn)行端對(duì)端訓(xùn)練,。CNN會(huì)從影像擷取特征,然后運(yùn)用機(jī)率圖形模式(probabilistic graphical model)聚合相鄰影像的信息納入分析,,因此能改善腫瘤預(yù)測,、減少偽陽性誤判。
以Camelyon16資料集(dataset)測試百度的NCRF算法,,腫瘤定位準(zhǔn)確度(FROC)平均分?jǐn)?shù)可達(dá)0.8096,,優(yōu)于專業(yè)病理學(xué)家的0.7240與Camelyon16挑戰(zhàn)賽的前記錄0.8074。不過百度研究人員認(rèn)為,NCRF最合適的應(yīng)用方式還是做為人類專家的輔助工具,,讓病理學(xué)家有更多時(shí)間專注于算法標(biāo)記出的腫瘤區(qū)域,。
NCRF算法為通用技術(shù),但受限于訓(xùn)練用資料集的數(shù)量與規(guī)模,,目前主要使用乳癌的公共資料,,百度希望大陸醫(yī)院能提供更多更大型的資料集,進(jìn)行近一步的臨床研究,,以徹底評(píng)估算法,,并驗(yàn)證在其它類型腫瘤的應(yīng)用。然而要將NCRF算法集成至現(xiàn)有病理切片分析儀器需要配套法規(guī),,但目前尚缺具體指導(dǎo)原則,,實(shí)際應(yīng)用于臨床病例還要一段時(shí)間。