吳恩達團隊可能沒想到突然被diss,。
他們最近發(fā)布了全球最大的醫(yī)學影像數(shù)據(jù)集MURA,還用這個數(shù)據(jù)集訓練了一個169層的深度卷積神經(jīng)網(wǎng)絡模型,。
發(fā)布數(shù)據(jù)集的同時,,順帶也披露出這個AI模型識別肌肉骨骼病變的能力,比放射科醫(yī)師還是……差了那么一點點,。
結(jié)果這件事,,成為了導火索。
計算生物學界的一位戰(zhàn)士,,加州理工教授Lior Pachter見到這個成績后,,翻出了吳恩達幾個月之前發(fā)布的一條Twitter:
放射科醫(yī)師是不是該擔心一下自己的工作了?大新聞:我們的AI(ChexNet)現(xiàn)在讀胸腔X光片診斷肺炎的能力已經(jīng)超過放射科醫(yī)師了,。
這條搞了個大新聞的消息緊扣公眾痛點,,直指放射科醫(yī)師的失業(yè)問題,獲得了1400次轉(zhuǎn)發(fā),,2400個贊,。
結(jié)果,反差出來了,。
同樣一個團隊,,去年發(fā)布ChexNet時,暗示放射科醫(yī)師面臨失業(yè),。
而最近這個MURA模型的表現(xiàn)意味著:放射科醫(yī)師的工作,,似乎又保住了。
學界爭論
其實之前ChexNet診斷肺炎“超越放射科醫(yī)師”這個說法提出時,,受到的質(zhì)疑也不少,。
例如,Lior一手帶出來的博士,,現(xiàn)在斯坦福做博士后的Harold Pimentel,,看見吳恩達的Twitter就立刻就拿出來批判了一番:
放射科醫(yī)師們沒什么可擔心的;
介紹研究成果的時候要負責任一點,。
而跨界放射科醫(yī)師和機器學習研究者的Alexandre Cadrin也說,,論文結(jié)論很有意思,但放射科醫(yī)師們“不用擔心”,。
為什么不擔心,?秘密就在ChexNet的結(jié)果里。
Harold后來給出了解釋:
他說,,機器學習界研究醫(yī)學影像問題至少30年了,,但識別的結(jié)果普遍還是不如經(jīng)過專業(yè)訓練的人類,。吳恩達Twitter一發(fā),,說得好像這個問題已經(jīng)解決了一樣,可是他們只找了4名放射科醫(yī)師,,略微超過了他們的平均成績,。
醫(yī)生Eric Topol也在論文結(jié)果中標注了這樣兩句話,,提醒我們注意:
這個模型,就和4名放射科醫(yī)師比試了一下,,4個人就能代表所有從業(yè)者了,?
還有一名懂機器學習的放射科醫(yī)師Declan O’Regan指出,論文中的數(shù)據(jù)不足以支撐吳恩達Twitter的結(jié)論,,沒有曲線下面積(AUC)的統(tǒng)計對比,,沒有未選病例的外部盲測,沒有細節(jié),,沒有正常病例的比例,,對誤分類情況也沒舉出例子。
質(zhì)疑并不少,,但是所有人加起來,,聲量也不夠大。
生物學家,、醫(yī)生,、以及吳恩達的半個機器學習同行們對這條Twitter的不滿,很大程度上也是因為吳恩達老師的學術(shù)地位和影響力,。
在Lior看來,,吳恩達作為一名聞名學界內(nèi)外、有30萬Twitter粉絲的大V,,如此聳人聽聞,,對同行、對公眾,、對整個科學家群體來說,,都不是什么好事。
對同行來說,,傷害顯而易見,。知名學者拿著自己的研究成果大聲吆喝,普通科學家連一個小職業(yè)都消滅不了,,論文哪還好意思發(fā)表,?
對公眾和科學家群體來說,基本的信任就是這么被消滅的:公眾一次又一次這樣被言過其實地忽悠,,誰還會相信科學家,?
事情就是這么個事情。
Lior Pachter其人
Lior Pachter是計算生物學,、計算和數(shù)學科學教授,,目前任教于加州理工大學。目前其團隊主要研發(fā)基因組學的計算和實驗方法,,專注于單細胞測序技術(shù)的發(fā)展及其在RNA生物學中的應用,。
這已經(jīng)不是他第一次在網(wǎng)上開炮,。
例如四年前,剛剛開通博客不久的Pachter,,就連續(xù)發(fā)表三篇熊文,,強烈抨擊此前發(fā)表在Nature Biotechnology上的兩篇論文。
他抨擊的對象,,一位是知名的復雜網(wǎng)絡研究權(quán)威Albert-Laszlo Barabasi,,另一位是時任MIT計算生物研究組負責人的大牛Manolis Kellis。
是非曲直,,我們不做深究,。但在這一時間里,Pachter的風格同樣一覽無余的展現(xiàn)了出來,。當時有報道這么記述:
“萊爾寫博客的時間不長,,2013年8月開始,也就半年多的時間,。但絕對絕對是博客界的奇葩,。萊爾寫博客的風格非常鮮明,那就是無論如何上來先噼里啪啦一頓胖揍,?!盵1]
以及上面提到的第二個批評,還是Pachter隱忍多年,,找到一處細節(jié)之后,,全力啟動的一次爆發(fā)。足見這位教授也是心思縝密,、很愛開炮,,讓人不由得想起紐約大學的馬庫斯教授。
與當年的洋洋灑灑,、雷霆萬鈞相比,,他這次對吳恩達的批評,應該算是“三和一少”的態(tài)度了,。
而說馬庫斯,,馬庫斯就到。
剛剛馬庫斯也出手參與了一下這件事,,他又在Twitter上開炮:
“過度炒作可能已經(jīng)成了吳恩達的習慣,,在影像診斷上,在汽車上,,更普遍地說在AI上都是這樣,。”
關(guān)于未來
其實,,放狠話的不僅僅是吳恩達,。
此前,聲名煊赫的Geoffrey Hinton曾經(jīng)放言:從現(xiàn)在開始,,應該停止培訓放射科醫(yī)師,。他預言5-10年內(nèi)深度學習就將取代這些崗位。
作為一個克制的英國人,,Hinton對深度學習能帶來的醫(yī)療革命充滿熱情,。“我看過太多的醫(yī)生低效的使用數(shù)據(jù),,病患的歷時信息被大量忽略,;我看到醫(yī)生們無法很好地閱讀CT掃描,兩個醫(yī)生對同一個掃描片能得出不同的解讀”,。
在三次不同的場合,,醫(yī)生基于CT掃描說他妻子有繼發(fā)性腫瘤,但每次都是誤診,。Hinton相信AI會最終讓放射科醫(yī)師失業(yè),。
值得注意的是,前不久吳恩達的老師Michael I.Jordan發(fā)表了一篇博客,,題為《人工智能:革命遠未到來》,。
在這篇文章里,Jordan同樣回憶自己14年前的往事,,但暗示機器應用于醫(yī)療系統(tǒng)之后,,數(shù)據(jù)誤差等原因使得“唐氏綜合癥的診斷就不斷上升”,“導致了一些嬰兒不必要的死亡”,。
從這一個案例出發(fā),,Jordan拋出一個觀點:AI正在暴露出嚴重的缺陷,大家過于依賴數(shù)據(jù),,深度學習不是AI的全部,。并且建議關(guān)注更多推理、因果關(guān)系等方面的進展,。
未來,,爭論可能仍會不停上演。好在所有人的目標都是一致的,,那就是如何更好的造福人類社會,。