「YOLO 之父」Joseph Redmon 宣布退出計算機視覺領(lǐng)域了!這個剛剛出現(xiàn)的消息著實讓人工智能界感到驚訝,。
在社交網(wǎng)絡(luò)上,,這位 YOLO,、XNOR-Net 等知名 AI 算法的發(fā)明者昨天突然聲明:出于道德上的考慮,他決定停止一切有關(guān)計算機視覺的研究,。 在 AI 領(lǐng)域,,這還是第一次。
推文鏈接:https://twitter.com/jeremyphoward/status/1230610470991589376
在有關(guān)「不應(yīng)該發(fā)表的重要研究」的長篇討論中,,Redmon 現(xiàn)身發(fā)表了自己的看法:「我現(xiàn)在已經(jīng)停止了計算機視覺研究,,因為我看到了自己工作造成的影響。我熱愛自己的作品,,但我已經(jīng)無法忽視它在軍事領(lǐng)域的應(yīng)用以及給個人隱私帶來的風(fēng)險,。」 他還表示,,一些學(xué)者的想法是錯誤的,,他們認為,,「我們不必考慮新研究的社會影響,因為這很困難,,而且其他人也會幫我們做,。」 「盡管在大學(xué)階段我們一直被灌輸科學(xué)研究是中立的,,無論其內(nèi)容如何,。但如果我們認真考慮廣泛的影響,則基本所有面部識別工作都不應(yīng)被發(fā)表:它們幾乎不會帶來好處,,盡是負面風(fēng)險,。」 為什么突然有了這樣一番話,?一切討論似乎都是由最近人工智能頂會 NeurIPS 2020引發(fā)的,。 在今年正在進行的大會論文提交過程中,除了提前截稿,、提前拒稿,,讓論文作者當(dāng)審稿人等一系列新操作之外,還有一條就是必須提交「廣泛影響聲明」:
在 NeurIPS 2020大會官網(wǎng)論文提交指南中,,論文評審重大變化的第五條,。 NeurIPS 2020候選論文的作者被要求在他們提交論文的文件中加入新的討論部分,闡述其新工作可能產(chǎn)生的廣泛影響,,包括一些可能造成的正面和負面社會影響,。 近年來,隨著 AI 領(lǐng)域的快速發(fā)展,,人們對于科技的思考也越來越多,。投向 NeurIPS 的新研究,顯然代表了人工智能領(lǐng)域最先進的技術(shù),。但新科技對于社會發(fā)展的影響,,或許是科學(xué)家們此前有所忽略的地方。不過有關(guān)研究廣泛影響的考量竟讓計算機視覺領(lǐng)域的大牛選擇隱退江湖,,著實讓人驚訝,。 Redmon 和快到?jīng)]朋友的 YOLO 說到 YOLO,相信每個計算機視覺從業(yè)者都不陌生,。它是一種非常常用的目標檢測算法,,任務(wù)是找出圖像中我們感興趣的目標,確定其大小和位置并識別出具體是哪個對象,。從自動駕駛到人臉識別,,很多日常生活中的常見任務(wù)都離不開這種算法。 YOLO 模型最早是由 Joseph Redmon 等人在2015年提出的,,并在隨后的幾篇論文中進行了修訂,。
YOLO 目標檢測算法,。圖源:https://arxiv.org/pdf/1506.02640.pdf。
Faster R-CNN 及在其基礎(chǔ)上改進的 Mask R-CNN 在實例分割,、目標檢測,、人體關(guān)鍵點檢測等任務(wù)上都取得了很好的效果,但通常較慢,。而 YOLO 的創(chuàng)新之處在于,,它提出了 one-stage,即目標定位和目標識別在一個步驟中完成,,是名副其實的「You Only Look Once」,。 由于 YOLO 只使用單個網(wǎng)絡(luò),因此可以直接在檢測性能上進行端到端優(yōu)化,,使得基礎(chǔ) YOLO 模型能以每秒45幀的速度實時處理圖像。YOLO 的一個小規(guī)模版本——Fast YOLO 可以達到每秒155幀的處理速度,。 YOLO 有著讓人驚艷的速度,,同時也有讓人止步的缺陷:不擅長小目標檢測。為了彌補這一缺陷,,2018年,,Redmon 等人發(fā)布了 YOLO v3。這一新版本保持了 YOLO 的速度優(yōu)勢,,提升了模型精度,,尤其加強了小目標、重疊遮擋目標的識別,,補齊了 YOLO 的短板,,是目前速度和精度均衡的目標檢測網(wǎng)絡(luò)。 研究者們對于 YOLO 下一個版本的展望主要在于三個方面:更高的識別準確率,、更加廣泛的實時監(jiān)測,,以及更輕量化的模型。在 GitHub 上,,人們對于 v4版本什么時候出的問題,,得到的答案一直是「coming soon」。 一直以來,,Joseph Redmon 跟隨 Allen School 教授 Ali Farhadi 從事計算機視覺研究,,他是2018年度谷歌博士獎學(xué)金的獲得者,理由是在「創(chuàng)造更快,、更好,、更有用的計算機視覺應(yīng)用工具」方面的貢獻。
Redmond 曾在 TED 上向人們介紹計算機視覺技術(shù)的發(fā)展,。Redmon 曾在艾倫人工智能研究所實習(xí)(后孵化出初創(chuàng)公司 XNOR.ai,,該公司現(xiàn)已被蘋果收購),,當(dāng)時參與的是 XNOR-Net 開發(fā)工作。在此之前,,他也曾在谷歌大腦有過實習(xí)經(jīng)歷,。 當(dāng)然,他最有名的個人項目還是 YOLO,,這一成果最早在論文《You Only Look Once: Unified, Real-Time Object Detection》中進行了詳細介紹,,文章也獲得了 CVPR 2016「OpenCV People's Choice Award」獎項;Redmon 與導(dǎo)師合著的論文《YOLO9000: Better, Faster, Stronger》獲得 CVPR 2017最佳論文榮譽提名獎,。 To be or not to be? 自己的工作對社會有潛在的負面影響就應(yīng)該停止研究嗎,?在 Redmon 的推文底下,大家展開了一番討論,。 前谷歌大腦機器人研究專家 Kevin Zakka 認為,,研究者不應(yīng)該因為自己的工作可能帶來負面影響而停止研究。相反,,你應(yīng)該利用自己在該領(lǐng)域的影響力來提高人們的警惕,,將研究成果用在正確的地方。
不少人表達了相似的見解,。有人認為,,你停止研究并不代表別人也會停。以愛因斯坦的相對論為例,,其他人幾乎也同時得出了相同的結(jié)論,。這個方向不會因你而停滯不前,而且,,繼續(xù)做研究的人道德水平可能并不如你,。所以,與其讓一個不了解這一領(lǐng)域潛在危害的人來引領(lǐng)發(fā)展方向,,還不如這一領(lǐng)域最清楚利弊的人繼續(xù)做,。
當(dāng)然,也有人有不同意見,,認為「如果這件事從本質(zhì)上就是錯的,,那你永遠也無法找出一種正確的做法?!?/p>
從這個邏輯上來說,,如果某個方向有潛在危害,這個領(lǐng)域的專家不僅應(yīng)該停止研究,,更應(yīng)該站出來,,成為阻止這種研究方向的意見領(lǐng)袖。
YOLO之父退出CV界,稱因無法接受其研究成果負面影響
很多技術(shù)都是一把雙刃劍,,它們的出現(xiàn)推動著人類社會的發(fā)展,,但也伴隨著倫理、道德問題的討論,。諾貝爾后悔發(fā)明了炸藥,,但我們今天開山修路卻離不了它。在這種道德困境下,,科學(xué)家應(yīng)該如何做選擇,?簡單的討論恐怕很難回答這一問題。 在討論區(qū),,也有人給出了下一步的職業(yè)建議,,認為 Redmon 可以進入醫(yī)療 CV 領(lǐng)域。這一領(lǐng)域目前還有很多待解決的問題,。
不知 Joseph Redmon 和 YOLO 的未來將何去何從,。