10 月 8 日,,瑞典皇家科學院宣布,,2024 年諾貝爾物理學獎授予美國科學家約翰 · 霍普菲爾德(John J. Hopfield)和英裔加拿大科學家杰弗里 · 辛頓(Geoffrey E. Hinton),以表彰他們利用物理學工具,,開發(fā)出了當今強大機器學習技術的基礎方法,。
一天之后,瑞典皇家科學院又宣布,,將 2024 年諾貝爾化學獎授予大衛(wèi) · 貝克(David Baker),、戴米斯 · 哈薩比斯(Demis Hassabis)和約翰 · 江珀(John M.Jumper),以表彰他們用 AI 在蛋白質設計和蛋白質結構預測領域作出的貢獻,。
你可以簡單理解為,,諾獎評委們把諾貝爾物理學獎頒給了機器學習,而諾貝爾化學獎頒給了 AI 預測蛋白質結構和蛋白質設計,。
為什么 AI 突然能拿下兩座諾貝爾大獎,?AI 站上諾貝爾獎舞臺背后,到底隱藏著一個什么趨勢,?
AI 連下兩座諾貝爾大獎
先說下諾貝爾物理學獎的獲得者霍普菲爾德和辛頓,。
霍普菲爾德在 1982 年創(chuàng)造出聯想神經網絡,現在通稱為霍普菲爾德網絡(Hopfield network),,可以存儲并重現圖像和其他數據模式的關聯記憶技術,。
簡單來說,霍普菲爾德網絡解決的問題是:人是如何進行聯想記憶的,,也就是如何通過某一部分的記憶聯想起整個記憶,。比如,你聽到一個人的名字,,就能聯系他的長相,。
而作為深度學習領域的領軍人物,辛頓的最大貢獻在于,開發(fā)了一種新的神經網絡:玻爾茲曼機,。
在我們大腦中,,神經元之間會相互作用,有些神經元的決策是可以影響另一部分的神經元,。借用知乎上產品二姐的比方:
有些神經元的決策是可以表現出來的,,比如某些人看了《長安三萬里》這部動畫片。但又有些神經元的表現是不可見的,,比如某些人看《長安三萬里》是因為喜歡唐詩,有些人看是因為喜歡追光動畫,,還有些人是因為陪喜歡的人一起看,。
而玻爾茲曼機所要做的事,就是搞清楚這些可見和不可見神經元之間互相影響的關系,。
玻爾茲曼機的出現,,很大程度推動了機器學習的快速發(fā)展。特別是在深度學習發(fā)展早期,,波爾茲曼機被用來預訓練深層神經網絡,,幫助網絡在進行更復雜學習任務之前,找到合適的權重初始狀態(tài),。
說完物理學獎,,再來說說諾貝爾化學獎。
其中,,諾貝爾化學獎獲獎者之一的大衛(wèi) · 貝克,,率先開發(fā)了設計和預測蛋白質三維結構的方法,創(chuàng)造出了全新的蛋白質,,基于創(chuàng)新的軟件,、算法解決醫(yī)學難題。
而戴米斯 · 哈薩比斯和約翰 · 江珀,,則參與創(chuàng)造的 AI 蛋白質結構分析工具 AlphaFold,,直接把蛋白質預測這事帶到了一個新紀元。
如果將生命體比作一個拼好的樂高積木,,那蛋白核酸等大分子就像一個個獨立的樂高零件,。在過去的五十年里,理解每一個樂高零件的形狀就是結構生物學家的主要工作,。
但這事并不容易,,蛋白質是由 20 種不同的氨基酸按特定序列連接形成的多聚體,這些不同的氨基酸通常會折疊成某一個特定的形狀,。所以,,想要真正地理解蛋白質如何發(fā)揮作用,科學家們就必須準確地掌握蛋白質的空間結構,。
蛋白質結構從簡單到復雜,,總共分為 4 級,。一級結構比較容易確定,簡單的生物實驗如質譜法即可,,但涉及到二級以上結構如何折疊的,,結構生物學家往往需要利用 X 射線、核磁共振,、電游儀,、冷凍電鏡來檢測。
這些方法耗時耗力,、人工成本也極高,,比如電泳儀只能間接進行測量,實驗中還受較多因素干擾,,因而會影響對蛋白質結構的分析與理解,。而能高分辨率解析的冷凍電鏡則極為昂貴,一臺約 1 億人民幣左右,。截至今年,,我國的冷凍電鏡也只有 60 多臺。
AlphaFold 厲害的地方在于,,通過深度學習模型來預測蛋白質更高結構,,不僅非常快,,而且相當準確,,大大提高了蛋白質研究的效率。
2021 年,,AlphaFold 就預測了 35 萬個蛋白質結構,,這包括了 98.5% 的人類蛋白質,并將這些蛋白質結構放到了 AlphaFold-EBI 數據庫中,。到了 2022 年,,這個數據庫中的蛋白質數超過了 2 億,幾乎包含了地球上所有可能存在的蛋白質,。
可以說,,AlphaFold 幾乎一個人把預測蛋白質結構這事給做了,這對人類探索自身的生命密碼尤其重要,。
知識的盡頭是 AI
雖然機器學習拿下諾貝爾物理學獎這事有很大爭議,,但另一個已成的事實是,AI 已經幾乎滲透到所有的學科,,并產生了不可忽視的影響,。
原因很簡單,AI 的學習效率比人強太多。在之前很長時間里,,辛頓一直認為,,人的智慧比 AI 更高。但這幾年,,辛頓看法開始轉變,,因為他發(fā)現,AI 在知識傳播效率,、學習機制,、能源效率方面都比人強。
就拿知識傳播來說,,當一個 AI 智能體掌握了某個知識,,所有的 AI 智能體都能立刻學會這個知識。相反,,人類只能通過觀察和復制教師行為來學習,這個過程時間更長且效率更低,。
再說學習機制,,人類的大腦里有 100 萬億個連接,而 GPT 只有一萬億個,,數量遠遠低于人類,。但一個 GPT 用 1700 多億的參數,居然就記住了人類所有的知識和文明,,而且還可以進行抽象的思考,。
這意味著,AI 比人類更擅長將大量知識放在 1 萬億的連接中,。換句話說,,AI 可能找到了比人類更好的學習方法。
在 AI 強大的學習能力之下,,知識正在迅速貶值,。OpenAI 早期投資人 Vinod Khosla 曾預測,未來幾乎所有的專業(yè)知識都將被 AI 免費化,。
持有類似觀點的還有牛津大學教授 Nick Bostrom,。他的觀點更極端,本科和博士課程將加速貶值,,傳統(tǒng) 20-30 年以知識傳遞為核心的人力資本投資將看不到任何回報,。
但與此同時,跨學科知識的重要性可能被進一步提升,,即使用計算機工具,,以及與其他學科的理論,去幫助其它學科(物理,化學,,材料,,生物,醫(yī)藥)攻克學術難題,。
也就是說,,未來學好人工智能,很有可能會比拒絕人工智能的人,,能更有效的工作,,形成新的重要發(fā)現,甚至爭奪各個方向的諾貝爾獎,。
甚至有一天,,一個拿 GPT-X 寫文章的人,或許也能夠獲得諾貝爾文學獎,。