《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 可編程邏輯 > 業(yè)界動態(tài) > 學(xué)界 | 從零開始自學(xué)設(shè)計新型藥物,,UNC提出結(jié)構(gòu)進(jìn)化強(qiáng)化學(xué)習(xí)

學(xué)界 | 從零開始自學(xué)設(shè)計新型藥物,,UNC提出結(jié)構(gòu)進(jìn)化強(qiáng)化學(xué)習(xí)

2018-08-03
關(guān)鍵詞: AI醫(yī)療 SMILES Stack-RNN

搜索關(guān)鍵詞「AI,、診斷」,微信上出現(xiàn)一大堆關(guān)于 AI 醫(yī)療的文章,,從失明到肺病再到癌癥,,AI 似乎無所不能。前不久,來自北卡羅來納大學(xué)埃謝爾曼藥學(xué)院的一個團(tuán)隊創(chuàng)造了一種人工智能方法 ReLeaSE,,能夠從零開始自學(xué)設(shè)計新型藥物分子。近日,,該研究已被發(fā)表在 Science Advances 上,。

微信圖片_20180803163527.jpg

生成具備期望屬性的新型化合物 SMILES 字符串的深度強(qiáng)化學(xué)習(xí)算法工作流程。(A) 生成 Stack-RNN 的訓(xùn)練步,。(B) 生成 Stack-RNN 的生成器步驟,。在訓(xùn)練過程中,輸入 token 是一個當(dāng)前處理的簡化分子線性輸入系統(tǒng)(SMILES)字符串(來自訓(xùn)練集)中的一個字符,。該模型根據(jù)前綴(prefix)輸出下一個字符的概率向量 pΘ(a_t|s_t ? 1),。參數(shù) Θ 的向量通過交叉熵?fù)p失函數(shù)最小化進(jìn)行優(yōu)化。在生成器步驟中,,輸入 token 是前一步生成的字符,。然后從分布 pΘ(a_t| s_t ? 1) 中隨機(jī)采樣字符 a_t。(C) 生成新型化合物的強(qiáng)化學(xué)習(xí)系統(tǒng)的一般流程,。(D) 預(yù)測模型機(jī)制,。該模型將 SMILES 字符串作為輸入,然后提供一個實數(shù)(即估計屬性值)作為輸出,。該模型的參數(shù)使用 l2 平方損失函數(shù)最小化進(jìn)行訓(xùn)練,。Credit: Science Advances (2018). DOI: 10.1126/sciadv.aap7885


北卡羅來納大學(xué)埃謝爾曼藥學(xué)院(UNC Eshelman School of Pharmacy)創(chuàng)造的人工智能方法能夠從零開始自學(xué)設(shè)計新型藥物分子,這有望大幅加快新型藥物的研發(fā)速度,。


該系統(tǒng)名為「結(jié)構(gòu)進(jìn)化強(qiáng)化學(xué)習(xí)」(Reinforcement Learning for Structural Evolution),,又稱 ReLeaSE。ReLeaSE 既是一種算法,,也是一種計算機(jī)程序,,它將兩種神經(jīng)網(wǎng)絡(luò)合二為一,二者可被分別視為老師和學(xué)生,。老師了解大約 170 萬種已知生物活性分子化學(xué)結(jié)構(gòu)詞匯背后的句法和語言規(guī)則,。通過與老師合作,學(xué)生逐漸學(xué)習(xí)并提高自己的能力,,創(chuàng)造有望作為新藥使用的分子,。


ReLeaSE 的創(chuàng)造者 Alexander Tropsha、Olexandr Isayev 和 Mariya Popova 均來自 UNC 埃謝爾曼藥學(xué)院,。UNC 已經(jīng)為該技術(shù)申請了專利,,該團(tuán)隊上周在 Science Advances 上發(fā)表了一份概念驗證性研究。


「這一過程可以借鑒語言學(xué)習(xí)過程來描述:學(xué)生掌握分子字母表及語言規(guī)則之后,,他們就能自己創(chuàng)造新『詞』(也就是新分子),?!筎ropsha 說,「如果新分子實用且達(dá)到預(yù)期效果,,老師就會批準(zhǔn),。反之,老師就會否決,,強(qiáng)制學(xué)生避開糟糕的分子并去創(chuàng)造有用的分子,。」


ReLeaSE 是一種強(qiáng)大的藥物虛擬篩選工具,,這種計算方法已經(jīng)被制藥業(yè)廣泛用于確定可用的候選藥物,。虛擬篩選讓科學(xué)家可以評估現(xiàn)有的大型化學(xué)庫,但該方法只對已知的化學(xué)物質(zhì)有效,。而 ReLeaSE 具備獨特的能力,,可以創(chuàng)建和評估新型分子。


「使用虛擬篩選的科學(xué)家就像餐館中點菜的顧客那樣,,能點的菜通常僅限于菜單上有的,。」Isayev 說道,,「我們想為科學(xué)家提供一個『雜貨店』和『個人廚師』,,做出任何他們想要的菜式?!?/p>


該團(tuán)隊利用 ReLeaSE 生成具有他們指定特性(如生物活性和安全性)的分子,,還可以使用該方法設(shè)計具有定制物理特性(如熔點、水溶性)的分子,,以及設(shè)計對白血病相關(guān)酶具有抑制活性的新型化合物,。


Tropsha 稱:「對于一個需要不斷尋找新方法來縮短新藥進(jìn)入臨床試驗所需時間的行業(yè)來說,,該算法極具吸引力,,因為它能設(shè)計出具有特定生物活性和最佳安全性的新化學(xué)實體?!?/p>

論文:Deep reinforcement learning for de novo drug design

微信圖片_20180803163555.jpg

論文鏈接:http://advances.sciencemag.org/content/4/7/eaap7885/tab-pdf


摘要:我們設(shè)計并實現(xiàn)了一種新的計算策略,,用于從零開始設(shè)計具有期望屬性的分子,稱為ReLeaSE(Reinforcement Learning for Structural Evolution,,結(jié)構(gòu)進(jìn)化強(qiáng)化學(xué)習(xí)),。基于深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)方法,,ReLeaSE集成了兩個深度神經(jīng)網(wǎng)絡(luò)——生成和預(yù)測神經(jīng)網(wǎng)絡(luò),,這兩個神經(jīng)網(wǎng)絡(luò)被單獨訓(xùn)練,但都用于生成新的目標(biāo)化學(xué)庫,。ReLeaSE僅使用簡化分子線性輸入系統(tǒng)(SMILES)字符串來表示分子,。生成模型通過堆棧增強(qiáng)的記憶網(wǎng)絡(luò)來訓(xùn)練,,以產(chǎn)生化學(xué)上可行的SMILES字符串,預(yù)測模型則用來預(yù)測新生成化合物的期望屬性,。在該方法的第一階段,,使用監(jiān)督學(xué)習(xí)算法分別訓(xùn)練生成模型和預(yù)測模型。在第二階段,,兩種模型使用RL方法一起訓(xùn)練,,以偏向于產(chǎn)生具有所需物理和/或生物特性的新化學(xué)結(jié)構(gòu)。在該概念驗證研究中,,我們使用ReLeaSE方法設(shè)計化學(xué)庫,,該化學(xué)庫偏向于結(jié)構(gòu)復(fù)雜性,偏向于具有最大,、最小或特定物理屬性范圍的化合物,,如熔點或疏水性,或者偏向于對Janus蛋白激酶2具有抑制活性的化合物,。本文提出的方法可用于找到產(chǎn)生對單一或多個期望屬性進(jìn)行優(yōu)化了的新化合物的目標(biāo)化學(xué)庫,。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點,。轉(zhuǎn)載的所有的文章、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容,、版權(quán)和其它問題,,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟(jì)損失,。聯(lián)系電話:010-82306118;郵箱:[email protected],。