近期,,華為與昌平實驗室,、北京大學(xué)生物醫(yī)學(xué)前沿創(chuàng)新中心(BIOPIC)和化學(xué)與分子工程學(xué)院,、深圳灣實驗室高毅勤教授課題組及鵬城實驗室陳杰團隊基于全場景AI框架昇思MindSpore開發(fā)的蛋白質(zhì)結(jié)構(gòu)預(yù)測模型,在全球持續(xù)蛋白質(zhì)結(jié)構(gòu)預(yù)測競賽CAMEO(Continous Automated Model EvaluatiOn)獲得全球第一的好成績,。這顯示出昇騰AI基礎(chǔ)軟硬件平臺在 AI+科學(xué)計算 領(lǐng)域的強大能力。
4月21日最新月榜競賽結(jié)果
超越業(yè)界標(biāo)桿,,連續(xù)三周保持全球第一排名
蛋白質(zhì)結(jié)構(gòu)預(yù)測是人工智能走進生命科學(xué)的關(guān)鍵成果之一,,對生物學(xué)研究意義重大。2020年12月,,《科學(xué)》雜志評選了該年度十個重大科學(xué)突破,,蛋白質(zhì)結(jié)構(gòu)預(yù)測的人工智能AlphaFold就是其中非常重要的一項,因此AlphaFold成為生物研究領(lǐng)域的標(biāo)桿成果,,更是一塊重要里程碑,。
昇思MindSpore蛋白質(zhì)結(jié)構(gòu)預(yù)測模型研發(fā)進展
2021年11月,華為昇思MindSpore團隊與昌平實驗室,、北京大學(xué)生物醫(yī)學(xué)前沿創(chuàng)新中心(BIOPIC)和化學(xué)與分子工程學(xué)院,、深圳灣實驗室高毅勤教授課題組聯(lián)合推出基于AlphaFold2算法的蛋白質(zhì)結(jié)構(gòu)預(yù)測推理工具,并在2022年2月實現(xiàn)訓(xùn)練的全流程打通,,效率同比提升2-3倍,。
采用昇騰AI基礎(chǔ)軟硬件平臺后,在混合精度下,,單步迭代時間由20秒縮短到12秒,,性能提升超過60%。依托昇思MindSpore內(nèi)存復(fù)用能力,,訓(xùn)練序列長度由384提升至512。
在訓(xùn)練精度接近AlphaFold2的基礎(chǔ)上,,昇思MindSpore在算法,、規(guī)模和軟硬件支持等方向上持續(xù)改進,本次發(fā)布的蛋白質(zhì)結(jié)構(gòu)預(yù)測模型成績持續(xù)刷新業(yè)界記錄,、拿下CAMEO競賽第一,,是昇思MindSpore在蛋白質(zhì)結(jié)構(gòu)預(yù)測領(lǐng)域的又一里程碑,在填補國產(chǎn)人工智能基礎(chǔ)軟硬件在蛋白質(zhì)結(jié)構(gòu)預(yù)測領(lǐng)域成績空白的同時,,更加證明了其價值與優(yōu)越性,。
由瑞士生物信息研究所和巴塞爾大學(xué)聯(lián)合舉辦的 CAMEO(Continous Automated Model EvaluatiOn)——全球持續(xù)蛋白質(zhì)結(jié)構(gòu)預(yù)測競賽,被認為是蛋白質(zhì)結(jié)構(gòu)預(yù)測領(lǐng)域最重要的比賽之一,。CAMEO 競賽的規(guī)則是,,每位參賽者需每周對 20 個由世界范圍內(nèi)的結(jié)構(gòu)生物學(xué)家最新破解出的蛋白質(zhì)結(jié)構(gòu)進行預(yù)測,其分數(shù)和名次每周都會進行在線更新,。
該競賽吸引了眾多世界范圍內(nèi)生物計算領(lǐng)域的前沿模型“選手”基于昇思MindSpore AI框架訓(xùn)練的蛋白質(zhì)結(jié)構(gòu)預(yù)測模型,,一經(jīng)亮相,便領(lǐng)跑全球。在最近的三周CAMEO競賽中持續(xù)排名第一,,意味著昇騰AI基礎(chǔ)軟硬件平臺在AI for Science領(lǐng)域的強大能力,。
未來,針對蛋白質(zhì)結(jié)構(gòu)預(yù)測問題,,昇思MindSpore將攜手學(xué)術(shù)科研界更多合作伙伴,,在蛋白質(zhì)結(jié)構(gòu)預(yù)測領(lǐng)域共同探索、持續(xù)突破,,助力國內(nèi)相關(guān)基礎(chǔ)研究,,尤其是生命各分支學(xué)科的進步,推動創(chuàng)新制藥行業(yè)的發(fā)展,。