中文引用格式: 徐勝超,,楊波,,王宏杰,等. 基于云計(jì)算的蛋白質(zhì)折疊空間結(jié)構(gòu)預(yù)測(cè)[J]. 電子技術(shù)應(yīng)用,,2024,,50(8):10-16.
英文引用格式: Xu Shengchao,Yang Bo,,Wang Hongjie,,et al. Cloud computing based spatial structure prediction of protein folding[J]. Application of Electronic Technique,2024,,50(8):10-16.
引言
蛋白質(zhì)定義為由共價(jià)鍵實(shí)現(xiàn)若干種氨基酸相連的多肽鏈,是生命活動(dòng)不可缺少的重要物質(zhì)[1-2],,因其高度參與,,方使生命體具有活性[3]。分析蛋白質(zhì)結(jié)構(gòu)與功能對(duì)揭秘生物生命奧秘具有極其顯著的研究意義[4-6],。
蛋白質(zhì)分子具有較高的復(fù)雜度,,直接通過(guò)能量函數(shù)確定蛋白質(zhì)分子能量與結(jié)構(gòu)的關(guān)系描述難以實(shí)現(xiàn)[7],因此,,各種優(yōu)化算法應(yīng)運(yùn)而生,。謝騰宇等人[8]為了準(zhǔn)確確定蛋白質(zhì)折疊空間結(jié)構(gòu),設(shè)計(jì)了兩步構(gòu)象空間搜索框架,,該方法雖具有較好的局部搜索性能,,但數(shù)據(jù)處理量很高,難以取得突出的數(shù)據(jù)處理效率,。包晨等人[9]構(gòu)建的多尺度卷積和循環(huán)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型能夠充分捕獲氨基酸序列局部以及長(zhǎng)程特征信息,,將其作為多層雙向長(zhǎng)短期記憶網(wǎng)絡(luò)的輸入,實(shí)現(xiàn)蛋白質(zhì)折疊空間結(jié)構(gòu)的確定,。徐勝超[10]提出基于云計(jì)算的蛋白質(zhì)折疊模擬計(jì)算,,研究了PERM算法的運(yùn)行流程和面向MapReduce的子任務(wù)劃分方式。上述方法在蛋白質(zhì)折疊空間結(jié)構(gòu)預(yù)測(cè)上是可行的,,但受優(yōu)化算法以及網(wǎng)絡(luò)訓(xùn)練參數(shù)量的影響,,使得蛋白質(zhì)折疊空間結(jié)構(gòu)預(yù)測(cè)計(jì)算量較高,面對(duì)龐大規(guī)模的數(shù)據(jù)處理量,,如何提高算法執(zhí)行效率成為當(dāng)下急需解決的問(wèn)題,。
云計(jì)算技術(shù)采用虛擬化技術(shù),能高效地聚集多個(gè)物理節(jié)點(diǎn)并行化方式實(shí)現(xiàn)大規(guī)模數(shù)據(jù)的高效處理,,在高性能科學(xué)計(jì)算領(lǐng)域得到了廣泛的認(rèn)可[11-12],。因此,本文提出基于云計(jì)算的蛋白質(zhì)折疊空間結(jié)構(gòu)預(yù)測(cè)方法,,本文云計(jì)算平臺(tái)的軟件在版本上比文獻(xiàn)[10]已經(jīng)提高了很多,,在精準(zhǔn)獲取蛋白質(zhì)構(gòu)象的同時(shí)提高算法的運(yùn)行效率。
本文詳細(xì)內(nèi)容請(qǐng)下載:
http://forexkbc.com/resource/share/2000006114
作者信息:
徐勝超,,楊波,王宏杰,,毛明揚(yáng),,蔣金陵,蔣大銳
(廣州華商學(xué)院 數(shù)據(jù)科學(xué)學(xué)院,,廣東 廣州 511300)