基于代碼嵌入的二進(jìn)制代碼相似性分析方法
所屬分類:技術(shù)論文
上傳者:zhoubin333
文檔大?。?span>2820 K
標(biāo)簽: 代碼表示 代碼嵌入模型 代碼搜索
所需積分:0分積分不夠怎么辦,?
文檔介紹:代碼嵌入利用神經(jīng)網(wǎng)絡(luò)模型將二進(jìn)制函數(shù)的代碼表示轉(zhuǎn)化為向量,,在漏洞搜索等應(yīng)用中展現(xiàn)了優(yōu)勢?,F(xiàn)有的方法將函數(shù)表示為匯編指令序列、控制流圖的拓?fù)浣Y(jié)構(gòu)或若干路徑,,都沒有克服不同編譯環(huán)境導(dǎo)致控制流圖結(jié)構(gòu)變化的干擾,。為此,設(shè)計了基于基本塊樹(Basic Block Tree, BBT)的代碼表示以及構(gòu)建了對應(yīng)的代碼嵌入模型BBTree。首先,,二進(jìn)制函數(shù)被表示為一系列BBT,,每個BBT被處理為指令序列;其次,,BBTree利用LSTM和BiGRU將基于BBT的代碼表示轉(zhuǎn)化為向量,;最后,,通過計算向量間的距離去高效衡量對應(yīng)函數(shù)的相似性,。在代碼搜索中,BBTree的平均準(zhǔn)確率比主流工具提升了24.8%;在漏洞搜索中,,BBTree的平均召回率比主流工具提升了26.1%,。
現(xiàn)在下載
VIP會員,AET專家下載不扣分,;重復(fù)下載不扣分,,本人上傳資源不扣分。