文獻(xiàn)標(biāo)志碼:A
DOI: 10.16157/j.issn.0258-7998.233921
引用格式: 崔燾,張昊楠,,阮福明,等. 基于強(qiáng)化Q學(xué)習(xí)的海上地震勘探航線自動(dòng)規(guī)劃方法[J]. 電子技術(shù)應(yīng)用,,2023,,49(11):105-110.
【引言】
海上地震勘探航線規(guī)劃作為綜合導(dǎo)航系統(tǒng)的重要組成部分,,一直是各家石油公司的研究重點(diǎn),。由于海上地震勘探的特殊作業(yè)環(huán)境,,除洋流,、障礙物、水下環(huán)境和漁業(yè)等因素的干擾外,,拖纜船在工區(qū)內(nèi)的航線規(guī)劃往往來自于工作人員的現(xiàn)場(chǎng)決策,,受限于人員工作經(jīng)驗(yàn)等因素,拖纜作業(yè)實(shí)際施工效率較低,,直接導(dǎo)致工區(qū)采集成本的增加,。拖纜法地震勘探作為海上地震勘探的重要方法,當(dāng)前國內(nèi)外各主要石油公司都非常重視對(duì)拖纜地震勘探相關(guān)技術(shù)的研究,,以提高作業(yè)效率,探索海上地震勘探新技術(shù)與新方法,。
多年來,人們將機(jī)器學(xué)習(xí)應(yīng)用于醫(yī)學(xué),、軍事等各種行業(yè),,但是其應(yīng)用于石油物探領(lǐng)域是近年來才發(fā)展起來的,并取得了良好效果,。2020年,何健等人利用隨機(jī)森林方法預(yù)測(cè)裂縫發(fā)育帶,,證明隨機(jī)森林方法對(duì)裂縫帶預(yù)測(cè)結(jié)果準(zhǔn)確度較高[1],。2021年,,楊午陽等人提出一種基于U-Net深度學(xué)習(xí)網(wǎng)絡(luò)的地震數(shù)據(jù)斷層檢測(cè)方法,取得了良好效果[2] ,。
近幾年,強(qiáng)化學(xué)習(xí)(Reinforcement Learning, RL)作為機(jī)器學(xué)習(xí)的重要組成部分,被廣泛應(yīng)用于解決路徑規(guī)劃等優(yōu)化策略問題,。2018年,,王程博等人提出一種基于強(qiáng)化Q學(xué)習(xí)(Q-Learning)的無人駕駛船舶路徑規(guī)劃模型,有效地在未知環(huán)境中規(guī)劃出較優(yōu)路徑及成功避讓多個(gè)障礙物[3],。2019年,,封佳祥等人提出一種多任務(wù)約束條件下基于強(qiáng)化學(xué)習(xí)的水面無人艇路徑規(guī)劃方法,實(shí)現(xiàn)了完成多任務(wù)約束條件下的無人艇路徑規(guī)劃[4],。Q-Learning是一種基于Q值迭代的無模型強(qiáng)化學(xué)習(xí)方法,,如今被廣泛應(yīng)用于各個(gè)領(lǐng)域[5]。2020年,,胡學(xué)敏等人提出基于深度時(shí)空Q網(wǎng)絡(luò)的定向?qū)Ш阶詣?dòng)駕駛運(yùn)動(dòng)規(guī)劃方法來實(shí)現(xiàn)定向?qū)Ш降哪康腫6],。2021年,周彬等人提出了基于導(dǎo)向強(qiáng)化Q學(xué)習(xí)的無人機(jī)路徑規(guī)劃方法,,實(shí)現(xiàn)無人機(jī)的自主導(dǎo)航和快速路徑規(guī)劃[7],。2022年,楊秀霞等人提出一種基于階段Q學(xué)習(xí)的機(jī)器人路徑規(guī)劃方法,,使得機(jī)器人在復(fù)雜環(huán)境中能夠迅速找到無碰撞路徑[8],。
作為一種新技術(shù),Q-Learning方法在解決路徑規(guī)劃問題過程中取得了良好效果,。該方法引入石油物探領(lǐng)域解決海上地震勘探航線規(guī)劃,,將會(huì)顯著提升物探船的作業(yè)效率。
文章詳細(xì)內(nèi)容下載請(qǐng)點(diǎn)擊:基于強(qiáng)化Q學(xué)習(xí)的海上地震勘探航線自動(dòng)規(guī)劃方法AET-電子技術(shù)應(yīng)用-最豐富的電子設(shè)計(jì)資源平臺(tái) (chinaaet.com)
【作者信息】
崔燾1,,2,,張昊楠1,2,阮福明1,,2,,崔世峰1,2,,張少鵬1,,2
(1.中海油田服務(wù)股份有限公司物探事業(yè)部, 天津 300459,;2.海洋油氣勘探國家工程研究中心,, 北京 100028)