基于D3QN的火力方案優(yōu)選方法
摘要: 針對(duì)在多類彈藥協(xié)同攻擊地面工事類目標(biāo)任務(wù)中火力方案優(yōu)選效率低的問題,提出一種基于雙層決斗DQN(duelingdoubledeepQnetwork,D3QN)的火力方案優(yōu)選方法。該方法將打擊過程建模為馬爾科夫決策過程(Markovdecisionprocesses,MDP),設(shè)計(jì)其狀態(tài)空間和動(dòng)作空間,設(shè)計(jì)綜合獎(jiǎng)勵(lì)函數(shù)激勵(lì)火力方案生成策略優(yōu)化,使智能體通過強(qiáng)化學(xué)習(xí)框架對(duì)策略進(jìn)行自... (共9頁)
開通會(huì)員,享受整站包年服務(wù)