基于改進Q學習算法的AUV路徑規(guī)劃
摘要: 針對欠驅動AUV全局路徑規(guī)劃問題,提出一種輕量級改進Q學習算法。設計距離獎勵函數加快學習速率,提高算法穩(wěn)定性,結合ε貪婪策略和Softmax策略提供一種平衡探索與利用的機制,根據AUV運動約束簡化動作集合提高計算時間。仿真結果表明,改進的算法能夠高效解決AUV路徑規(guī)劃問題,提升算法穩(wěn)定性與適用范圍。相比較傳統Q學習算法,執(zhí)行短距離任務時,算法學習效率提高90%,路徑長度縮短7.... (共5頁)
開通會員,享受整站包年服務