性爱网在线免费观看视频_亚洲日韩精品久久久久一区_国产三级久久三级久久_国产在线高清在线精品

當前位置:首頁 > 科技文檔 > 數(shù)學 > 正文

對手類型未知情況下的兩人零和馬爾科夫博弈決策

控制理論與應用 頁數(shù): 8 2024-11-15
摘要: 本文研究一類典型的非完全信息博弈問題—–對手類型未知的兩人零和馬爾科夫博弈,其中對手類型多樣且每次博弈開始前無法得知對手類型.文中提出了一種基于模型的多智能體強化學習算法—–對手辨識的極大極小Q學習(DOMQ).該算法首先建立對手相關環(huán)境的經(jīng)驗模型,再使用經(jīng)驗模型學習納什均衡策略,己方智能體在實際博弈中根據(jù)經(jīng)驗模型判斷對手類型,從而使用相應的納什均衡策略,以保證收益下限.本文所... (共8頁)

開通會員,享受整站包年服務