改進(jìn)深度神經(jīng)網(wǎng)絡(luò)在愛恩斯坦棋中的應(yīng)用研究
摘要: 愛恩斯坦棋作為一種附帶隨機(jī)性的完美信息博弈,其難度在于每次投擲骰子導(dǎo)致的結(jié)果不確定性,這增加了策略設(shè)計(jì)和局面的評(píng)估難度。針對(duì)愛恩斯坦棋的游戲規(guī)則,提出了一種改進(jìn)的深度學(xué)習(xí)方法。對(duì)Alpha(go) Zero神經(jīng)網(wǎng)絡(luò)模型進(jìn)行改進(jìn)和設(shè)計(jì),使其能精確地評(píng)估各種棋盤狀態(tài),生成有效的游戲策略。通過(guò)結(jié)合改進(jìn)的殘差神經(jīng)網(wǎng)絡(luò)和蒙特卡洛樹搜索,提取棋局特征并進(jìn)行局面評(píng)估,動(dòng)態(tài)生成策略和進(jìn)行決策。... (共7頁(yè))
開通會(huì)員,享受整站包年服務(wù)