當(dāng)前位置:首頁 > 科技文檔 > 電信技術(shù) > 正文

基于替代跡的蜂窩網(wǎng)信道分配Actor-Critic算法

計算機應(yīng)用研究 頁數(shù): 4 2018-04-15
摘要: 針對D2D混合蜂窩網(wǎng)絡(luò)在進(jìn)行信道分配時難以在較高信噪比條件下進(jìn)行自動信道分配的問題,提出了一種基于替代跡的蜂窩網(wǎng)絡(luò)信道分配Actor-Critic算法。首先定義了信道分配問題的MDP模型,然后定義了基于替代跡的Actor-Critic算法。Actor采用模擬退火探索策略自適應(yīng)控制狀態(tài)空間的搜索,將critic部分求解的值函數(shù)的時間差分誤差用于更新該策略的優(yōu)先級,再依優(yōu)先級對策略進(jìn)行更新;critic部分采用基于替代跡的值函數(shù)更新方式,并計算值函數(shù)的時間差分誤差,以指導(dǎo)actor改進(jìn)策略。實驗結(jié)果表明其具有系統(tǒng)吞吐量大和信噪比高的優(yōu)點。 (共4頁)

開通會員,享受整站包年服務(wù)