基于值分布最大熵Actor-Critic算法的投資組合管理
摘要: 針對(duì)投資組合管理問(wèn)題,提出一種基于值分布強(qiáng)化學(xué)習(xí)算法(VD-MEAC)的投資組合框架.首先,以投資組合收益最大化為目標(biāo)建立強(qiáng)化學(xué)習(xí)框架,智能體的動(dòng)作就是投資組合的權(quán)重變化;然后,選擇股票因子做為智能體觀察到的狀態(tài)信息.在算法設(shè)計(jì)上通過(guò)新穎的技巧來(lái)平衡風(fēng)險(xiǎn)與收益:在控制風(fēng)險(xiǎn)方面,Critic網(wǎng)絡(luò)學(xué)習(xí)未來(lái)收益的整個(gè)分布,并排除過(guò)度自信的決策信息從而避免過(guò)估計(jì)帶來(lái)的風(fēng)險(xiǎn);在提高收益方... (共7頁(yè))
開通會(huì)員,享受整站包年服務(wù)