基于深度強(qiáng)化學(xué)習(xí)的不確定作業(yè)車(chē)間調(diào)度方法
摘要: 作業(yè)車(chē)間調(diào)度是具有非確定性多項(xiàng)式(Non-deterministic polynomial,NP)難的經(jīng)典組合優(yōu)化問(wèn)題。在作業(yè)車(chē)間調(diào)度中,通常假設(shè)調(diào)度環(huán)境信息已知且在調(diào)度過(guò)程中保持不變,然而實(shí)際調(diào)度過(guò)程往往受到諸多不確定因素影響(如機(jī)器故障、工序變化)。本文提出基于混合優(yōu)先經(jīng)驗(yàn)重放的近端策略優(yōu)化(Proximal policy optimization with hybrid ... (共15頁(yè))
開(kāi)通會(huì)員,享受整站包年服務(wù)