A、连续强化
B、定时强化
C、定比强化
D、计时强化
A、探索;开发 B、开发;探索 C、探索;输出 D、开发;输出
A、子策略一定是最优的 B、子策略不是最优的 C、子策略是否最优和前面决策有关 D、子策略是否最优与后面策略有关
订单号: 遇到问题请联系在线客服