强化学习中近端策略优化（ProximalPolicyOptimization-PPO）的目的是：（）。A.减少_求知题库网

人工智能

单项选择题

强化学习中近端策略优化（ProximalPolicyOptimization-PPO）的目的是：（）。

A.减少学习过程中的方差
B.加速模型的收敛速度
C.优化策略的稳定性
D.提高策略的探索能力

相关考题

单项选择题层次聚类方法中，凝聚的层次聚类是从什么开始（）？

单项选择题下列不属于Keras 的核心模块的是（）。

单项选择题在深度学习中，哪个层通常用于减少特征图的维度并增加感受野（）？

All Rights Reserved 版权所有©求知题库网库(csqiuzhi.com)

备案号：湘ICP备14005140号-1

经营许可证号：湘B2-20140064