单项选择题
强化学习中近端策略优化(ProximalPolicyOptimization-PPO)的目的是:()。
A.减少学习过程中的方差
B.加速模型的收敛速度
C.优化策略的稳定性
D.提高策略的探索能力
点击查看答案&解析
相关考题
-
单项选择题
层次聚类方法中,凝聚的层次聚类是从什么开始()?
A.将每个数据点视为一个单独的簇
B.将所有数据点视为一个簇
C.随机选择数据点作为簇
D.根据数据的分布选择簇 -
单项选择题
下列不属于Keras 的核心模块的是()。
A.有激活函数
B.损失函数
C.滤波器
D.正则化器 -
单项选择题
在深度学习中,哪个层通常用于减少特征图的维度并增加感受野()?
A.卷积层
B.池化层
C.全连接层
D.激活层
