单项选择题
强化学习中近端策略优化(ProximalPolicyOptimization-PPO)的目的是:()。
A.减少学习过程中的方差B.加速模型的收敛速度C.优化策略的稳定性D.提高策略的探索能力
单项选择题 层次聚类方法中,凝聚的层次聚类是从什么开始()?
单项选择题 下列不属于Keras 的核心模块的是()。
单项选择题 在深度学习中,哪个层通常用于减少特征图的维度并增加感受野()?