单项选择题
在强化学习中,什么是“马尔可夫性质”()?
A.智能体可以随时选择任何动作B.环境的动态会随时间改变C.下一个状态只取决于当前状态和采取的动作D.智能体可以看到完整的状态空间
单项选择题 Mixup 数据增广的关键点是什么()?
单项选择题 强化学习算法中,用于优化策略的一种方法是:()。
单项选择题 下列哪个是用于图像分类任务中最著名的预训练模型之一()?