欢迎来到求知题库网求知题库官网

注册

全部科目 > 大学试题 > 大学选修课答案、在线作业答案 > 人工智能与信息社会

单项选择题

在ε-greedy策略当中，ε的值越大，表示采用随机的一个动作的概率越（），采用当前Q函数值最大的动作的概率越（）。

A.大；小
B.大；大
C.小；小
D.小；大

点击查看答案

上一题目录下一题

相关考题

单项选择题
在强化学习的过程中，学习率α越大，表示采用新的尝试得到的结果比例越（），保持旧的结果的比例越（）。

A.大；小
B.大；大
C.小；小
D.小；大
单项选择题
Q函数Q（s，a）是指在一个给定状态s下，采取某一个动作a之后，后续的各个状态所能得到的回报的（）。

A.期望值
B.最大值
C.最小值
D.总和
单项选择题
在Q-Learning中，所谓的Q函数是指（）。

A.状态动作函数
B.状态值函数
C.动作值函数
D.策略函数

微信小程序免费搜题

微信扫一扫,加企业群免费搜题

微信扫一扫,加企业群免费搜题

All Rights Reserved 版权所有©求知题库网库(csqiuzhi.com)

备案号：湘ICP备14005140号-1

经营许可证号：湘B2-20140064

关注
顶部

微信扫一扫,加企业群免费搜题

微信扫一扫,加企业群免费搜题