欢迎来到求知题库网 求知题库官网
logo
全部科目 > 大学试题 > 计算机科学 > 人工智能

单项选择题

在强化学习中,什么是“动态规划”(DynamicProgramming)()?

    A.一种用于优化策略的方法
    B.一种用于计算状态值的方法
    C.一种用于选择动作的规则
    D.一种用于表示环境模型的数据结构

点击查看答案&解析

相关考题

微信小程序免费搜题
微信扫一扫,加关注免费搜题

微信扫一扫,加关注免费搜题

微信扫一扫,加关注免费搜题

微信扫一扫,加关注免费搜题