多项选择题

A.与环境交互获取奖励
B.需要明确的目标
C.依赖预先收集的数据
D.通过试错学习策略