在强化学习中，哪个机制的引入使得强化学习具备了在利用与探索中寻求平衡的能力（）A.Bellman方程B.动态规_建筑考试题库网

人工智能

单项选择题

在强化学习中，哪个机制的引入使得强化学习具备了在利用与探索中寻求平衡的能力（）

A.Bellman方程
B.动态规划
C.蒙特卡洛采样
D.贪心策略

相关考题

判断题与one-hot的单词表达不同，在词向量模型中，单词和单词之间的共现关系被忽略了。

判断题一般而言，在深度学习模型中，层数越多，其完成的非线性映射就越复杂，因此模型就具有更强的学习能力。

判断题前馈神经网络和卷积神经网络的模型学习均是通过误差后向传播来优化模型参数，因此是一种监督学习方法。

All Rights Reserved 版权所有©建筑考试题库(jzkao.com)

备案号：湘ICP备2020024380号-3