单项选择题
在强化学习中,哪个机制的引入使得强化学习具备了在利用与探索中寻求平衡的能力()
A.Bellman方程B.动态规划C.蒙特卡洛采样D.贪心策略
判断题 与one-hot的单词表达不同,在词向量模型中,单词和单词之间的共现关系被忽略了。
判断题 一般而言,在深度学习模型中,层数越多,其完成的非线性映射就越复杂,因此模型就具有更强的学习能力。
判断题 前馈神经网络和卷积神经网络的模型学习均是通过误差后向传播来优化模型参数,因此是一种监督学习方法。