单项选择题
普通反向传播算法和随时间的反向传播算法(BPTT)有什么技术上的不同()
A.与普通反向传播不同的是,BPTT会在每个时间步长内减去所有对应权重的梯度
B.与普通反向传播不同的是,BPTT会在每个时间步长内叠加所有对应权重的梯度
C.两者无关
点击查看答案&解析
相关考题
-
单项选择题
下列哪种词嵌入可以自定义训练特定主题()
A.Word2Vec
B.BERT
C.GloVe
D.以上所有 -
单项选择题
下面哪个描述可以最好的描述early stopping()
A.在每⼀个训练epoch后在测试集上模拟网络,当归⼀化误差(generalization error)减小时停止训练
B.种更快的后向传播方式,像是Quickprop算法
C.在权重值更新时上加⼀个动量项(momentum term),使训练能够更快地收敛
D.训练网络知道误差函数出现⼀个局部最小值 -
单项选择题
相同的词可以通过()来实现多个词嵌入。
A.GloVe
B.Word2Vec
C.ELMo
D.Nltk
