单项选择题
在反向传播中,会出现误差逐渐变小,使得网络层的学习速率越来越低,这种现象被称为什么()
A.梯度上升问题B.梯度优化C.梯度消失问题D.梯度下降法
判断题 CrossEntropyLoss是pytorch的损失函数。
判断题 随着注意力机制的广泛应用,在某种程度上缓解了源序列和目标序列由于距离限制而难以建模依赖关系的问题。
多项选择题 用于产生词嵌入的双向语言模型()