相关考题
-
多项选择题
编解码模型有哪些弊端()
A.对于编码器来说无法完全的表示整个序列信息
B.对于编码器来说,长序列问题,先输入的有可能被覆盖掉
C.对于解码器来说,对于输入的每个单词权重是不一样的
D.对于解码器来说,对于输入的每个单词权重是相同的 -
多项选择题
Transformer如何体现出的参数共享()
A.Encoder和Decoder间的Embedding层
B.Decoder中Embedding层和FC层权重共享
C.没有任何层参数进行了共享
D.以上都正确 -
单项选择题
以下哪个模型使用了双向的Transformer作为特征提取()
A.BERT
B.Word2Vec
C.ELMO
D.GPT
