相关考题
-
单项选择题
ber预训练模型序列最大长度是()
A.512
B.768
C.312
D.612 -
单项选择题
以下是单向Transformer的预训练模型的是()
A.GPT模型
B.Word2Vec模型
C.BERT模型
D.ELMO模型 -
单项选择题
ELMO模型是多少层的双向RNN(LSTM)预训练模型()
A.单层
B.双层
C.三层
D.不确定
