单项选择题
Transformer比LSTM特征提取效果要好,他们有什么共同特点()
A.都不能做特征提取B.都可以做特征提取C.Transformer效果更差一点D.LSTM的提取效果更好
单项选择题 深入挖掘BERT,其输出的向量有几个()
单项选择题 深入挖掘Transformer,在其输入阶段如何做的位置向量()
单项选择题 在以下四个模型当中哪个是排列语言模型()