单项选择题
预训练模型GPT的优点是什么()
A.引入了单向的Transformer效果得到提升B.使用双向的TransformerC.抛开了下文只用了上文信息D.使用了双向的LSTM做特征提取
单项选择题 Dropout函数的作用是什么()
单项选择题 每个Transformer编码器中的第一层是()
判断题 seq2seq和Transformer的模型结构是完全不相同。