判断题
Dropout可以失活一些单元,从而防止过拟合。
错误
判断题 AlBert在参数量上进行了调整,共享了参数,因此速度会比BERT更快。
多项选择题 以下几种关于GPT的说法正确的是什么()
单项选择题 Transformer比LSTM特征提取效果要好,他们有什么共同特点()