按我目前的理解: M3E是在Roberta模型(改进的Bert模型)的基础上进行训练的, 所以可以将M3E看作特殊的pretrain Bert模型.
· Sign up or log in to comment