根据文章描述,在训练好BEiT后,将冻住VFFN和attention,只训练LFFN,但好像在您提供的代码里我没有发现在进行textonlymlm的时候有冻住任何层,可以请教一下是在代码哪里实现的吗
根据文章描述,在训练好BEiT后,将冻住VFFN和attention,只训练LFFN,但好像在您提供的代码里我没有发现在进行textonlymlm的时候有冻住任何层,可以请教一下是在代码哪里实现的吗