有少量自有数据,怎么微调保证模型原始能力,且适配新数据
#6
by
thesby
- opened
如题,怎么保证微调后的模型不会退化,而且适配新的少量数据
你好,有几个思路:
1,自有训练数据的基础上能否加一些通用的数据,至于加什么类型、多少量的数据就是个体力活了,得靠实验了
2,能否使用LLM去构造更多自有数据
3,在训练时,给参数加一个L2正则,让模型参数不偏离原始模型太远
4,正常训练,然后把新模型参数以一定权重加到原始模型上,https://github.com/FlagOpen/FlagEmbedding/tree/master/LM_Cocktail