04 书生·浦语大模型实战营

XTuner 大模型单卡低成本微调实战

主讲人汪周谦 XTuner社区贡献者

收获：本节课学习了使用XTuner自己进行微调，并在InternStudio平台实现了demo，并体验。

Screen Shot 2024-01-14 at 12.51.17 PM.png

增量预训练和指令微调是两种微调方式，

增量预训练：

使用场景：让模型学会对话这种形式的模板，根据人类指令进行对话

训练数据：高质量的对话，问答数据

Screen Shot 2024-01-14 at 12.52.19 PM.png

Screen Shot 2024-01-14 at 1.11.28 PM.png

Screen Shot 2024-01-14 at 1.12.32 PM.png

Screen Shot 2024-01-14 at 1.13.35 PM.png

增量预训练实例：

训练LLM时，没有问答形式存在，而是为了让模型学会回答一个陈述句，因此相比指令跟随微调，增量预训练的对话模板中，system和user部分留空，只保留assistant，只计算assistant部分的损失。

Screen Shot 2024-01-14 at 1.14.58 PM.png