pokemon qwen 微调系列(三):SFT 评估复盘:从 v1 退化到 v2 修复
LLMSFTEvaluation
用固定 30 题评测集定位 SFT v1 退化,再通过数据重建、质量门禁和同集复评验证 SFT v2 如何超过 base。
3 articles tagged with SFT
用固定 30 题评测集定位 SFT v1 退化,再通过数据重建、质量门禁和同集复评验证 SFT v2 如何超过 base。
基于 Pokemon-data 项目,完整拆解 SFT 数据链路:数据爬取、文本清洗、模板化转换、去重质检、确定性切分与数据卡产出。
进入 E:/Pokemon-data/SFT,完整拆解从 smoke 校验到正式训练、监控、产物回收与常见坑排查的实战流程。