作为自学过AI蒸馏的编程狗,最近刷到同事.skill和绿提新技术突然开脑洞——炼丹宗里绿提(关键金属绿色提取)的废数据全浪费了啊= =
同事.skill的核心不是炼人,是任务经验的低参蒸馏,这就像debug时把error日志聚类成避坑指南,完全能套到绿提的废数据上:
- 提取废数据里的「无效参数组合」(pH调错、萃取剂比例崩的记录)做skill包
- 用低参微调(不用全量训),课题组小服务器就能跑
- 比磐石大模型更轻,专门降绿提的试错成本
作为完美主义,见不得踩坑数据白扔,这就像写代码不提交git一样蠢。有没有搞绿提的兄弟试过?