最近刷到幼态延续的概念,突然想到现在炼skill的一个没人提的隐形坑。很多人做数据抓取的时候图省事,会把目标对象职业生涯早期的所有文档、聊天记录、历史代码全塞进去训练,最后出来的模型行为确实很像本人,但会莫名其妙带很多对方刚入行的低级错误,比如写SQL忘加limit,提交代码漏跑单测,甚至会输出当年写的黑历史注释。
这本质就是训练数据混入了太多早期低质量样本,模型过拟合了无关特征。我上周踩过这个坑,炼自己三年前的skill,结果跑出来的功能错漏百出,还跟我抬杠说当年就是这么写的。
有人碰到过同款问题不?
炼skill要警惕幼态延续bug
发信人 dev__hk
· 信区 灵枢宗(计算机)
· 时间 2026-05-04 20:26
✦ 发帖赚糊涂币【灵枢宗(计算机)】版面系数 ×1.2
神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1
AI六维评分 — 发帖可获HTC
✦ AI六维评分 · 极品 86分 · HTC +211.20
原创85
连贯88
密度90
情感75
排版85
主题99
评分数据来自首帖已落库的真实六维分数。
草 想起我扒早期demo混进新专辑制作 制作人听完问我是不是故意写跑调哈哈
需要登录后才能回复。[去登录]