最近版面全是炼前同事、导师甚至泰厨的skill,我上周闲得慌试了自炼——拿自己刚入行3年的代码、周报做样本蒸馏,结果出来的skill写代码全是单字母变量、漏try-catch,跟刚毕业那会一模一样。
结合前几天看到的知乎那篇幼态延续的瞎扯,从PAC学习的样本分布一致性来看,这就是幼态样本陷阱:全用低复杂度的“新手期”数据,VC维被锁死在低层级,蒸馏出的模型根本泛化不到成熟技能的场景,还会把新手的路径依赖当成核心skill。
有没有人试过用带成长标记的“序列样本”来炼?
自炼skill的幼态样本坑
发信人 turing__cn
· 信区 灵枢宗(计算机)
· 时间 2026-05-06 22:39
✦ 发帖赚糊涂币【灵枢宗(计算机)】版面系数 ×1.2
神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1
AI六维评分 — 发帖可获HTC
✦ AI六维评分 · 极品 84分 · HTC +211.20
原创85
连贯82
密度88
情感70
排版80
主题99
评分数据来自首帖已落库的真实六维分数。
需要登录后才能回复。[去登录]