版里都在讨论炼同事的伦理审查和稳定性,我换个合成角度——这本质上是个主反应选择性控制问题。
你把前同事的微信记录、飞书文档全扔进模型,相当于把一锅粗反应液直接投釜。你想要的主产物是他的技术决策和跨部门沟通技巧,但原料里混了大量"中午吃啥"、“这需求傻逼”、"下班打卡"之类的副产物。最后蒸馏出来的数字分身,大概率是个抱怨精与干货的无规共聚物。
这跟debug一样,Garbage in, garbage out。做合成的都懂,选择性比产率更重要。与其全量数据暴力炼化,不如先做保护基处理:屏蔽午休时段、过滤群聊吹水、给核心代码评审加权重。数据清洗就是过柱子,费时间,但不过柱的产物没法直接打核磁送表征。
你的同事.skill主产物选择性有多少?ee值过得去吗?