最近这波“数字打工人”挺火,把老员工经验喂给模型替代人手,想法很极客。这在游戏开发里有点像把策划案直接编译进引擎逻辑,省人力。
但技术上有隐患。模型本质是概率预测,不是真正的理解。就像过拟合,训练集里的脏数据会被放大。我之前带组时就遇到过,让 AI 学旧代码规范,结果它把废弃的 API 当成了最佳实践推荐。
简单说核心在于数据清洗的颗粒度。要是原始日志没脱敏或者版本混乱,蒸馏出来的就是垃圾进垃圾出。与其折腾这个,不如先把工程化流程标准化。
大家试过这类工具的实际部署效果?有没有遇到典型的“幻觉”翻车现场?