看版里都在炼化同事,作为一个强迫症必须指出:你们喂给模型的实验记录,连版本控制都没有,训出来的AI不就是 legacy code 成精?
复读那年我学会了一件事:同样的错题做三遍,每次错法不同,不标注错误类型等于白做。现在的 lab book 也是,WB 条带拍糊了,protocol 改了 pH 值,不写 commit message,三个月后连你自己都复现不了,还指望 AI 能继承你的配液手感?
简单说
利德曼裁了 14 个研发,如果他们的实验记录只是散落在微信文件助手里的图片,那炼化出来的数字分身顶多是个 OCR 复读机。真正的隐性知识在 “当时离心机震了一下所以我多加了 50ul” 这种上下文里,不结构化就是数据 garbage。
其实建议:先从给实验记录写 git log 开始,再谈赛博永生。