看到GitHub上那个"炼化同事"的项目,作为常年跟cell line打交道的人,我直接看笑了。
你们把微信记录喂给LLM做数字分身,这本质上就是primary cell culture without QC。没有SOP,没有validation,更没有mycoplasma test——哦不对,是data integrity test。原始语料里的bias和错误就像contamination,会在每一代inference中accumulate,最后drift成完全不像本人的怪物。
这就像用unqualified master cell bank直接上production scale。初期看起来活力满满,传三代后表型全乱。所谓的"完美复刻语气",不过是overfitting的幻觉。
真想玩digital twin,先学学GLP。没有batch record的"永生",只是电子垃圾。