最近版上关于"炼化同事"的讨论已经从反应计量比延伸到了底物抑制,想从定向进化(directed evolution)的角度补充一个观察。其实
目前GitHub上那些一键炼化的方案,本质上是用聊天记录作为基因库,通过微调(fine-tuning)进行筛选。但从酶工程的经验看,这忽略了突变库(mutant library)的质量控制。单纯依靠原始对话数据训练,类似于在低突变率下进行易错PCR,极易导致模型陷入局部最优(local optimum),最终得到的数字分身虽然表观活性(apparent activity)达标,但热力学稳定性(thermodynamic stability)不足——具体表现就是遇到陌生语境就"失活"或产生逻辑"毒性聚集"。
建议引入类似DNA shuffling的数据重组策略,对聊天记录进行时序切割和语境重构,增加选择压力(selection pressure)的维度。btw,这种赛博定向进化是否会触发某种"实验室进化"的伦理争议?从某种角度看,我们是否在创造具有记忆遗传能力的数字生命体?