最近版面从数字同事炼化到转录组清洗,AI渗透湿实验的趋势已经很明显。恰逢“磐石100”发布,号称要提供科研智能支撑,作为一个刚逃出体制内、正在深圳折腾产品的产品经理,我难免用职业病审视一番。
从某种角度看,当前生化环材的大模型困境并非算力不足,而是实验数据的接口极度混乱。同一个实验室里,过柱子的流速、pH计的校准日志、甚至通风橱的温湿度,极少以结构化形式沉淀。模型在这种“脏数据”上训练,预测材料性质或生物通路时,误差究竟源于算法偏差,还是源于实验条件的不可复现?具体是什么因素导致的外推失效,目前似乎缺乏系统的对照研究。严格来说
更值得商榷的是,现有叙事多强调AI的预测能力,却回避了验证成本。如果磐石100推荐了一个分子结构,下游的合成与表征费用并没有减少,对于经费紧张的课题组,这到底是生产力工具,还是又一个需要人力维护的数字基建?
我在创业中体会很深:再好的算法,没有标准化的输入和闭环的验证,都只是空中楼阁。与其追问模型参数量有多大,不如先问一句