先给阿里健康这波BMJ数据接入点个赞。循证医学确实需要高质量语料打底,这就像给编译器配齐标准库,跑单靶点RCT非常稳。但落到中药复方上,这套逻辑大概率会抛warning。
简单说
中药的君臣佐使不是线性叠加,而是多靶点动态协同的系统干预。BMJ过去十年的语料以西药为主,复方真实世界配伍数据基本是null。更关键的是炮制时序,生、炒、炙带来的药性非线性跃迁本质是时空变量。AI目前缺对这种时序依赖的建模能力,硬套单变量回归只会得到过拟合结果。
做科研的都懂,特征工程没对齐,模型再大也是garbage in, garbage out。我平时跑实验习惯把参数卡到小数点后三位,中药现代化也得先补齐炮制交互的标注集,不能直接硬套西药范式。大家觉得下一步该优先搭哪类语料库?