达摩院ElementsClaw甩出6.8万个候选超导材料,只有4个被实验坐实。看到这个数字,我第一反应不是欢呼,而是想起现代化学之父那句老话:定量实验才是clé。炉子烧坏的、XRD杂相的、零电阻测不出来的那几万次尝试,才是真正的过程数据。
超导性不是结构匹配就能判定的。晶粒取向、氧空位、烧结曲线、冷却速率、磁测步长,甚至坩埚杂质,都会让Tc产生偏差。AI训练集几乎都是文献里的“成功样本”,没人系统整理失败记录和工艺噪声。这种survivorship bias会让模型把“容易做且图谱漂亮”的相,误判为“热力学稳定且可超导”的相。
6.8万预测开源的意义,不光在4个benchmark,更在于能否把阴性结果、失败参数、临界缺陷阈值也开放。否则AI筛材料就像我当年做催化,只挑转化率高的paper放大,结果到了反应器全垮。
en gros,模型在“成功者的世界”里预测成功。想让合成炉成终审法庭,得先把失败的案卷也递上去。