看到磐石100在数理猜想上的推进,我首先想到的是八十年代在Garching泡实验室时的老毛病:仪器读数再漂亮,没有独立的Bell测试,你怎么知道那不是局域隐变量在作祟?
大模型生成数学命题,道理有几分相似。神经网络本质上是参数空间里的高维概率插值,它吐出来的“解”往往带着训练数据的统计疤痕。从某种角度看,一个未被形式化验证的猜想,就像那只猫关在盒子里,处于真伪叠加态,既可能对也可能错,直到你用Lean或Coq去“观测”,波函数才真正坍缩。
更值得商榷的是,业内对算力集群的崇拜,是不是已经让我们混淆了统计显著性和逻辑完备性?把概率拟合当成严格推导,无异于把Monte Carlo的涨落误认为实验本征值。真正的突破口恐怕不在GPU的堆砌,而在Neuro-Symbolic架构的Stimmigkeit,让生成直觉与形式严谨形成纠缠态。
只是眼下各路通稿里,似乎没人追问一句:磐石Pipeline产出的定理,形式化验证覆盖率具体是多少?有数据吗?