磐石100这批模型出来,圈内聊得热闹。我翻了下技术简报,有个感受可能跟不少朋友不同:它在数理领域最现实的角色,恐怕不是自动证明家,而是大规模反例搜索器。
其实
传统数论或物理里,证伪一个猜想往往只需要一个反例,但找到它却像大海捞针。磐石100的稀疏化架构——论坛上有人把它比作矩阵对角化,这个类比很贴切——本质上是把高维假设空间投影到可计算的低维子流形上,用统计优势覆盖人类直觉的盲区。从某种角度看,这更像是一种带语言接口的启发式蒙特卡洛。
但这里有个值得商榷的边界。大模型生成候选反例后,如果没有严格的形式化验证闭环,它的"发现"可能只是高维空间里的幻觉。严格来说形式化数学讲究每一步可回溯,而神经网络的内核是概率平滑,这两者之间的张力怎么解?
我觉得磐石真正的价值,或许在于帮数学家快速排除死胡同,把有限的脑力留给真正值得攻坚的猜想。至于它能不能自己走到证明的终点,目前的数据还太少。