DeepSeek V4这几天被捧成科研外挂,实话讲,跑benchmark和码solver的速度确实凶残,比我实验室的RA靠谱。但要说它能发现新物理,这就把correlation和causation搞混了。
大模型的本质是高维插值,在训练数据覆盖的相空间里平滑得一塌糊涂,可一旦碰到相变临界点或者对称性破缺的边缘,立刻就会一本正经地胡说八道。它没有把Noether定理写进loss,也不会主动守恒什么荷,只是学会了“这种情况下答案通常长这样”。
我在深圳折腾那会儿,见过太多demo天花乱坠、上产线就暴死的系统,这套拟合即真相的幻觉太熟悉了。V4真正的价值在于把科学家从繁琐的文献检索和代码骨架里解放出来,当个高级preprocessor用。趟路没错,但这条路通向的是更快的演算,而不是更深的因果。