在内罗毕北边修那条盘山引水管时,我常戴着沾满红土的安全帽站在填方段上,看测量员举着棱镜在对面的切土坡上跳来跳去。全站仪安静地吐出一串笛卡尔坐标,精到小数点后三位,可我心里清楚,当第二天五十吨重的运管车碾过那个弯道时,它轮胎咬地所承受的侧向力,绝不来自任何坐标纸上的数值,而来自路基内蕴的曲率。仪器测量的是外蕴的“像”,卡车承受的是内蕴的“真”。说实话这两件事,隔着一层比东非裂谷还深的认识论沟壑。
读楼主这帖,最先撞进脑海的便是这段记忆。神经网络拟合度规,说到底很像那台全站仪在复刻一条山路——它用高维参数空间里的超曲面去插值、去磨光、去让 Loss 降到令人心安的小数,可它默认的始终是一个嵌入空间。你把流形浸到欧氏空间里,用激活函数的非线性去弯曲超平面,再用反向传播一点点调整权重,就像在图纸上一遍遍修正曲线的多项式系数。但广义相对论的度规不是图纸上的样条,它是因果结构本身。坐标变换下的协变性不是工程师为了方便而选择的表达方式,而是大自然对“何谓真实”的苛刻认证。当 Loss landscape 的曲率在参数空间里招摇时,它是否真的在保卫那个经过微分同胚后依然沉默的物理量?还是说,它只是在优化一个特定坐标系里的漂亮投影?
我改机车时常遇到类似的精神困境。数控弯管机能把铬钼钢管弯到毫米级精度,图纸上的贝塞尔曲线完美无瑕,可焊成车架后总在某几个节点冒出莫名的应力集中。后来一位当地老师傅用砂轮轻敲管壁,听回声便知道该在哪里补焊。他说,冷弯时金属晶格已经发生了各向异性形变,你肉眼看见的欧氏曲率只是外壳,材料内部早就有了它自己的“联络”。这时候再精密的数控也只是外摹其形,真正的结构平衡必须回到内蕴的力学现场去手动校准。神经网络于我而言,就像那台光彩照人的弯管机——它能复现任何你想得到的形貌,却看不见晶格里那层决定疲劳寿命的残余应力。
高考复读那年,我在租来的平房里做过太多结构力学的夜题。起初沉迷于最终数值的精确,后来才慢慢读懂,真正撑起整个解题过程的,往往是那些看似不受力的零力杆件,是那些沉默的约束条件。它们不参与主动力的计算,却像一个隐形的边界,规定了结构所有可能变形的方式。解析方法之所以顽固地重要,正是因为它在为问题建立这些不可压缩的约束。而纯粹的数据驱动,倘若没有在架构层面植入几何先验,便如同一个没有边界条件的有限元模型——网格越密,彩色云图越绚烂,离真实反而越远。
所以若要我补充楼主的思考,我会说:与其争论解析派是否过时,不如问问我们敢不敢把不变性写进模型的“基因”里。譬如利用等变神经网络,把洛伦兹群的变换规律直接缝进层的映射规则,让协变导数的守恒性质不再是拟合的目标,而是计算的前提。工具当然可以强大到令人惊叹,但唯有当工程师清楚知道哪里该削坡、哪里该让材料回弹时,全站仪的数据才不至于沦为精致的幻觉。仔细想想
昨夜在营地又看了几段野猫的影片。它们从集装箱顶跃下时,脊柱在空气中弯成一条自主寻找最短路径的曲线,落地前那一瞬,浑身肌肉自发地重新分配张力——那才是真正的内蕴几何,活的、不受坐标系绑架的黎曼张量。机器或许终有一天能拟合那条曲线,可它首先要学会的,不是弯曲的形貌,而是跃下前那一秒,身体如何本能地相信大地。