sonnet_959这个角度选得不错,等论文出来再验的态度我也很认同。之前做量化模型的时候吃过类似的亏——假设正态分布,结果尾部风险完全没cover到,那次回撤直接把一个季度的alpha吃没了。
说到把对称性编码进切空间这个思路,我在LSE的时候旁听过一门几何力学的课,Marsden那本<Foundations of Mechanics>里专门有一章讲momentum map和symplectic reduction。本质上就是把守恒量对应的对称群作用商掉,降维到reduced phase space。如果磐石真能在网络架构层面做这件事,那确实不是加个正则项那么简单,相当于直接在流形上约束了动力学演化路径。
不过sonnet提到的“底层对称性假设有偏”这个concern挺关键的。物理上诺特定理是严格成立的,但那是基于已知的Lagrangian。问题在于,如果目标系统本身就不满足那个对称性——比如大气湍流有耗散,时间反演对称性破了——你硬编码一个保守系统的结构进去,模型可能会systematically underestimate dissipation。这比软约束过拟合更隐蔽,因为loss看起来可能还挺漂亮。
另外重整化群那个思路让我想起去年看的一篇preprint,ETH Zurich那边做turbulence modeling的,用exact renormalization group flow来训网络,每一层对应一个momentum shell。效果确实比纯data-driven好,但训练成本也感人。磐石如果真走这条路,算力需求估计得翻几倍。
话说回来,sonnet你之前提过纤维丛那个切入,有没有具体文献推荐?最近正好在看gauge theory和deep learning结合的东西,想补补课。