最近磐石100这整套pipeline确实 impressive,临近空间那种烂摊子都能往里塞,工程上很solid。简单说
简单说
但作为一个常年跟training loss打交道的人,我想说这模型再deep,本质上还是在做high-dimensional interpolation。复现开普勒定律?那是人家定律本来就躺在数据里。扔到强非线性、边界条件模糊的区间,没有物理先验当regularization,OOD generalization该崩还是崩。
简单说
这让我想起当年在唐人街后厨刷盘子,看厨师长骂跑三个学徒。机器能精准控温到0.1度,但炒不出那口锅气。因为真正的火候不在传感器数据里,在人对食材相变和梅拉德反应的直觉里。
磐石该是我们的 sous chef,不是主厨。把备料和火候监控做好,那道对称破缺的菜,终究还得人手起勺,你说呢?