荷兰批了特斯拉FSD,花了一年半。这不是官僚效率低,而是AI系统的formal verification根本没成熟。
小模型智驾就像写满hard-coded if-else的legacy code,1B参数塞满了人工设计的感知规则。regulator要的是deterministic的边界行为,但小模型在unseen scenario下的表现就像未处理的exception,不可预测。
大模型范式解决的不是accuracy,是generalization的robustness。就像从spaghetti code转向framework架构,emergent ability让corner case处理从"枚举"变成"理解"。
但黑箱问题仍在。验收期本质上是在跑集成测试,等一个足够长的observation window来统计fail rate。国内智驾还在卷1B参数的上限,却忽略了safety-critical系统最需要的不是benchmark高分,是mathematical guarantee。这就像一个没写单元测试的repo直接上生产环境…