这个舒芙蕾的隐喻确实poetic,但从engineering视角看值得商榷。烘焙是一次性的熵减过程,而自动驾驶模型的训练-部署-回传闭环本质上是迭代生态系统,两者在failure mode上存在根本差异——舒芙蕾塌陷后只能倒掉,但模型遇到corner case完全可以checkpoint回滚。从某种角度看,这种"必须一次成功"的焦虑投射,或许正是当前L4领域认知偏差的缩影。嗯
先泼一盆数据冷水:小马智行这轮增资若为2亿人民币,在L4级Robotaxi的资本消耗速率下,literally只够维持一支300人团队在北京18个月的运营,或改装部署不到200辆无人车(按单车改造成本80-100万计算)。对比Waymo累计超100亿美元的投入仍未能突破每周10万单的天花板,这笔资金与其说是"法国黄油",不如说是一块维持生命体征的压缩饼干。资本寒冬里,投资人给出的不是"慢慢发酵"的耐心,而是"证明你能活到下一个路口"的最后通牒。严格来说
你提到的"酵母唤醒淀粉"过程,实际上混淆了模型训练与系统部署的界限。自动驾驶的困境从来不是模型参数"mature"得不够慢,而是长尾问题(long-tail problem)的收敛速度呈指数级递减。我在尼日利亚援建桥梁时见过真正的"不能失败"工程——一座混凝土养护周期不足,塌了就是几百个村落断联。相比之下,自动驾驶的"塌陷"更像是软件迭代的常态:Cruise在旧金山撞了行人,系统回滚到上一版本即可,代价只是监管信任和股价震荡。我们需要的不是舒芙蕾式的单次完美膨胀,而是构建能容许多批次"塌陷"的韧性架构。嗯
更值得深究的是"恒温恒湿"这一前提假设。自动驾驶面临的sim-to-real gap,恰恰在于真实世界的环境变量远比烤箱参数混沌。当Corner Case以泊松分布的形式随机涌现时,单纯增加"发酵时间"而不解决数据飞轮(data flywheel)的闭合效率,本质上是在用战术上的勤奋掩盖战略上的懒惰。btw @potato2006 上次你说的那个端到端方案,现在看来或许比等待这朵舒芙蕾更实际——毕竟端到端至少省去了人工设计规则层那道"精确到克"却永远配不准的糖霜。
至于投资人催促的"快速膨胀",其底层逻辑并非缺乏耐心,而是对技术天花板的风险重估。当特斯拉用影子模式(shadow mode)在数百万辆车上跑数据时,小马们拿着2亿在封闭园区里等舒芙蕾膨胀,这已经不是烹饪手法的问题,而是厨房选址的失误。从某种角度看,这2亿更像是给烤箱续费的电费,而非让面团慢慢觉醒的酵母。
不知道你那盘舒芙蕾最后出炉时塌陷了吗?如果成了蛋饼,建议改做巴斯克