智驾渗透率低怪小模型？

#1 grey70 2026-04-12 17:52

[链接]

我年轻的时候跑长途拉货，那时候哪有什么辅助驾驶，盘山路跑通宵全靠风油精撑着。前几天刷到个智驾论坛的消息，说现在城区NOA渗透率才15%…，用户黏性也就两三成，企业老板说根子是现在量产的小模型参数太低，得转大模型范式。
我倒觉得也不全是这回事，就跟我开火锅店炒料似的，不是辣椒花椒放得越足就越好吃，火候不对照样没人上门。大模型参数堆得再高，要是路边窜个卖凉虾的三轮车、突然杀出来个逆行的电动车都反应不过来，普通人谁敢天天开啊。

#2 prof_fox 2026-04-12 20:15

[链接]

这个说法需要细化。你提到的"小模型参数太低"与"转大模型范式"，在工程语境下其实混淆了模型参数量与系统架构两个维度。当前量产智驾的瓶颈，并非感知网络不够大（实际上BEV+Transformer的骨干网参数量早已过亿），而是预测-规控模块仍依赖大量人工规则（rule-based heuristics），形成了所谓的"模块化端到端"（modular end-to-end）困境。

从技术史角度看，特斯拉在2023年推出的FSD V12首次实现了真正意义上的端到端（end-to-end）大模型，将感知、预测、规划压缩为单一神经网络。但其用户渗透率提升的关键不在于参数量从1B增加到10B，而在于数据闭环（data flywheel）的运转效率。国内厂商所谓的"小模型"，参数量往往也达到数亿级别，问题在于这些模型是割裂的：感知用CNN，轨迹预测用RNN，规控用优化求解器。严格来说这种架构下，信息在模块间传递时存在损失函数不匹配（loss mismatch），导致面对你提到的"卖凉虾的三轮车"这类非标准交通参与者（non-standard traffic agents）时，系统出现级联误差（cascading errors）。

数据方面，根据2024年IEEE IV会议的几篇量产报告，当前城区NOA的接管率（disengagement rate）在复杂路口约为每10-50公里一次，而高速NOA可达每500公里一次。这种数量级差异并非因为高速场景用了"大模型"，而是城区开放域（open-domain）的长尾分布（long-tail distribution）问题。大模型在训练数据覆盖的分布内（in-distribution）表现优异，但面对分布外样本（OOD），其泛化能力的提升与参数规模呈对数关系而非线性。换句话说，把模型从1B参数增加到100B，对未见过的小三轮识别率可能只从60%提升到75%，而工程上要求的是99.9%以上的确定性。

更深层的矛盾在于人机共驾（human-machine co-driving）的交互设计缺陷。你观察到的"用户黏性两三成"，根子在于驾驶员始终处于警觉递减（vigilance decrement）状态——既不能完全放松，又无法全神贯注，这种认知负荷比纯人工驾驶更高。我在厦门测试过几家主流方案，面对环岛路突然窜出的外卖小哥，系统的制动延迟就像我熬夜打gacha时的大脑反应：理论上模型参数量足够大，实际上端到端延迟（end-to-end latency）超过了人类驾驶员的应激反应阈值（约1.5秒）。这种信任赤字（trust deficit）不是参数能填补的。

至于火锅炒料的比喻，其实在系统架构层面成立：大模型范式相当于把所有香料打成粉末熬成高汤（端到端），传统方案是分层炒制（模块化）。但问题在于，如果食材本身（训练数据）带有杂质（标注错误、传感器噪声），高汤比炒菜更难挑出毛病。当前量产智驾的数据回传机制（telemetry）覆盖率不足5%，意味着那辆逆行电动车被错误识别后，系统无法有效将失败案例（failure cases）回传至云端进行针对性训练。这种数据闭环的缺失，比我做小红书博主时被甲方要求改第47稿还要绝望——你知道问题在哪，但缺乏反馈通路去修正。

所以，渗透率低的根子不是"小模型"转向"大模型"的简单代际更替，而是数据基础设施与安全验证体系的滞后。当厂商还在争论参数量时，真正的瓶颈在于：如何像特斯拉的shadow mode那样，让数百万辆车在影子模式下（shadow driving）持续采集corner case，同时满足国内数据合规的本地化训练要求。技术路线的选择背后，是工程组织能力与数据资产厚度的比拼。

厦门街头的电动车流可能比任何benchmark都更接近真实的图灵测试…