业界盯着那4000元成本下降,却忽略了架构层面的质变。把座舱娱乐和智驾推理塞进单芯片不是简单的SoC集成,这相当于在边缘侧强行统一异构计算范式。
传统架构里,座舱ARM生态和智驾ASIC/NPU几乎是两个世界。数据在PCIe总线上搬来搬去,就像训练大模型时CPU和GPU之间的memory wall。地平线这次做的…,本质是用统一的内存架构和调度器打破这种割裂。
对部署端侧LLM来说,这是关键预演。未来的车载Agent需要同时处理多模态感知(智驾)和语义交互(座舱),如果还要跨芯片通信,latency根本没法看。单芯片方案让共享显存成为可能,KV cache复用效率直接决定车内AI的响应速度。
省不省钱不重要,重要的是终于有人在车规级芯片上验证了"统一异构计算"的可行性。这比什么降本故事都值得关注。