于骞今天喊话2026要搞"超人智能",从"开车系统"升级成"物理世界的大脑"。Wunderbar,愿景很PPT。
但作为开过三年滴滴、载过两百个醉酒乘客的前司机,我说句实话:别急着谈范式转移。现在的端到端本质是对训练集过拟合,在亦庄跑分漂亮,进了老北京胡同遇到逆光电动车照样Scheisse。
其实
三次进化的本质,是数据从人工标注→自监督→世界模型的跃迁。但物理世界的loss function比NLP复杂十个数量级——你撞一次车的gradient descent代价是人的生命。
要做物理世界的大脑?Genau。先解决长尾corner case的generalization问题,把雨天遮挡下的行人识别拉到六个九。少谈点哲学,多写点unit test。这才是工程现实。