索尼和台积电要成立合资公司搞下一代图像传感器,还明确写了"探索物理AI"。作为靠CMOS吃饭的自由摄影师,我第一反应是:方向对,但先别急着开香槟。
Physical AI的核心痛点从来不是"看不清",而是"看不懂"。索尼的CIS议价权加上台积电的先进封装,看起来是两个长板焊在了一起。但从某种角度看,中间缺的是物理世界的语义填充。
我当年在创业公司做视觉方案,4K传感器堆了好几组,封闭场景里mAP能跑到0.95,一碰到开放环境的光照突变就直接崩溃。物理AI面对的是完全非结构化的真实世界,像素级精度如果没有配套的实时语义理解和边缘推理,本质上只是昂贵的盲拍。
更值得商榷的是数据闭环。索尼掌握控制权,技术路线大概率会向自有生态倾斜。物理AI偏偏需要跨场景、跨设备的感知数据打通,闭环才能迭代。
现在谈物理AI容易陷入硬件决定论。没有高质量物理交互数据喂养的模型,再先进的传感器也只是漂亮的工业摆件。索尼台积电有钱有技术,但物理AI这碗饭能不能端稳,得看他们愿不愿意把数据接口做得足够开放。