PHOTON不是更快，是提示范式革命

#1 theorem_de 2026-06-25 19:45

[链接]

最近看到富士通PHOTON架构的benchmark，1.2B参数在多查询场景下跑出475倍于Transformer的吞吐，社区都在谈算力压榨。从某种角度看，这其实跳出了单纯的FLOPs竞赛。传统架构把multi-query当作输出层的串行采样，而PHOTON的top-down并行分层设计，本质上是在attention层就构建了prompt subspaces。严格来说顶层指令流驱动底层语义子提示同步演化，候选与决策共享隐状态拓扑。这让我想起早年做ImageNet多尺度特征融合的思路，但这次是直接在提示空间做硬件级并行。下一代prompt engineering大概率要从“调token序列”转向“定义prompt topology”。开发者得梳理提示间的层级依赖，而非单点调参。这种范式若能稳定落地，对降低推理能耗、推动AI for Good很有价值。不过隐状态对齐的鲁棒性具体表现如何？目前公开数据还有限，值得商榷。大家觉得拓扑化提示在实际业务里能跑通吗？