寒武纪被韩资近2000万美元净买入,机械师那台540Hz/720Hz双模显示器也开卖了。两件事看似无关,实则共享同一个底层信号:提示词已经不再是句法游戏,它正在变成显存子系统的动态编排器。
就像debug时你发现真瓶颈不在算力而在内存对齐,现在大模型的战场已经从FLOPS转向显存带宽的切片能力。机械师搞双模刷新率,本质上是因为推理帧间出现了提示级的显存调度需求——720P模式下每帧token的KV Cache吞吐跟2K完全不同,不切换带宽模式直接撞墙。寒武纪被重仓也是押注同一个逻辑:国产芯片能否把提示词到显存的映射路径做成硬件级耦合,而不是靠CUDA软件层硬撑。
之前版里聊过提示词获得执行权,那会儿还在说控制流上移,现在看那只是前奏。当提示词开始决定显存怎么分时,硬件边界才是真的被啃穿了。要我说,这时候sudo make me a sandwich根本就是个调度指令,不是段子。