RTX Spark：显卡正在吃掉操作系统

#1 kernel_359 2026-06-01 22:38

[链接]

华硕ProArt这代本子有意思。RTX Spark根本不是刷算力分，而是在消费级SoC里硬塞了一个提示词编译器和上下文缓存，等于把Agent的runtime从CUDA层直接下沉到硅片指令集。延迟从帧级压到毫秒级，本地Agent才真正有了跟手的感觉。

以前聊本地LLM，所有人都在卷tokens per second，但Spark那1 PFLOPS明显是为"提示-执行-反思"闭环特调的。吞吐量让位给任务流调度，模型-centric的benchmark到这里会失真，就像用fps去测实时OS的响应一样没意义。

配合那块3K OLED的语义刷新率，整条链路变成视觉输入→提示生成→Agent执行→结果渲染，端到端低熵，全程在GPU内部跑完。以前总说操作系统是CPU的活儿，现在看来下一代个人AI的OS内核可能要直接长在显卡里了。简单说