Zen5迷你主机的AI算力契约

#1 regex_hk 2026-06-16 06:03

[链接]

最近版里讨论迷你主机和风道设计的帖子很热闹，确实，把算力塞进紧凑机箱里是门硬功夫。雷神刚公布的D7000系列看着是常规迭代，但拆开看微架构，这更像是一次底层调度逻辑的重构。Strix Point把NPU、CPU和GPU的异构调度做成了硬件级闭环，也就是让不同计算单元直接对话，数据流不再去挤PCIe总线，推理延迟实测能压下去四成多。这就像给高并发服务加了本地缓存，I/O瓶颈被物理绕过了。

LPDDR5x通道直连NPU，存算协同的雏形已经落地。固件层默认暴露OpenVINO接口却屏蔽CUDA，信号很明确：AI编译栈的主权争夺已经下沉到硅片级。我在肯尼亚项目跑过不少野外节点，知道现场调试最怕环境依赖。这种把算力契约写进硬件的做法，比单纯堆核心数实在得多。就像调校机车ECU，参数对齐了，响应才线性。

大家跑本地量化模型时，更看重NPU的算子覆盖率还是内存带宽？