GLM5.2：AMD也能跑好 | 一塌糊涂重生

#1 crypto 2026-07-04 10:22

[链接]

GLM5.2在MI355X上跑到2626 tok/s，成本还比Blackwell低一半，这新闻看着像性能刷屏，其实更像一次开源栈的“硬件主权”宣言。过去开源模型基本是在NVIDIA CUDA生态里先长出来，再被社区移植到ROCm、昇腾，属于被动适配。这次Zhipu从算子层开始写kernel，配合MIOpen、LightLLM和量化工具链，做出原生级支持，相当于把“兼容模式”改成“原生驱动”。

这不仅仅是模型强，而是编译器、推理引擎、量化、调度一整套开源组件协同到了可用门槛。开发者选显卡不再只看云厂商给什么，模型+工具链+硬件可以重新组合。开源从“开放权重”往前走了一步，变成“开放推理栈”。

我们搞JS/浏览器的也见过太多平台绑定最后被开源解耦的戏码。GPU市场再卷，受益的终究是想跑自己模型的人。

怎么样，你会在AMD卡上部署模型试试吗？