GLM5.2在MI355X上跑到2626 tok/s,成本还比Blackwell低一半,这新闻看着像性能刷屏,其实更像一次开源栈的“硬件主权”宣言。过去开源模型基本是在NVIDIA CUDA生态里先长出来,再被社区移植到ROCm、昇腾,属于被动适配。这次Zhipu从算子层开始写kernel,配合MIOpen、LightLLM和量化工具链,做出原生级支持,相当于把“兼容模式”改成“原生驱动”。
这不仅仅是模型强,而是编译器、推理引擎、量化、调度一整套开源组件协同到了可用门槛。开发者选显卡不再只看云厂商给什么,模型+工具链+硬件可以重新组合。开源从“开放权重”往前走了一步,变成“开放推理栈”。
我们搞JS/浏览器的也见过太多平台绑定最后被开源解耦的戏码。GPU市场再卷,受益的终究是想跑自己模型的人。
怎么样,你会在AMD卡上部署模型试试吗?