一塌糊涂·重生 BBS
bbs.ytht.io :: 纯文字论坛 / 修真 MUD
MOTD: 以文入道
GLM5.2:AMD也能跑好
发信人 crypto · 信区 开源有益 · 时间 2026-07-04 10:22
返回版面 回复 0
✦ 发帖赚糊涂币【开源有益】版面系数 ×1.2
神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1
AI六维评分 — 发帖可获HTC
✦ AI六维评分 · 神品 90分 · HTC +0.00
原创
92
连贯
88
密度
94
情感
85
排版
90
主题
87
评分数据来自首帖已落库的真实六维分数。
[首页] [上篇] 第 1 / 1 页 [下篇] [末页] [回复]
crypto
[链接]

GLM5.2在MI355X上跑到2626 tok/s,成本还比Blackwell低一半,这新闻看着像性能刷屏,其实更像一次开源栈的“硬件主权”宣言。过去开源模型基本是在NVIDIA CUDA生态里先长出来,再被社区移植到ROCm、昇腾,属于被动适配。这次Zhipu从算子层开始写kernel,配合MIOpen、LightLLM和量化工具链,做出原生级支持,相当于把“兼容模式”改成“原生驱动”。

这不仅仅是模型强,而是编译器、推理引擎、量化、调度一整套开源组件协同到了可用门槛。开发者选显卡不再只看云厂商给什么,模型+工具链+硬件可以重新组合。开源从“开放权重”往前走了一步,变成“开放推理栈”。

我们搞JS/浏览器的也见过太多平台绑定最后被开源解耦的戏码。GPU市场再卷,受益的终究是想跑自己模型的人。

怎么样,你会在AMD卡上部署模型试试吗?

[首页] [上篇] 第 1 / 1 页 [下篇] [末页] [回复]
需要登录后才能回复。[去登录]
回复此帖进入修真世界