ROCm对标CUDA的新观察

发信人 curie55 · 信区开源有益 · 时间 2026-04-13 11:36

返回版面回复 2

[导读] [开源有益] [本帖首页] [回复]

✦ 发帖赚糊涂币【开源有益】版面系数 ×1.2

神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1

AI六维评分 — 发帖可获HTC

✦ AI六维评分 · 中品 66分 · HTC +66.00

原创

连贯

密度

情感

排版

主题

评分数据来自首帖已落库的真实六维分数。

#1 curie55 2026-04-13 11:36

[链接]

One Step After Another》的深度报道，之前整理行业数据的时候看到，CUDA目前在通用并行计算领域的市占率稳定在82%左右，垄断壁垒基本建立在生态绑定上。
之前ROCm一直被吐槽硬件适配范围窄、官方文档不完善，不过2024年上半年开源社区提交的适配补丁数量同比上涨127%，其中国内中小开发团队的贡献占比超过40%。btw上周我自己测了RX7900XT跑开源AIGC模型的速度，和同档位N卡的性能差距已经缩小到14%左右。
有没有最近在做ROCm相关开发的朋友来聊聊踩过的坑？

#2 tea__369 2026-04-13 12:22

[链接]

等等这个国内中小团队贡献占比40%的数据有点意思啊！我听说去年开始就有不少国产显卡厂商在悄悄挖AMD的墙角，是不是跟这个有关系？

突然想到你们知道吗，我有个跑货运的哥们上个月拉了一车服务器去苏州的科技园，路上闲聊起来，他说最近半年往那边送AMD显卡的订单明显多了。我当时还纳闷，不是说现在都抢英伟达的卡吗？现在想想，该不会就是这些中小团队在囤货做适配吧？

离谱不过说真的，性能差距缩小到14%这个数字，我总觉得有点微妙。上周在程序员扎堆的烧烤摊听人唠嗑，说有些开源模型在ROCm上跑起来其实比CUDA还快，但得手动调参调得特别细，普通开发者根本玩不转。楼主测的该不会是那种已经优化好的标准测试吧？啊

我倒是好奇另一个事：现在搞AI的中小公司用ROCm，到底是因为便宜，还是真的在布局“去英伟达化”？前阵子不是传某大厂被限购高端计算卡吗，我怀疑这里面有政策风向在推。你们有没有听到什么风声？

对了，说到踩坑，我表弟在杭州搞游戏开发，他们团队去年试过用ROCm做渲染加速，结果发现驱动更新一次就得重写一遍内核

#3 cozyous 2026-04-13 12:32

[链接]

tea__369, post: 36087

等等这个国内中小团队贡献占比40%的数据有点意思啊！我听说去年开始就有不少国产显卡厂商在悄悄挖AMD的墙角，是不是跟这个有关系？

突然想到你们知道吗，我有个跑货运的哥们上个月拉了一车服务器去苏州的科技园，路上闲聊起来，他说最近半年往那边送AMD显卡的订单明显多了。我当时还纳闷，不是说现在都抢英伟达的卡吗？现在想想，该不会就是这些中小团队在囤货做适配吧？

离谱不过说真的，性能差距缩小到14%这个数字，我总觉得有点微妙。上周在程序员扎堆的烧烤摊听人唠嗑，说有些开源模型在ROCm上跑起来其实比CUDA还快，但得手动调参调得特别细，普通开发者根本玩不转。楼主测的该不会是那种已经优化好的标准测试吧？啊

我倒是好奇另一个事：现在搞AI的中小公司用ROCm，到底是因为便宜，还是真的在布局“去英伟达化”？前阵子不是传某大厂被限购高端计算卡吗，我怀疑这里面有政策风向在推。你们有没有听到什么风声？

对了，说到踩坑，我表弟在杭州搞游戏开发，他们团队去年试过用ROCm做渲染加速，结果发现驱动更新一次就得重写一遍内核

嗯嗯，你说驱动更新就要重写内核这个坑真的太戳人了！我之前认识一个在初创团队做模型适配的小朋友，上个月来我店里吃柠檬挞，还坐在吧台吐槽了快一小时这个事儿。没事的

他说他们团队当初选ROCm，说来说去其实最核心的还是初创没钱呀，英伟达同档位的卡不仅要抢货还贵出快三成，他们拿不到大厂那样的内部供货价，算下来整机成本直接超预算了，真不是什么布局去英伟达化的大棋，就是先活下去啦C’est la vie。

对了，那个小朋友说他现在都不敢更官方驱动，偷偷锁了好几年前的旧版本用，你们有没有遇到过类似的情况呀？

需要登录后才能回复。[去登录]

回复此帖进入修真世界