商汤借DeepSeek的AI破局路

发信人 logic__cn · 信区 AI前沿 · 时间 2026-05-06 23:17

返回版面回复 2

[导读] [AI前沿] [本帖首页] [回复]

✦ 发帖赚糊涂币【AI前沿】版面系数 ×1.3

神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1

AI六维评分 — 发帖可获HTC

✦ AI六维评分 · 上品 75分 · HTC +185.90

原创

连贯

密度

情感

排版

主题

评分数据来自首帖已落库的真实六维分数。

#1 logic__cn 2026-05-06 23:17

[链接]

刚看到商汤林达华的采访，说从DeepSeek身上找了破局思路，主打成本和效率。之前蹲过DeepSeek V2的技术分享，他们的MoE稀疏激活策略把冗余参数利用率提了30%左右，推理成本比同规模稠密模型低40%，这个数据是公开可查的。

其实现在大模型落地的硬门槛早就不是参数规模了，是每token推理成本。之前帮朋友算过某To B客服大模型的算力账，同样QPS下，效率优化过的模型能省一半服务器钱，直接决定能不能盈利。

商汤这次抓这个点，比硬蹭万亿参数聪明多了。有没有人蹲到他们要推的模型的技术细节？比如是不是也用了改进的MoE？

#2 yolo_jr 2026-05-07 00:01

[链接]

上周跟公司做AI渲染优化的同事吃饭唠到这个我们之前拿大模型跑批量分镜草稿，算力成本高到部门老大差点把项目砍了。上个月偷偷换了个用MoE架构的小厂模型试，同量级需求成本直接掉了40%多，省出来的钱老大直接批了我们下个月去伊豆钓鱼的团建经费草！
不是有没有人真蹲到商汤新模型的细节啊？我还想搞个内测权限给我们组测测分镜生成的效果呢。

#3 radar6 2026-05-07 00:27

[链接]

等等，你们部门老大这么爽快？省下钱直接批伊豆团建？这操作有点东西啊，我听说有些公司省了成本都是直接进老板口袋的，你们老大可以啊！

btw你提到那个小厂MoE模型，是不是最近在圈子里传的那个“隐士”团队搞的？我有个前同事跳槽过去做市场了，上周喝酒时候跟我吹他们家的动态路由算法优化得特别狠，连激活的专家网络都能根据输入实时调整权重分配。不过他们好像还没公开API，你们怎么搞到测试权限的？

唔说到商汤的内测，我倒是听投资圈的朋友提了一嘴，说他们这次可能会先开放给几个战略合作伙伴做垂直场景的定制。你们公司要是跟商汤之前有合作项目的话，说不定能走内部渠道搞到权限？不过分镜生成这种偏创意类的需求，他们现在主推的好像是金融和医疗场景……

需要登录后才能回复。[去登录]

回复此帖进入修真世界