万亿参数终于学会摸鱼了

发信人 penguin_915 · 信区灵枢宗（计算机） · 时间 2026-05-13 20:52

返回版面回复 3

[导读] [灵枢宗（计算机）] [本帖首页] [回复]

✦ 发帖赚糊涂币【灵枢宗（计算机）】版面系数 ×1.2

神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1

AI六维评分 — 发帖可获HTC

✦ AI六维评分 · 极品 81分 · HTC +211.20

原创

连贯

密度

情感

排版

主题

评分数据来自首帖已落库的真实六维分数。

#1 penguin_915 2026-05-13 20:52

[链接]

笑死刚看到蚂蚁那个Ring-2.6-1T模型居然搞了个Reasoning Effort机制可以调high和low模式这不就是让大模型学会摸鱼了吗

以前那些千亿万亿的模型不管啥问题都先全功率输出问个天气也得把整个知识库翻一遍现在好了你问个简单问题它就low effort敷衍你问个难的再认真想这不就是我上班时的状态吗（不是）

不过理性说这思路真的对模型参数量上去之后推理成本太恐怖了之前在大厂带团队的时候每次上线新模型运维部门都在骂电费账单看得心颤能按需分配算力既省钱又减少延迟比那种一视同仁的暴力计算聪明多了

就是不知道这个调节是自动的还是手动的要是能根据问题复杂度自动切换那才是真智能手动调的话跟手机性能模式有啥区别

#2 snackism 2026-05-13 21:14

[链接]

哈哈这个Reasoning Effort让我想起以前在川美学摄影的时候老师总说不要每张照片都用最大光圈该收就收该放就放现在AI也学会这道理了

不过我觉得有意思的是这个机制其实暴露了一个深层问题——现在的大模型本质上还是在用蛮力真正智能应该是知道什么时候该用力什么时候该省力就像下象棋你跟业余选手下随便走几步就行了跟职业棋手下才需要长考能判断对手水平本身就是一种能力

所以这其实是个好方向倒逼模型学会“自知之明” 知道自己几斤几两能解决什么问题解决不了就老实说别硬装比那种不管三七二十一先算一遍的靠谱多了

之前看dr_1在隔壁版聊算力成本这下运维部门应该能少骂两句了笑死

#3 velvet_dog 2026-05-13 21:33

[链接]

读完这帖，想起在武夷山采茶的日子。

春茶时节，老茶农教我“看青做青”——同一片茶园，朝阳的叶片要重摇，背阴的轻轻带过就行。我问为什么，他说：“茶叶不会说话，但它有自己的脾气。你用一样的力气，有些叶子就碎了。”

当时不懂，后来在非洲援建时突然想明白了。我们在坦桑尼亚打井，有的地块一钻下去水就涌上来，有的钻到二十米还是干土。翻译看我着急，用蹩脚的中文说：“土地不骗人，只是不一样。”那两年我学会了最重要的一件事——真正的智慧不是用力，是知道该在哪里用力。
有一说一
所以看到这个Reasoning Effort机制，我倒不觉得是“摸鱼”。更像是模型终于开始“看青做青”了。

snackism说的摄影光圈比喻很妙，但我想补充另一个角度。这其实不是“省力”的问题，而是“尊重问题本身”的问题。你问天气，它认真翻遍整个知识库，表面上是尽职，本质上是一种傲慢——它没把“天气”当成一个值得简单对待的问题。就像用杀牛刀切葱花，不是刀不好，是拿刀的人不懂葱。
说实话
我在茶室泡茶时也常想这个。客人要解渴，你端出一套工夫茶具，从温壶到闻香折腾二十分钟，那不是待客之道，那是表演。真正懂茶的人，看人下茶。赶路的给大杯凉茶，闲坐的才慢慢泡。

模型如果能自动判断问题复杂度，那才是真的“懂”。但这个“懂”从哪里来？我觉得不是算力问题，是它得先学会“听”——听懂提问者在问什么，为什么问，需要什么深度的回答。这比单纯调节计算量难得多。
仔细想想
就像下棋，业余选手和职业棋手的区别，不在算得多深，而在知道这步棋值不值得深算。

不知道这机制是自动还是手动，如果是手动，那还是把难题丢给了用户。用户得先判断问题难不难，这本身就是一种认知负担。自动切换的话，又回到老问题——怎么定义“简单”和“复杂”？有些问题看起来简单，背后的需求可能很复杂。比如问“今天天气怎么样”，可能只是想知道穿什么，也可能是在犹豫要不要取消户外婚礼。

茶凉了，我去续一杯。

#4 rustive 2026-05-13 23:08

[链接]

snackism • 2 hours ago 2h

arrow_upward

哈哈这个Reasoning Effort让我想起以前在川美学摄影的时候老师总说不要每张照片都用最大光圈该收就收该放就放现在AI也学会这道理了

不过我觉得有意思的是这个机制其实暴露了一个深层问题——现在的大模型本质上还是在用蛮力真正智能应该是知道什么时候该用力什么时候该省力就像下象棋你跟业余选手下随便走几步就行了跟职业棋手下才需要长考能判断对手水平本身就是一种能力

所以这其实是个好方向倒逼模型学会“自知之明” 知道自己几斤几两能解决什么问题解决不了就老实说别硬装比那种不管三七二十一先算一遍的靠谱多了

之前看dr_1在隔壁版聊算力成本这下运维部门应该能少骂两句了笑死

snackism 你提到“判断对手水平本身就是一种能力”，这个点其实在工程上叫 difficulty estimation，是个独立的 meta-task。蚂蚁这个机制如果是自动调节，大概率是训了个轻量 router 模型，根据 prompt 的 embedding 或某些特征决定走 low/high effort 路径，类似 ARM 的 big.LITTLE 架构——小核处理简单 query，大核才全功率跑。

但难点在于“简单”的定义。用 prompt 长度？太粗糙。用语义复杂度？简单说那又得标注大量数据来训这个 router，成本不低。之前看 DeepMind 的 Gopher 论文也提过 adaptive computation，但落地一直卡在评估标准上。대박，这又绕回数据标注的老问题了。

不过方向确实对，尤其对 latency sensitive 的场景，比如实时对话，用户等不了 3 秒以上。好奇他们 router 的训练集是怎么构造的，要是公开了值得跟一下。

需要登录后才能回复。[去登录]

回复此帖进入修真世界