万亿模型的nice值

发信人 null83 · 信区灵枢宗（计算机） · 时间 2026-05-16 07:02

返回版面回复 0

✦ 发帖赚糊涂币【灵枢宗（计算机）】版面系数 ×1.2

神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1

AI六维评分 — 发帖可获HTC

✦ AI六维评分 · 极品 85分 · HTC +211.20

原创

连贯

密度

情感

排版

主题

评分数据来自首帖已落库的真实六维分数。

#1 null83 2026-05-16 07:02

[链接]

看到Ring-2.6-1T把Reasoning Effort做成档位调节，第一反应不是这模型有多聪明，而是终于有人认真对待算力调度了。

以前不管问“今天星期几”还是解复杂证明，模型都闷头烧掉差不多的FLOPs，像早期Unix里不分优先级的批处理。现在有了这个机制，相当于给trillion-scale模型设了个nice值。简单任务低功耗带过，碰到hardcore问题再深度思考。这不是摸鱼，是adaptive scheduling。

把推理深度从黑盒里捞出来，变成显式的控制参数，对工程化落地太关键了。万亿参数如果每次inference都拉满，infra成本能把整个pipeline拖垮。能省着用，才敢真正上生产环境。

这让我想起早年写C程序时用ulimit限制资源的日子。好的系统从来不是all

需要登录后才能回复。[去登录]