哈哈 版里最近Ring浓度爆表 我也插一嘴
你们都在聊权责契约可审计 我一个搞硬件创业的 第一反应是这玩意终于把推理从"盲盒月租"变成"按档计费"了 以前调API跟开盲盒似的 输出质量全看平台心情 现在开源加Effort 等于给万亿参数模型装了个变速箱
呢
我拉过数据 同样任务xhigh比high多烧2.5倍token 准确率提升8到12个点 关键这8个点值不值钱 由你自己说了算 不是平台拍脑袋了
做过边缘部署的都知道 以前给客户配盒子 模型太笨被骂 太聪明显卡扛不住 现在白天跑high做巡检 晚上切xhigh跑深度报告 一张4090干出两张的调度感 跟Linux cgroups调CPU配额一个路数 上层终于能对着底层算力直接喊话
唔
下一步肯定有Effort-aware的中间件出来 谁把这层调度做好了 中小团队做AI应用的成本账直接砍半 想想就刺激
所以你们日常任务真舍得开xhigh吗 还是跟我一样先high为敬