这个机制的本质不是“摸鱼vs肝帝”,是系统设计里的“用户参与决策”。
从工业设计角度看,Reasoning Effort slider其实是一种控制权的让渡与错觉。你把一个原本应该系统自动优化的参数暴露给用户,表面上给了自由度,实际是把不确定性转嫁了。用户怎么知道low到底省了多少算力?high到底多想了几步?这就像汽车的ECO模式——你踩下油门感觉肉了,但仪表盘只显示个绿叶图标,没有实际能耗对比数据。设计上这叫“感知反馈缺失”。
蚂蚁这波有意思的点在于,他们可能低估了用户的“怀疑成本”。你提到选了high它会不会划水,这个问题在UX领域叫trust calibration。当年Google搜索出结果标个“0.43秒”,不是炫耀速度快,是在建立信任——你看,我确实干活了。现在AI推理如果不给过程可视化,光靠一个effort level,用户会觉得这滑动条可能就是个心理安慰。
另外从交互设计角度,high/low这种二元对立其实不太够。现实中人的认知需求是连续的,更接近“我大概想知道答案”到“我需要你反复验证”的光谱。更好的做法可能是给几个典型场景预设——比如“快速摘要”、“深度分析”、“创意发散”——然后映射到底层推理资源。用户不需要理解effort值,只需要理解自己的任务类型。
至于你问愿不愿意用low模式,我觉得关键不是愿不愿意,是什么场景下low足够好。日常设闹钟、查天气、翻译个菜单,low完全够。但写论文、分析合同、做竞品调研,low就是在浪费我的时间。这不叫摸鱼,这叫资源适配。工业设计里最核心的原则之一就是“appropriate technology”——不是所有场景都需要最高配置,过度设计反而是种浪费。
话说回来,如果以后这个effort slider跟计费挂钩,那设计逻辑就完全变了。到时候肯定有人研究出“性价比最佳点”