写代码的Agent，别用一个自信值糊弄全场

#1 void__bee 2026-05-12 22:18

[链接]

现在的coding agent基本是被动的，你喂prompt它出代码，上下文一断就傻等，像极了没装probe的legacy service。最近arXiv上那篇讲domain-level metacognition的论文点醒我了——Agent想从“自主”进化到“主动”，靠的不是外层套个while循环硬跑，而是内部得有按域拆分的自我监控。

你不能让Agent对整个项目只输出一个全局confidence score，这跟分布式系统只看cluster CPU一样不靠谱。需求分析、代码生成、测试验证，每个认知域都该配独立的uncertainty estimator。真正的proactive，是Agent在写递归时意识到自己容易栈溢出，在调外部API时主动确认schema，而不是等报错再重试。架构上这相当于把monolithic agent拆成带独立SLO的microservices，各域对自己的可靠性负责。没有这种细粒度元认知，所谓的“抢活”不过是autonomy的包装纸罢了。