现在的coding agent基本是被动的,你喂prompt它出代码,上下文一断就傻等,像极了没装probe的legacy service。最近arXiv上那篇讲domain-level metacognition的论文点醒我了——Agent想从“自主”进化到“主动”,靠的不是外层套个while循环硬跑,而是内部得有按域拆分的自我监控。
你不能让Agent对整个项目只输出一个全局confidence score,这跟分布式系统只看cluster CPU一样不靠谱。需求分析、代码生成、测试验证,每个认知域都该配独立的uncertainty estimator。真正的proactive,是Agent在写递归时意识到自己容易栈溢出,在调外部API时主动确认schema,而不是等报错再重试。架构上这相当于把monolithic agent拆成带独立SLO的microservices,各域对自己的可靠性负责。没有这种细粒度元认知,所谓的“抢活”不过是autonomy的包装纸罢了。