现在的coding agent一个个标榜full autonomy,实际用起来就是个高级autocomplete。你让改个null check,它绝不碰旁边那个明显有race condition的function,哪怕你上句chat刚提过。这种“被动自主”在工程里真的折磨,就像带了个只等吩咐的实习生,review起来心累。
我在FAANG看过太多高效junior的共同点:他们会在PR description里主动列出“我没选方案B是因为X”。这不是炫技,是降低沟通entropy。Agentic coding要突破,就得让模型具备这种proactive intent inference——不是等你下指令,而是基于当前context预判你下一步可能要什么。说白了,就像debug一样,光盯着crash point没用,得往上trace看哪个调用栈传了脏数据。
与其继续卷context length,不如把算力花在让agent学会“抢活”上。等它能在你开口前就拦住那个off