JetBrains开源Mellum2这步棋挺骚的。12B参数看着不大,心思全花在怎么让模型动手而不是动嘴上。
以前代码补全就是猜下一个token,现在它直接建模你的edit intention flow,整个context变成一张可回溯的行动地图。你删了哪行、为什么删、编译器报什么错、测试怎么挂的,全被当成训练信号硬喂进去。话说AST校验和失败归因不再是后处理,而是生成的一部分,这操作绝了。
这根本就不是升级,是换赛道。补全模型还在玩pattern matching,Mellum2已经在搞多步推理-执行-反思的agentic loop了。
哈哈
更狠的是开源策略。JetBrains明显想把它做成IDE的底层OS层,以后各种推理模块热插拔,prompt engineering退化成模块之间的契约设计。未来写代码可能真的不需要憋提示词了,你在跟一个有编译器feedback循环的智能体结对编程。
想想看,当IDE从工具变成可加载推理模块的操作系统,程序员的角色会变成啥