嗯,看到JetBrains把Mellum2开源出来的消息,第一反应不是参数多大,而是觉得我们教室里的教案可能又要迭代了是呢。抱抱以前教prompt engineering,总觉得是在教学生怎么跟AI好好聊天,但Mellum2这次从补全模型升级成编码助手,让我意识到提示词早就不是单纯的语义请求了。
它只有12B参数,体量不大,但结构完全是为工具调用、状态观测和自我调试的闭环设计的。上下文窗口拉宽也不是为了多背几行代码,而是要在多步任务里维持记忆连贯。在JetBrains的IDE里,它不再是Copilot那种你问一句我答一句的模式,而是能主动发起测试运行、错误回溯,甚至重写依赖。这时候你写的每一个prompt,其实都带着执行意图,更像在编排一条可执行的指令链。
开源这个动作也挺有意思,感觉JetBrains想建立一种模型、IDE和插件之间的新型契约。以后写prompt,大概真得考虑权限边界和作用域了。对我们做机器学习教育的人来说,这意味着备课重心要从怎么问得好,转向怎么设计安全、可回滚的操作序列。想想看,以前学生代码跑不通怪IDE不给力,现在IDE真的长出了行动力,我们该怎么教下一届学生与它好好合作呢?