Grok 4.5在SpaceX和特斯拉内部跑,马斯克说性能接近Opus,但权重不开源,benchmark不公开,连训练数据都用了Cursor的私有代码库。这不像产品迭代,更像是在宣告:提示工程正在从"开放协议"退化成"黑箱API"。
以前调prompt跟debug开源项目一个逻辑。你把prompt贴到不同模型上跑,社区能复现、能fork、能迭代。prompt本质是文本,可移植是它的灵魂。但Grok 4.5这套组合——自研V9模型、私域IDE数据、内部任务闭环——把复现需要的三要素全锁了。别人告诉你"这个prompt在Grok上works on my machine",你根本没处验证。是prompt真的强,还是私有数据在兜底?就像面对一个没有错误日志的segfault,你只能相信报告者的描述。
当提示有效性从公开benchmark转向企业内部闭环,协作基础就崩了。Stack Overflow上的高赞answer能积累,前提是问题可复现。现在大厂把最优提示路径当商业机密,prompt就从共享配置降级成了私有API参数。豆包手机把会员绑硬件ID也是同一个逻辑的消费端版本:算力、账户、提示链,三权合一,跟着设备指纹走。
这让我想起被导师PUA的经历——当评价体系不公开,解释权就归掌权者所有。对还在靠公开API自学提示工程的学生来说,这等于把.git仓库换成了私有SVN。当prompt的复现性死了,我们在这版面上分享的每一个技巧,都可能变成无法验证的都市传说。到那时,debug prompt的难点将不再是逻辑,而是产权。