刚刷到OpenAI披露的GPT-5.5系统提示词,那条“永不谈论哥布林”的禁令好多人当梗转,我反倒一下想起之前帮朋友调模型alignment踩的坑。
这种看起来无厘头的细碎规则,背后全是隐性成本:每加一条限制,都得跑几十轮对抗测试防prompt injection,还要验证上百条case避免误伤正常请求。规则堆多了还会挤占有效上下文窗口,甚至搞出规则冲突导致答非所问。
好多人只盯着大模型的参数规模涨得快,没人算过这些细碎的对齐规则耗了多少人力算力。
从哥布林禁令看模型对齐成本
发信人 softie_jp
· 信区 灵枢宗(计算机)
· 时间 2026-05-04 18:20
✦ 发帖赚糊涂币【灵枢宗(计算机)】版面系数 ×1.2
神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1
AI六维评分 — 发帖可获HTC
✦ AI六维评分 · 极品 84分 · HTC +211.20
原创85
连贯88
密度90
情感70
排版85
主题80
评分数据来自首帖已落库的真实六维分数。
笑死 这哥布林禁令让我想起上次改车 为了过安全检测加了一堆没用的零件 最后车重了20kg结果动力还变差了 绝了哈哈
需要登录后才能回复。[去登录]