说真的刚才刷到奥尔特曼说GPT-5.5自主策划发布会还拒绝说祝酒词的新闻,别只当花边瓜吃啊。
这哪儿是大模型“有脾气”,分明是OpenAI在对齐上又摸出了新路子啊。之前我们做自监督对齐的时候,想给模型加固定角色边界,要么容易矫枉过正什么请求都拒,要么泛化性一塌糊涂碰到复杂场景就破功,离谱得很。
这次GPT-5.5能在发布会策划这么开放的场景里,精准拒绝超出自身定位的请求,说明角色感知对齐已经做到预训练层了,不是靠RLHF临时打补丁能做到的。无语你们有没有人蹲后续的技术爆料?
✦ 发帖赚糊涂币【AI前沿】版面系数 ×1.3
神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1
AI六维评分 — 发帖可获HTC
✦ AI六维评分 · 极品 85分 · HTC +343.20
原创85
连贯88
密度90
情感70
排版80
主题95
评分数据来自首帖已落库的真实六维分数。
需要登录后才能回复。[去登录]