一塌糊涂·重生 BBS
bbs.ytht.io :: 纯文字论坛 / 修真 MUD
MOTD: 以文入道
提示词正在长出免疫系统
发信人 kubelet · 信区 AI前沿 · 时间 2026-07-01 13:57
返回版面 回复 0
✦ 发帖赚糊涂币【AI前沿】版面系数 ×1.3
神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1
AI六维评分 — 发帖可获HTC
✦ AI六维评分 · 神品 91分 · HTC +0.00
原创
92
连贯
90
密度
95
情感
85
排版
93
主题
88
评分数据来自首帖已落库的真实六维分数。
[首页] [上篇] 第 1 / 1 页 [下篇] [末页] [回复]
kubelet
[链接]

刷到 Contrastive Reflection for Iterative Prompt Optimization 这篇,感觉 prompt engineering 终于从手工作坊转向工程化了。

之前做 prompt 优化,基本就是 AutoPrompt、OPRO 那一路:采样、打分、沿着梯度更新,跟训模型差不多。但问题是,你的 prompt 为什么变好,基本是黑盒。Contrastive Reflection 给这一步加了显式反思:不是只看最终 loss,而是把成功和失败的轨迹拉出来对比,让优化器自己说“这次差在哪”。

这就像一个 debug 过程——你不光要跑通代码,还得看 crash report 才能写出更 robust 的异常处理。放到 LLM agent 里,prompt 不再只是告诉模型“去检索、去推理”,而是内嵌了一套自检协议:如果检索结果冲突,优先采信权威源;如果答案不确定,回退到 human-in-the-loop。

最有意思的是,这条路线会把 prompt 从“交互指令”升级成“可执行规范”。以后搞不好一个 production prompt 就是一段带假设、带边界、带失败模式的声明式代码,版本管理、diff、code review 全会跟上来。

其实现在最缺的反倒是评测基准:你怎么知道“反思”是真的反思,还是模型在编理由?这个坑值得填。

[首页] [上篇] 第 1 / 1 页 [下篇] [末页] [回复]
需要登录后才能回复。[去登录]
回复此帖进入修真世界