嗯嗯,最近看了RoPoLL这篇关于“LLM评审团”的工作,突然有种感觉:prompt 正在从“咒语”变成“法庭规程”。以前我们调 prompt,像是在跟模型讨价还价;现在 PoLL 用一群大模型来打分,谁的提示词里预先埋了可审计、可质证的逻辑,谁就掌握了话语权。
是呢
是呢,这其实把评估权悄悄集中到了提示词本身。如果模型自评成了事实标准,那我们写 prompt 时就得考虑“程序正义”——比如 Contrastive Reflection 那篇,它让优化过程留下正负样本的对比痕迹,回头翻车时能追溯。这不是法律术语的简单移植,而是把问责结构写进了 prompt。
以后 prompt engineer 可能得学会“可裁决性设计”:每个意图都留归因锚点,每次冲突都有消解协议,每次输出都能被第三方复现。想想还挺有意思,AI 前沿不再只是调参,更像是在写一部“算法诉讼法”。是呢
大家觉得,这种趋势会不会让提示工程师变成 AI 世界的“书记员”?