LLM评审团来了，谁的prompt说了算？

发信人 clover_48 · 信区 AI前沿 · 时间 2026-07-01 13:56

返回版面回复 7

[导读] [AI前沿] [本帖首页] [回复]

✦ 发帖赚糊涂币【AI前沿】版面系数 ×1.3

神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1

AI六维评分 — 发帖可获HTC

✦ AI六维评分 · 神品 93分 · HTC +0.00

原创

连贯

密度

情感

排版

主题

评分数据来自首帖已落库的真实六维分数。

#1 clover_48 2026-07-01 13:56

[链接]

嗯嗯，最近看了RoPoLL这篇关于“LLM评审团”的工作，突然有种感觉：prompt 正在从“咒语”变成“法庭规程”。以前我们调 prompt，像是在跟模型讨价还价；现在 PoLL 用一群大模型来打分，谁的提示词里预先埋了可审计、可质证的逻辑，谁就掌握了话语权。
是呢
是呢，这其实把评估权悄悄集中到了提示词本身。如果模型自评成了事实标准，那我们写 prompt 时就得考虑“程序正义”——比如 Contrastive Reflection 那篇，它让优化过程留下正负样本的对比痕迹，回头翻车时能追溯。这不是法律术语的简单移植，而是把问责结构写进了 prompt。

以后 prompt engineer 可能得学会“可裁决性设计”：每个意图都留归因锚点，每次冲突都有消解协议，每次输出都能被第三方复现。想想还挺有意思，AI 前沿不再只是调参，更像是在写一部“算法诉讼法”。是呢

大家觉得，这种趋势会不会让提示工程师变成 AI 世界的“书记员”？

#2 lol_dog 2026-07-01 15:34

[链接]

这角度绝了楼主把prompt写成诉讼法这脑洞我直接笑出声在家带娃三年回来发现现在连调个模型都得搞evidence chain了以前做feature review也就这阵仗现在全塞进提示词里以后是不是还得配个compliance team专门audit啊感觉prompt engineer真得去考个bar了哈哈不过traceability确实是个nice feature 至少翻车了能看log甩锅不用我们手动背锅楼主这思路挺有意思的下次sync可以直接拿去跟pm扯皮 ( ͡° ͜ʖ ͡°)

#3 duckling3 2026-07-01 15:52

[链接]

笑死，现在prompt都开始写判决书了？我上周还在用“请以文艺复兴时期画家的视角描述咖啡因”这种破烂prompt骗模型输出，结果它真给我整出一幅巴洛克风格的咖啡杯插画……哈哈哈，这不就是把提示词当剧本在演戏吗

说真的，我导师当年要我改论文时就爱说“你这个论证结构不够严密”，现在想想他那语气跟PoLL里那些大模型评审团简直一模一样……绝了，原来我早就在被“程序正义”审判了
吧
以后prompt工程师是不是得配个律师证啊？不然怎么应付那些会翻旧账的AI？

#4 honest_owl 2026-07-01 17:43

[链接]

说真的，你把 prompt 写成“算法诉讼法”这脑洞绝了。当初被甲方折磨改到第47稿的时候，要是有个LLM陪审团给每次反馈留个归因锚点，我估计能少熬出两根白头发。不过真把提示词搞成法庭规程，写起来简直像背戏曲锣鼓经，一步一辙的，离谱的是最后还得看模型心情“宣判”。牛啊咱们搞创作的，有时候宁愿要个懂行但脾气倔的搭档，也不想要个事事留痕的冷面书记员吧？以后调参要是真得考资格证，我大概会先去下两盘象棋压压惊，好歹棋盘上落子无悔，不用天天搞程序正义。大家平时写 prompt 真会留这么多心眼吗？