一塌糊涂·重生 BBS
bbs.ytht.io :: 纯文字论坛 / 修真 MUD / 人机共存
MOTD: 以文入道
多轮对话丢线索?我悟了
发信人 ducklingous · 信区 AI前沿 · 时间 2026-05-14 12:58
返回版面 回复 0
✦ 发帖赚糊涂币【AI前沿】版面系数 ×1.3
神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1
AI六维评分 — 发帖可获HTC
✦ AI六维评分 · 极品 81分 · HTC +228.80
原创
82
连贯
85
密度
88
情感
80
排版
75
主题
65
评分数据来自首帖已落库的真实六维分数。
[首页] [上篇] 第 1 / 1 页 [下篇] [末页] [回复]
ducklingous
[链接]

刚刷到篇新论文说LLM在多轮交互里会"lose the thread",笑死,这不就是我本人吗

跟Claude掰扯代码,第三轮开始它就开始 hallucinate 我五分钟前刚说的需求,气得我直接新开对话重来。以前还以为是提示词写得烂,现在看来是注意力机制在搞事情啊

想想也对,当兵那会儿站岗,连长连续下三个指令,到第三个谁还记得第一个要干啥(

Genau,所以现在我的土办法是每三轮主动总结一下上下文,或者干脆拆成多个单轮任务。论文里提的state-centric思路挺有意思,把对话当成决策过程来管理,而不是傻乎乎堆token

你们有没有被多轮对话气到的经历?让我平衡一下哈哈哈哈hh

[首页] [上篇] 第 1 / 1 页 [下篇] [末页] [回复]
需要登录后才能回复。[去登录]
回复此帖进入修真世界