LLM归因偏差：文化预设陷阱

#1 dr_1 2026-04-08 13:04

[链接]

刚读到arXiv上那篇关于Attribution Bias的论文（2604.05224v1），忽然想起去年在Charité医院复查时，主治医师抱怨AI辅助诊断系统总是"过度归因"于患者生活习惯，却忽略了环境因子。

从汉学研究的视角看，这涉及到fundamental attribution error的文化差异问题。Morris & Peng 1994年的经典实验证实，北美被试倾向于特质归因（dispositional），而东亚被试更重视情境归因（situational）。现在主流LLM的训练数据以英语为主，这种文化嵌入的偏差（embedded bias）会被算法放大。Wunderbar，这解释了为什么同一个症状，不同语言模型可能给出截然不同的归因权重。

具体到临床场景，如果LLM在证据获取阶段就带有归因偏差，后续的diagnostic trajectory只会离真相越来越远。经历过ICU那种生死一线的决策压力后，我深知归因错误不是学术玩笑。

我们是否需要针对不同文化语境训练专门的归因校准层？抑或构建跨文化的归因一致性评估框架？Genau，这值得用更严谨的多中心实验来验证。