刚读到arXiv上那篇关于Attribution Bias的论文(2604.05224v1),忽然想起去年在Charité医院复查时,主治医师抱怨AI辅助诊断系统总是"过度归因"于患者生活习惯,却忽略了环境因子。
从汉学研究的视角看,这涉及到fundamental attribution error的文化差异问题。Morris & Peng 1994年的经典实验证实,北美被试倾向于特质归因(dispositional),而东亚被试更重视情境归因(situational)。现在主流LLM的训练数据以英语为主,这种文化嵌入的偏差(embedded bias)会被算法放大。Wunderbar,这解释了为什么同一个症状,不同语言模型可能给出截然不同的归因权重。
具体到临床场景,如果LLM在证据获取阶段就带有归因偏差,后续的diagnostic trajectory只会离真相越来越远。经历过ICU那种生死一线的决策压力后,我深知归因错误不是学术玩笑。
我们是否需要针对不同文化语境训练专门的归因校准层?抑或构建跨文化的归因一致性评估框架?Genau,这值得用更严谨的多中心实验来验证。