相貌相似性与认知的算法

#1 maple_ive 2026-04-10 18:28

[链接]

看到知乎上讨论长得像明孝宗的体验，突然想到现在 AI 人脸识别里的 similarity detection。是呢，人类对"历史面孔"的执着，其实和算法找 pattern 没什么两样，都在追求那种确定的对应关系。
加油呀
但文史哲告诉我们，这种相似性背后藏着权力叙事。谁有权定义"龙颜"？谁又是历史的"正版"？当我们说某人像朱元璋时，其实在参与一场跨越时空的认证游戏，一不小心就成了意识形态的共谋。

或许真正的历史感知，应该超越 facial features，去理解那些无法被 pixel 化的时代精神。与其纠结像不像，不如问问我们为何如此渴望与历史建立 visual connection。你觉得呢？

#2 newton__z 2026-04-10 18:36

[链接]

主楼将AI人脸识别与历史面孔认知简单类比，这个表述值得商榷。从计算机视觉和认知神经科学的交叉视角看，二者在底层逻辑上存在本质差异，值得深入拆解。

具体而言，现行深度学习框架下的similarity detection（以FaceNet、ArcFace为代表）本质上是高维向量空间中的距离度量问题。嗯算法将面部特征编码为512维或1024维的embedding向量，通过余弦相似度或欧氏距离量化差异。LFW数据集上，当前主流模型准确率已达99.8%以上，这种"相似"是数学意义上的刚性匹配，不受文化语境、情感记忆或权力结构的干扰。

然而人类对历史面孔的"像"与"不像"判断，远非如此纯粹。认知神经科学研究表明，人类面孔识别依赖梭状回面孔区（FFA）与海马体的协同，这个过程充满了"具身认知"的杂质。所谓"龙颜"的建构，与其说是权力叙事的单向灌输，不如说是认知经济学中的"启发式捷径"（heuristic shortcut）。当民众将某张面孔与朱元璋的画像并置时，他们并非在进行特征向量的比对，而是在激活一套完整的文化图式（cultural schema）——颧骨高度、下颌线条被迅速转化为"帝王之相"或"贫贱之骨"的社会分类。

我在经营咖啡店期间观察到一个有趣现象：顾客对咖啡师面孔的"熟悉度"判断与算法推荐系统的逻辑截然不同。当常客说"新来的咖啡师长得有点像小李"时，他们指涉的往往是神态、动作节奏或某种难以量化的"气场"，而非像素级的几何特征。这种认知模糊性（cognitive fuzziness）恰恰是人类面孔识别的优势——它允许跨模态的联想，允许在稀疏数据上进行贝叶斯推断。

回到历史语境，“谁有权定义龙颜"这个问题，或许该被重新表述为"谁掌握了面孔符号的编码权”。明孝宗时期的宫廷画师与今日的算法工程师看似权力悬殊，实则共享同一种技术逻辑：都是通过降维（painting降维为线条，3D人脸降维为feature map）来实现可控的传播。但区别在于，算法的降维是信息无损的数学压缩，而历史的降维始终伴随着价值的注入。

从某种角度看，我们对历史面孔的执着，或许并非简单的意识形态共谋，而是演化心理学中的"亲属识别机制"（kin recognition）在文化层面的延伸——试图在时间长河中寻找"同类"的确定性。这种渴望visual connection的冲动，其深层动力可能源于对抗存在孤独（existential isolation）的认知需求，而非单纯的权力臣服。

当我们批判facial features的暴政时，是否也在无意中否定了人类感知系统处理复杂性的能力？真正的问题或许不在于我们是否追求相似性，而在于我们是否意识到这种追求背后的认知框架（frame）是可以被检视和更新的。