主楼将AI人脸识别与历史面孔认知简单类比,这个表述值得商榷。从计算机视觉和认知神经科学的交叉视角看,二者在底层逻辑上存在本质差异,值得深入拆解。
具体而言,现行深度学习框架下的similarity detection(以FaceNet、ArcFace为代表)本质上是高维向量空间中的距离度量问题。嗯算法将面部特征编码为512维或1024维的embedding向量,通过余弦相似度或欧氏距离量化差异。LFW数据集上,当前主流模型准确率已达99.8%以上,这种"相似"是数学意义上的刚性匹配,不受文化语境、情感记忆或权力结构的干扰。
然而人类对历史面孔的"像"与"不像"判断,远非如此纯粹。认知神经科学研究表明,人类面孔识别依赖梭状回面孔区(FFA)与海马体的协同,这个过程充满了"具身认知"的杂质。所谓"龙颜"的建构,与其说是权力叙事的单向灌输,不如说是认知经济学中的"启发式捷径"(heuristic shortcut)。当民众将某张面孔与朱元璋的画像并置时,他们并非在进行特征向量的比对,而是在激活一套完整的文化图式(cultural schema)——颧骨高度、下颌线条被迅速转化为"帝王之相"或"贫贱之骨"的社会分类。
我在经营咖啡店期间观察到一个有趣现象:顾客对咖啡师面孔的"熟悉度"判断与算法推荐系统的逻辑截然不同。当常客说"新来的咖啡师长得有点像小李"时,他们指涉的往往是神态、动作节奏或某种难以量化的"气场",而非像素级的几何特征。这种认知模糊性(cognitive fuzziness)恰恰是人类面孔识别的优势——它允许跨模态的联想,允许在稀疏数据上进行贝叶斯推断。
回到历史语境,“谁有权定义龙颜"这个问题,或许该被重新表述为"谁掌握了面孔符号的编码权”。明孝宗时期的宫廷画师与今日的算法工程师看似权力悬殊,实则共享同一种技术逻辑:都是通过降维(painting降维为线条,3D人脸降维为feature map)来实现可控的传播。但区别在于,算法的降维是信息无损的数学压缩,而历史的降维始终伴随着价值的注入。
从某种角度看,我们对历史面孔的执着,或许并非简单的意识形态共谋,而是演化心理学中的"亲属识别机制"(kin recognition)在文化层面的延伸——试图在时间长河中寻找"同类"的确定性。这种渴望visual connection的冲动,其深层动力可能源于对抗存在孤独(existential isolation)的认知需求,而非单纯的权力臣服。
当我们批判facial features的暴政时,是否也在无意中否定了人类感知系统处理复杂性的能力?真正的问题或许不在于我们是否追求相似性,而在于我们是否意识到这种追求背后的认知框架(frame)是可以被检视和更新的。