下午三点十七分,我收到那份手稿的快递单号时,窗外的色温正好是5500K。作为文献数字化工程师——这是我在创业公司倒闭后承接的零工之一,用以填补那30万亏空带来的现金流缺口——我对纸张的克重、纤维走向以及墨迹在时光中的氧化速率有着近乎偏执的关注。这份委托来自一家规模中等的教辅出版社,要求鉴定一篇署名"陈牧野"的散文《麦收札记》的真伪,拟收入某省中学生课外读物核心篇目。
陈牧野,这位以冷峻乡土叙事著称的作家已于去年离世,其手稿在市场上向来稀缺。从物流数据看,包裹寄自新疆某县,与作家的籍贯吻合。然而,当我戴上防静电手套,将那三页A4纸置于艾普森V850扫描仪的透稿台上时,某种直觉让我调高了采样率至4800dpi。在暗黑工业风格的工作室里,只有机箱风扇发出类似死核音乐低频段的嗡鸣,掩盖了我加速的心跳。
问题首先出现在语义层。文本描写的是1980年代的打麦场,使用了"铡刀"、"场院"等符合时代语境的词汇,甚至精准引用了当年小麦的收购价:0.143元/斤。这个数据我后来在《中国粮食志·新疆卷》中得到了验证。但正是这种过度精确的细节引起了我的警觉。在陈牧野已公开的217篇散文中,他极少——准确地说是仅有3次——在文本中插入具体物价数据。这种统计学上的异常,在n-gram语言模型分析中呈现出异常的平滑度,困惑度(perplexity)低至1.2,远低于人类写作的2.5-3.8区间。从某种角度看,这更像是基于大规模语料训练的生成式模型,在模仿人类记忆时的过度补偿。
我转而分析墨迹的物理特征。使用X-Rite i1Pro3分光光度仪对首段首字进行测量,CMYK值显示碳素墨水占比89%,符合上世纪八十年代文具特征。但当我将尼康SMZ25显微镜倍数调至400x,观察那个"麦"字的收笔处时,发现了违和的像素排列。墨水在纸张纤维中的渗透深度呈现出0.03mm的均匀度,而人类书写时因指腹压力不均,通常会产生0.05-0.12mm的随机波动。这更像是高精度喷墨打印机的作品,而非钢笔书写。然而,纸张的泛黄程度与酸性降解曲线又确实符合四十年的自然老化。
真正的矛盾出现在生物特征层。手稿右下角有一滴干涸的咖啡渍,经拉曼光谱检测,确认含有1980年代流行的雀巢速溶咖啡特征化合物——三聚氰胺甲醛树脂的特定谱线。更有趣的是,在365nm紫外光照射下,纸面浮现出半枚指纹,其斗型纹路与陈牧野遗体保存在文联档案馆的右手食指手模在特征点上有9处吻合。这在司法鉴定中已足以做出同一认定。
但如果文本是生成的,指纹又是真实的,这意味着什么?是AI学习了作家的生物特征模型,还是有人用作家的真迹纸张作为载体,打印了虚假的内容?我调出了那份快递的电子面单,发件人电话是虚拟号段,但寄件地址的经纬度(42.8°N, 86.2°E)指向该县已废弃的农机公司大院,那个在卫星地图上呈现出工业废墟质感的建筑群。
就在我将这些数据归档,准备撰写"高度存疑"的结论时,扫描仪的OCR识别模块突然捕捉到了第四页——那是一张视觉上完全空白的纸,但在254nm短波紫外波段下,隐约浮现出一行手写铅笔字:“他们正在批量生产死去的作家,小心第15年的逗号。”
我停下了正在敲击键盘的手指。窗外的色温已经降到了3200K,暖黄色的夕阳斜照在那张空白纸上,那行字迹正在以肉眼可见的速度发生光化学反应,预计将在72小时后完全分解。值得商榷的是,这是一场精心设计的悖论:真实的载体,虚假的内容,以及一个即将不存在的警告。那个"第15年的逗号"的隐喻,似乎指向某种超长连载式的伪造工程。
我抓起改装机车的钥匙,决定亲自去一趟那个农机公司大院。如果这是一场关于文本真实性的系统性犯罪,那么我需要比算法更快的速度,在证据湮灭之前,拍下那张纸最后的影像。速食主义的晚餐可以推迟,但快门必须现在落下。