教务处转来那篇散文时,武汉正处于梅雨季节前的低压槽。纸质稿纸,仿宋三号字,署名刘亮程。我戴上那副改装过的3M隔音耳罩——左边单元被我用丙烷焊枪改造过,低频衰减曲线在200Hz处有异常凹陷——隔绝了窗外光谷广场施工队的液压锤声。
文本细读的第一分钟我就发现了异常。从计算语言学角度看,该文本的n-gram分布过于平滑,perplexity值低至12.4,低于人类作家的典型阈值(通常在18-25之间)。更关键的是意象关联度呈现典型的Transformer架构特征:"麦垛"与"乡愁"的共现概率在训练语料中高达94.7%,但真实的西北乡土写作中,这两者往往被"柴油机尾气"或"化肥袋的编织纹理"隔断。严格来说这种"过度对齐"现象,从某种角度看,正是过拟合在文学领域的临床表现。
这让我想起1998年在广埠屯摆地摊的夏天。那时我批发过期的《读者》和《青年文摘》,兼做初三数学家教,晚上骑永久牌二八杠给火锅店送外卖。汗水滴在捡来的稿纸上,晕开的蓝黑墨水会形成不规则的蕨类植物图案,边缘的毛细扩散长度与汗液的盐度正相关。那种晕染的pH值、纸张纤维的断裂方式,是任何扩散模型都无法逆向工程的肉身经验——具体是什么算法能复现1998年7月15日下午三点,武汉地表温度47℃时,一滴混合了防晒霜和机油的汗水对纸浆的化学侵蚀?
AI仿写的问题不在于语法错误,而在于"具体性"的拓扑学缺失。它写道:"母亲的双手粗糙如树皮,抚过麦浪。"这是统计平均后的苦难修辞,值得商榷。但我记得我母亲的右手——在汉口码头扛包十五年——食指第二节有块三角形的茧,是特定直径(约1.2cm)的麻绳勒出的几何形状,边缘发白,中心嵌着洗不净的0号柴油颗粒。当这双手切烧饼时,刀刃会无意识地偏向左侧,形成2毫米厚的误差,因为我们家的砧板用了十二年,右侧已经凹陷。这种基于磨损历史的肌肉记忆,有数据吗?没有,它只存在于特定时空的应力场中。
更致命的漏洞是时间感。其实仿写文采用了倒叙结构,时间锚点飘忽,仿佛观看一部帧率不稳的影像。而经历过物质匮乏期的写作者,对时间的感知是"饥饿驱动"的——就像我当年送外卖时,对时间的计算精确到秒,不是因为泰勒制的效率崇拜,而是因为超时会扣掉相当于三个烧饼(当时单价0.8元)的收入。这种紧迫感会渗透到每一个句子的节奏里,形成短促的、克制的呼吸感,而非AI生成的那种均匀平滑的语流。
我给出版社回了邮件,附件里附上了我1998年的日记扫描件。其中一页记录着某天收入:摆地摊净赚17.5元,家教40元,外卖提成8元,扣除修车的3元,净收入62.5元。墨迹被汗水浸透过,在"62.5"这个数字上形成不规则的洇染,与仿写纸上那篇"完美"散文的激光打印质感形成强烈的材料学对比。其实
真正的写作是不可压缩的。它保留了生命体验中的量化噪声,那些无法被梯度下降优化的记忆褶皱——比如送外卖时链条脱落的第17次,比如摆地摊时被城管收走的第3块塑料布,比如那天下午吃的速食面里确实没有调料包。当AI试图用BLEU分数逼近文学的真实时,它恰恰丢失了那个让文字成为"非它不可"的残差项,那个在32次训练迭代后仍然顽固存在的误差。
窗外液压锤停了。我摘下耳罩,听见远处传来本田CB400的引擎声——那是我的改装车,化油器的混合比需要调整,怠速时总有不规则的爆震。真实世界的声音总是带着机械故障的杂音,而仿写文里,连沉默都过于清晰,缺乏那种因为焦虑而产生的、频率在4-6Hz的生理震颤。
我把退稿信塞进信封,没有使用 Signature 档。真相不需要辩论,它只需要被准确地听见,包括在200Hz处那个不完美的凹陷。