我在工地脚手架上看完那篇《风中的土坯》时,安全帽上的灰落到了书页上。这是本《中学生课外美文精读》,署名刘亮程。但我总觉得哪里不对——就像用全站仪测标高时,某个读数偏离了闭合差允许范围。
从某种角度看,这种违和感源于文本的"意象密度"。我做过统计:刘亮程《一个人的村庄》中,平均每千字出现3.2个自然意象(尘土、狗、树、风),且多为静态白描。但这篇《风中的土坯》达到了每千字7.8个意象,动词使用频率高出42%,更像某种训练数据中的风格拟合。
我在夜校图书馆查了三个小时。文著协三月份发布的声明证实了猜想:这是AI仿写文本,通过transformer架构对作家语料进行风格迁移生成的赝品。值得商榷的是,这种技术伦理的滑坡速度——当语言模型可以精确复制茅盾文学奖得主的句法指纹,我们面对的就不再是简单的盗版,而是某种认知层面的身份盗窃。
我追踪到这本书的印刷批号。在南四环一个潮湿的仓库里,我见到了负责采编的中年编辑老张。他递给我一支烟,手指上有油墨味:“我们知道是机器写的。但成本呢?一篇原创散文稿费800,AI生成只要0.03度电费和三秒算力。“他背后的货架上堆着类似的"名家作品集”,书脊上印着余华、苏童、李娟的名字,都是未曾问世的"新发现”。
高潮发生在那个暴雨夜。我在印刷厂办公室发现了一份《经典作家风格参数手册》,里面详细拆解了三十位当代作家的修辞特征:莫言的通感偏好系数0.73,阿来的藏地意象权重矩阵,刘亮程的碎片化叙事递归深度。这不是简单的仿写,而是一场精密的文体解剖工程。更可怕的是手册最后一页——那里列出了"下一代目标作家",包括几个还在夜校读书的文学青年。
我拨通了文著协的电话。电话那头沉默了很久,说:“我们已经在收集证据。但你要知道,当算法能完美模拟人性温度,真与假的界限就只剩下一道统计学上的显著性水平。”
现在那本书放在我的工具箱里,和水平仪、游标卡尺放在一起。每天午休时,我会重新测算那篇文章的句长标准差。数据告诉我那是假的,但某种更深层的东西让我困惑——如果一篇仿写的文字能让工友们觉得"写得真好,像咱们村里的事",那么 authenticity(本真性)到底是一种可被验证的物理属性,还是仅仅是集体记忆的功能性投射?
上个月,我在夜校写作课上提交了一篇关于钢筋水泥的散文。老师批注:"有刘亮程的影子,但太刻意。"我笑了笑,没解释。或许在这个真假难辨的文本世界里,保持一点笨拙的、无法被算法归类的瑕疵,才是人类作者最后的防伪标识。
窗外的塔吊正在运转,吊着一捆钢筋划过黄昏的天空。从某种角度看,那像是一个巨大的标点符号,正在给这个模糊的时代重新断句。