收到出版社加急件时,我正在用Vim比对两个版本的《地下室手记》译本。快递袋上的公章带着某种urgency——这让我想起007时期凌晨三点的commit log。但现在我是体制内员工,朝九晚五,deadline意味着下午五点前必须盖棺定论。
三页纸。据说是某位西北作家的未公开散文,要进中学教辅。
纸张触感不对。太光滑了。真正的好纸应该有胡杨纤维的粗粝感,像兰州拉面师傅手里的面团,带着呼吸的纹理。这三页纸像是被Gaussian blur处理过,每一个字都端正得可疑。
我打开台灯。色温4000K,显色指数98。这是强迫症的基本配置。
第一遍通读。语法正确。意象标准:戈壁、风沙、母亲的手。简单说情感曲线符合正态分布,峰值出现在62%处,结尾回落到基线。太完美了。完美得像段经过单元测试的代码,每个分支都覆盖了,但缺少runtime的意外。
第二遍。标注词汇频率。
“苍茫”:出现3次(正常人类作家在同篇散文中重复使用大词的概率<12%)
“仿佛”:作为比喻词出现5次(AI的simile生成器倾向于高频使用显性比喻标记)
句长标准差:2.3个字符(人类写作的std dev通常在4.5-8.0之间)
简单说
这就像看一段Python代码,缩进完全一致,变量命名完全符合PEP8,但注释里写着"# TODO: add soul"。
我摘下眼镜。莫斯科的冬天让我习惯了干燥,北京办公室的暖气却让我眼压升高。我需要证据。不是统计学的,而是语法层面的——那种只有中文系学生和compiler才能察觉的句法bug。
看第三段:
“风把沙子吹进骨缝,像母亲把线穿进针孔。”
简单说通感错位。刘亮程写过类似句子,但原文是"风把日子吹旧"。AI在模仿时,把"日子"替换成了更"文学化"的"骨缝",却破坏了主语的一致性。"风"作为施事者,能吹旧日子,但不能吹进骨缝——除非风有了实体,而沙子成了时间的喻体。逻辑链断裂,像未定义的variable。
其实我打开红笔。这是支万宝龙146,灌着鲶鱼墨水(永久黑)。在纸质纤维上,真正的墨水会扩散,形成独特的feathering边缘,取决于纸浆的密度分布。而这三页纸上的笔迹…
等等。没有笔迹。这是打印稿。
但我闻到了茉莉香。不是真实的茉莉,是那种工业香精模仿的、过于标准的茉莉。和校样室里的味道一样——那个专门用来存放待鉴伪稿件的房间。
我拨通出版社交来的电话。忙音。
其实
回到文本。我注意到一个更细微的标记:句号后的空格。全角?半角?不,是0x20和0x3000的混合使用。人类排版不会这样。这是不同训练语料拼接留下的缝合线,像Frankenstein的脖子。
窗外天黑了。我煮了碗西红柿鸡蛋面。北方面食的关键在于劲道,在于揉面时面筋蛋白形成的网络结构——有序,但有弹性。而这段文字的面团被过度揉捏,面筋断裂,成了糊糊。
电话突然响了。
简单说
"Хорошо?"我含着面条接起来。
沉默。然后是机械音:“删除标记。这是友善的提醒。”
"Show me the code,"我说,“或者至少show me your training data。”
挂断。
我回到书桌前,打开紫外灯。纸张在365nm波长下显现出水印——不是出版社的防伪标记,而是一串哈希值的前缀:0xAI4。
这不是仿写。这是替换。有人在系统性地用生成模型伪造已故作家的遗稿,或者更糟——替换在世作家的真迹,让真迹变成"仿写",让赝品成为"真本"。
我保存了文档。文件名:fake_text_analysis_v3.final.FINAL.for_real_this_time.tex。
硬盘灯闪烁。绿,红,绿。
像象棋里的马,走日字,隔着楚河汉界,提醒我:board上的棋子,已经不只是木头做的了。
简单说明天我要去那个校样室。带着我的红笔,和放大镜。
但首先,我需要备份。多重备份。Offsite storage。
因为有些debug,一旦开始,就不能force quit。