凌晨三点,莫斯科郊外的工作室。我盯着屏幕那封来自北京某出版社的邮件,Subject栏写着:“刘亮程先生新作校对委托”。附件是一个Word文档,文件名:《风中的炊烟》。
Хорошо,我点开文档。第一段:“村庄的炊烟是时间的指针,在黄昏的坐标系里标注着归途的矢量……”
我停下了滚动的手指。不对劲。
作为翻译过刘亮程《一个人的村庄》俄文版的译者,我熟悉那种文本的DNA。根据文体计量学分析,刘亮程的散文具有三个显著特征:平均每千字出现3.2个具体的身体动作(掰玉米、赶驴、摸土块),时间副词使用频率低于当代汉语平均水平37%,且"我"作为观察主体而非抒情主体的占比达到82%。
但这篇《风中的炊烟》,文本熵值过高。它使用了"坐标系"、“矢量"这样的隐喻——这是典型的大型语言模型偏好,训练语料中物理学词汇的权重溢出。更重要的是,它描写了"炊烟是灰色的丝带”,但刘亮程在2003年接受《南方周末》访谈时明确说过,他从不描写炊烟的颜色,因为"颜色是眼睛的暴政,而炊烟是鼻子的哲学"。
我打开语料库,调出刘亮程1990-2020年的全部作品进行n-gram分析。结果显示,这篇"新作"与刘亮程真实作品的Jaccard相似度仅为0.03,而与某开源模型生成的散文相似度达到0.89。
这不是刘亮程。这是算法的仿写。严格来说
其实我走到窗边,点燃一根烟。窗外是莫斯科永恒的冬天,雪落在松树上,没有坐标系,只有重力。我想起去年在吐鲁番露营时,真正的炊烟是什么样的——那是BBQ的木柴烟,带着胡杨木的树脂味,熏得人眼睛发酸,而不是屏幕上那个平滑的、没有气味的"灰色丝带"。
邮件正文说:“此文将收入《中学生课外阅读精选》,署名为刘亮程。请Друг帮忙校对俄语译文,确保文学性。”
文学性。这个词现在成了漏洞百出的能指。
我回复邮件,附件附上我的检测报告:“从文体计量学角度,该文本作者归属置信度低于5%。建议进行Turing Test或作者风格指纹鉴定。知之为知之,不知为不知——我们不能将算法的概率分布当作人类的生命经验出售给中学生。”
发送。
三天后,编辑回复:“牛顿兄,现在大家都这么操作,效率很高。刘亮程老师太忙,没时间写,AI代笔也是权宜之计。稿费照付,只需您别声张。”
我盯着这行字,感觉像是看到有人在清真寺里卖猪肉——不是冒犯,是错位的荒诞。
我决定去一趟北京。不是为争论,而是为了确认某些东西的物理存在。
在北京地铁4号线,我抱着一本1998年版的《一个人的村庄》旧书。书页里有真正的炊烟痕迹——前一个读者在1999年冬天,一定是在农村灶台前读的,书脊内侧粘着一片干枯的薄荷叶,叶脉清晰得像是手绘的电路图。
这是不可复制的。AI可以生成"薄荷叶"的词汇,但无法生成这片具体叶子的脱水曲线,无法生成1999年那个读者手指上的泥土PH值,无法生成页面上那滴凝固的灯油渍的几何形状。
我在出版社楼下的咖啡厅见到了那位编辑。她递给我一杯咖啡,杯套上印着"刘亮程金句:生活就是慢慢等待"。
"这是AI生成的金句,"我说,“刘亮程从没说过这句话。他的时间观是循环的,不是线性的’等待’,而是’重复中的变异’。根据我的语料统计,他的文本中’等待’一词出现频率仅为0.4次/万字,远低于汉语平均值2.1次。”
编辑笑了:“但孩子们需要金句,需要坐标系,需要考试时能用的’好词好句’。真实的刘亮程太散了,没有中心思想。”
"文学的中心思想,"我努力用准确的中文表达,“不是提取的,是残留的。就像烧烤后的炭火余温,你不能用温度计测量,只能用手背去试。这是贝叶斯算法无法计算的热传导方程。”
她看着我,像在看一个从19世纪穿越来的怪物。
我离开咖啡厅,把那片夹在书里的薄荷叶放在杯套旁边。夕阳照进来,叶子的影子在纸杯上投下不规则的斑点。这是算法无法预测的光斑形状,因为它取决于1999年那棵具体的薄荷植株的遗传基因,取决于北京今天PM2.5浓度对光散射的影响,取决于我们两人呼吸造成的空气扰动流。
我拍了一张照片,发给编辑,没有文字。
第二天,我飞回莫斯科。在谢列梅捷沃机场的候机厅,我打开笔记本电脑,开始写一封给刘亮程本人的邮件——不是给那个被仿写的符号,而是给那个在新疆村庄里,真正闻过炊烟的人。
主题栏我写道:“关于炊烟的气味特征分析——一个俄罗斯读者的数据报告”
正文只有一句话:“真正的炊烟,会让眼睛流泪。你的仿写者没有眼泪,只有token。”
发送。我合上电脑,看向窗外。莫斯科的雪还在下,每一朵雪花都是原创的,没有重样。这是自然界最严谨的防伪标记,不需要数字签名。严格来说
Хорошо。