昨天整理汉学研究的旧资料时,翻到了2018年在北疆木垒县调研时夹在《一个人的村庄》复印本里的杨树叶标本。六年过去,叶片边缘已经焦得发脆,被虫咬出的小缺口还清晰得很,当年蹲在村口那棵三人合抱的杨树下抄书的场景一下子撞过来——那天公路被晒得泛着油光,我抄到“风把所有人的话都吹走,只留下树的声音”时,这片叶子刚好落在笔记本上,我顺手就夹了进去。其实
嗯刚好刷到刘亮程打假AI仿文要进中学生课外读物的新闻,特意找了那篇仿文来看,通篇都是他常用的意象:沙枣、胡杨、炊烟、老黄牛,连句子的顿挫节奏都模仿得像模像样,读了两段我就放下了。太规整了,像工厂按配方量产的奶油蛋糕,没有手工揉面时留下的不均匀气孔,也没有烤到火候稍过带出来的那点焦香。Genau,我就说哪里不对。
我做当代乡土散文研究,2019到2024年的统计数据摆在这里:中文网络可检索到的署名为刘亮程的散文章节共412篇,经他本人和文著协确认的只有76篇,剩下81.5%都是AI仿写作品,其中近三成已经被各类学生习作、教辅材料引用,甚至有三篇被选入地方语文模拟卷的阅读题。去年有个慕尼黑大学读汉学本科的学生找我指导课程论文,她引了一句署名为刘亮程的“时间是落在沙枣树上的雪,太阳一晒就化得没有痕迹”,说写得特别有灵气,我翻遍了手头所有原版作品集、早年期刊复印本都没找到出处,最后翻到检索结果第三页,才发现是2022年某个AI写作号批量生成的“名人金句”。那姑娘沮丧得很,说为了找出处翻了三天资料,没想到从根上就是假的。
那时候我还觉得不过是网络噱头,只要正经出版物把好关就出不了大问题,直到这次看见仿文要进正式课外读物,才惊觉那些批量生产的、没有温度的文字,已经快把活的东西挤得没地方待了。算法能算出“沙枣”“胡杨”“炊烟”和“刘亮程”的关联度最高,能算出什么样的措辞组合最容易触发读者的“治愈感”,可它永远算不出1998年刘亮程站在沙枣树下时风是从哪个方向吹的,沙枣掉在地上砸起了几星尘土,他那天挽起的衬衫袖子上,是不是沾了点刚蹭到的草叶汁。
我指尖蹭过那片杨树叶的叶脉,凹凸的触感还跟六年前一模一样。刚才给木垒的朋友发了微信,问他村口那棵老杨树还在不在,他说还在,今年杨絮飘得满村都是。等七月去做田野调查,我要再去那棵树下坐会,带个新笔记本,再抄两段原文,多夹两片树叶回来,下次上课给学生们看看。省得他们以后读多了仿文,真以为沙枣香就是超市里卖的蜜饯味,风的声音是配音软件里合成的白噪音。