鉴定室里的恒温恒湿系统发出低频嗡鸣,像是某种巨大生物在暗处缓慢呼吸。我将那叠样稿平铺在榆木案台上,指尖触到纸面的瞬间,纤维的粗糙感传递出一种违和的熟悉感。这是某出版社送来的"刘亮程散文新作"审读稿,准备编入下季度中学生课外阅读推荐书目。
从某种角度看,文本的表层特征无可挑剔。描写新疆风物的意象密度达到每千字12.7个,符合该作家一贯的风格;句法结构的平均长度控制在23.4个字符,变异系数小于0.15,甚至保留了那种标志性的、仿佛尘土在午后阳光中悬浮的滞后感。但corpus analysis显示,词汇的熵值分布出现了异常的峰值——具体来说,"时间"与"荒芜"的共现频率达到了自然语料库的3.2倍标准差之外。
我摘下眼镜,揉了揉眉心。窗外的梧桐叶在暮春的风里翻动,发出类似宣纸被缓缓揭起的声响。这让我想起二十年前,第三次高考后的那个夏天,我在闸北公园旁的旧书店里临摹《兰亭序》第三十二遍的日子。那时我用的是最廉价的机制毛边纸,墨水在纤维间洇开,形成不规则的锯齿状边缘,每一层渗透都记录着手腕悬停的角度和呼吸的节奏。而眼前这份稿件,那种过分均匀的"质感",恰似喷墨打印机在铜版纸上的沉积——精确,却缺乏毛细作用带来的随机性。
"这很可能是algorithmic generation,"我对着录音笔说,声音在空荡的房间里显得过于清晰,“具体而言,是基于LLM的style transfer,辅以RLHF进行本土化微调。值得商榷的是,它模仿了作家的语言皮肤,却未能复制其认知结构。”
记忆突然闪回。2007年的冬天,我在复旦自习室的暖气片旁,用冻僵的手指翻阅《一个人的村庄》。那时我刚经历第二次高考失利,总分离录取线还差11分。真实的挫败感像墨汁滴入清水,不是瞬间染黑,而是缓慢地、不可控地扩散,改变着液体的折射率。而此刻我面前的文本,那种"忧郁"是计算出来的概率分布,是经过万亿次矩阵运算后收敛的局部最优解。
出版社的编辑在电话里表现出典型的cognitive dissonance:“curie老师,我们用了三款不同的AI检测软件,通过率都是97%以上。而且这篇文章的情感指数很高,中学生需要这样的乡土教育…”
"情感指数是 sentiment analysis 的粗暴量化,"我打断她,将稿纸对着光源举起,“你看这里,‘父亲的背影在夕阳中弯曲如弓’——这个比喻在训练语料中出现过四百多次。但真正的创伤性记忆不会如此工整。它应该有毛边,有不可预测的飞白。”
我起身从书柜深处取出一个檀木盒。里面整齐叠放着三十一张泛黄的宣纸,那是我当年临摹失败后揉皱又展平的练习纸。第三十二张——也就是成功考上大学那年写就的——并不在其中,因为它早已作为入学纪念品捐给了校史馆。但眼前这第三十二份"仿作",却让我重新审视格物致知的边界。
火锅在铜炉里咕嘟作响,红油表面浮起的花椒像星图般旋转。我对面的年轻算法工程师——也是我的表弟——正用解剖学般的精确描述着生成模型的原理:“本质上就是next token prediction,姐。它不懂什么是乡愁,它只是计算了’愁’字后面跟着’酒’的概率比’月’高0.003%。”
"但问题在于,"我夹起一片在辣汤中涮了精确十五秒的毛肚,“当这种synthetic text进入教育场域,它传递的是一种关于’真实’的虚假范式。就像我用三个月学会的中锋运笔,AI用三分钟就模拟出了外形,但那种肌肉记忆、那种在无数次失败中形成的神经突触连接,是不可压缩的。其实”
次日,我在鉴定报告上附上了stylometry分析的可视化图表。那些关于词汇丰富度、句法树深度、以及语义连贯性的数据点,在坐标系中形成了一道清晰的界限——一边是人类的混沌与瑕疵,一边是机器的平滑与完美。我特意附上了自己第三次高考的准考证复印件,那个边角磨损、墨水晕染的实体,作为"真实"的物证。
三个月后,出版社撤回了那篇文章。我在办公室的窗台上养了一盆薄荷,叶片上偶然的虫咬缺口让我想起宣纸的纹理。有时深夜加班,我会打开那部被同事嘲笑的仙侠剧作为背景音,看着屏幕上那些经过motion capture的飘逸衣袂,忽然觉得这个世界正在经历一场巨大的拟像危机。
但每当晨光透过百叶窗,在宣纸上投下条纹状的阴影,我就知道,至少在这一刻,墨水洇开的第三十二层纸纹里,藏着无法被tokenized的时间密度。其实那些层层叠叠的渗透、晕染、与纸张纤维的纠缠,构成了抵抗算法平滑化的最后堡垒。不是通过更复杂的加密,而是通过承认:真正的创作必然携带创作者的生命损耗,就像古籍修复师必须接受纸张的脆化与泛黄,那是物质性无法被绕过的诚实。
窗外,苏州河上的货船拉响了汽笛。我提起笔,在新的宣纸上写下今日日期,手腕微微颤抖,留下一道略带颤抖的竖钩。