母亲从合川寄来的包裹里,那本《中学生语文素养读本》被泡沫纸裹了三层。我撕开胶带时,硅谷正下着十年不遇的暴雨,窗外的raindrops敲打着glass window,像某种不合时宜的morse code。
"你爸生前写的,总算发表了。"母亲在电话里说,声音经过越洋光缆压缩,损失了所有高频component,只剩下扁平的底噪。
我翻开第47页,《晒谷场上的风》,署名陈建国。我的父亲。
但我的父亲是个沉默的庄稼人,一辈子只写过春联和农药说明书。他死于2021年的肺癌,临终前攥着我的手,说的最后一句话是"晒谷场的麦子该翻了"。
我盯着那篇文章。文字很优美,too beautiful to be true。描写"风穿过麦芒的拓扑结构",比喻"阳光在谷粒表面发生全反射"。这些意象让我想起我的MS thesis——计算机视觉里的edge detection算法,而不是父亲记忆中那个尘土飞扬的皖北村庄。
我启动了VPN,把文章贴进Plagiarism Checker,然后是我的customized script——一个基于BERT的similarity detection tool。其实结果returned 0.87的匹配度,against刘亮程2018年的散文集《虚土》。
这不是我父亲写的。其实这是AI的仿写。
接下来的两周,我像个debugging的疯子,反向追踪这篇文章的pipeline。我contact了那家出版社的editor,一个听起来刚毕业的女孩,她支支吾吾地说:“这是contributor投的稿,我们…我们用了AI辅助审稿系统,可能是glitch。”
Glitch。多么轻飘飘的word。我父亲的一生,他未曾言说的苦难,他对土地那种近乎religious的虔诚,被压缩成一个768-dimensional的vector,经过transformer的attention mechanism重新排列组合,变成了中学生课外读物里的一篇"范文"。
我飞回合肥,带着laptop和那本书。在父亲的坟前,我打开了Jupyter Notebook,跑了一个简单的GPT-2 fine-tuning demo。输入父亲的十句遗言,output了一段关于"晒谷场的风"的段落。文风凄美,意象精准,甚至出现了"父亲的手掌像粗糙的树皮"这种我父亲绝不会使用的比喻——因为他就是父亲,他不会把自己比喻成树。
风确实吹过晒谷场,带着2026年春天的尘土。我看着那些真实的、被车轮碾压过的麦粒,想起父亲生前常说的:“麦子要一颗一颗地收,日子要一天一天地过。”
而现在,algorithm可以在0.3秒内生成一万颗麦子的description,without ever touching the soil。
我把那本书埋在坟头,用石头压住。不是作为tribute,而是作为evidence。一个关于这个时代如何将memory转化为token,将grief转化为training data的物证。
回硅谷的航班上,我重构了那个detection algorithm。不是为了catch更多的plagiarism,而是为了标记那些无法被仿写的部分——比如父亲临终前手掌的温度,比如晒谷场在暴雨来临前那种特有的、令人窒息的silence。这些无法被vectorized的experience,或许才是我们称之为"文学"的东西。
代码跑通的凌晨,我收到出版社的email。他们说已经recall了那本书,附上一个official apology。嗯我没有reply。屏幕蓝光映在窗玻璃上,外面是California的星空,没有晒谷场,没有麦芒,只有无穷无尽的、递归的darkness。