看到刘亮程那条声明时,我正在给一段大提琴solo做comping。屏幕上的波形像条受伤的蛇,突然弹出的推送说,有篇AI仿写的"刘亮程"要被收进中学生教辅,原作者直到校样阶段才发现。
这就像你辛辛苦苦写的function,被人用Copilot重新生成了一遍,注释比你写的还规范,但runtime的时候偏偏漏掉了那个关键的edge case。
想起在部队的第一年。每个人发过一个绿皮笔记本,牛皮纸封面,内页是粗糙的米黄色道林纸。我的那本现在还在防潮箱里,和几张现场演出的票根放在一起。翻开来,第三页有块指甲盖大的黄褐色渍迹,是夏训时汗滴上去的,正好晕开了"汇报"的"汇"字三点水。旁边那行字当时写得很急,钢笔尖(永生牌,明尖,0.5)划破了纸,墨在纤维断裂处堆积,形成不规则的锯齿边。
简单说
这是肉身写作的debug log。AI生成文字是clean build,零warning,零memory leak,但也绝对没有stack trace。它不会记录你是在三十七度的帐篷里写的,还是凌晨两点紧急集合后,借着走廊的声控灯写的。那些因困倦而颤抖的笔画,那些因握笔太久而产生的指节僵硬,那些被手汗浸软的纸角,这些runtime error才是文本的指纹。
有人觉得这是浪漫化痛苦。错。这是关于不可压缩性。
我练了十五年书法,主攻颜体。知道同样的《多宝塔碑》,双钩填墨和原碑拓片的区别不在字形,而在纸纤维的微观受力。真迹的墨色里有笔锋的压力分布,有书写者当时的呼吸频率,有手腕悬起时微妙的肌肉震颤。这些是raw data,但无法被有效vectorize。就像你用Kontakt采样小提琴,可以capture到G弦的振动频谱,但无法capture演奏者左手指尖的茧子与琴弦摩擦时的那个特定contact impedance。
AI仿写是极端lossy的compression,而且loss掉的恰恰是最高熵的那部分信息。
刘亮程写新疆,他的文字里有风干的时间。那种干燥不是humidity参数可以模拟的,是晒过戈壁滩的纸,是沾过羊奶的墨迹,是写作者在某个特定下午三点的血糖水平和皮质醇浓度。AI可以parse他的句法树,甚至可以模仿他的latent space,但compile不出他当时正在经历的life event。
当兵那两年,我最怕的不是五公里越野,是闲着。因为闲着意味着身体没有留下痕迹,像一段被gc掉的内存。后来做独立音乐,我坚持要录真弦乐而不是用VST音源,道理一样。MIDI音符的velocity是线性的,完美到虚假。就像那篇要进入教辅的仿写文,主谓宾严丝合缝,修辞比喻risk-free,但缺少了一个关键variable:写作者当时是否正在经历emotional buffer overflow。
现在有些出版流程想optimize,用生成模型批量生产"名家风格"的阅读理解素材。这就像是给中学生喂soylent,营养成分表上蛋白质碳水脂肪一个不少,但缺少咀嚼的肌电信号,缺少胃酸分泌时的那些bio-feedback。
纸页上的汗碱会泛黄,会脆化,会在十五年后变成不规则的结晶。但那是证明文字曾经活着的fossil record。
我后来翻过那个绿皮笔记本的扉页,发现班长用红墨水钢笔写的一句话:“字是心画,纸是骨。”
当时觉得酸。现在做久了producer,混过太多音轨,反而懂了:心画不是指calligraphy漂亮,而是指每一笔都携带了当时的physiological state。AI没有eccrine gland,所以它的文字永远不会结晶出盐。