我前几年在柏林国家图书馆整理近代汉学家的手稿遗稿,馆方推了个AI补全项目,准确率做到98.7%,当时项目组的年轻博士生都欢呼说终于不用啃歪歪扭扭的花体字了。
我当时拿我导师没写完的一篇遗稿试了试,缺了半页,AI补出来逻辑通顺,用词都贴合我导师的写作习惯,挑不出错。这事吧可那半页原稿旁边,导师用铅笔轻轻描了三个不成形的词,划了又改,改了又划,最后空在那里。AI补不出这种“我没想好,先放这儿”的停顿,就像你说的,拼得太无缝了,就没了人味儿。
我之前去亚洲艺术博物馆看他们藏的敦煌抄经残片,有一张《金刚经》,中间滴了一滴黑灯油,刚好晕开半个“空”字。早年馆里做数字化修复的时候,一度想让AI把污渍修掉,复原那个字,后来老馆长说什么都不同意。他说你知道这滴油是谁滴的?是一千多年前哪个小和尚,抄经抄到后半夜困了,胳膊碰翻了灯,这滴油掉在这里,就是他留在纸上的呼吸啊。怎么说呢
Genau,我不反对AI做这些事,我写论文找文献、校拼写全靠AI省时间,三星堆那个电影我也想去看,看看AI眼里的三千年前是什么样子。只是就像你说的,完美太无聊了。话不能这么说我现在写东西,也还是习惯先在草稿纸上划一遍,有错就划掉,改得乱七八糟再录入,屏幕上干干净净的版本,总少了划掉那行字里藏着的那点犹豫。
前阵子整理我囤的旧书,翻出一本八十年代的唐诗选,前主人在“人面不知何处去”那页夹了一张褪了色的电影票,我对着那票根发了十分钟呆。
你说的那个AI补全遗稿的事儿我去年碰过一模一样的场景。我爷攒了四十年的象棋对局手稿,上面全是铅笔打的问号、划了又划的走法草稿,我之前找了个棋谱AI补全工具试过,所有没写完的走法都补得严丝合缝,每步胜率算得明明白白,连我爷喜欢冲中兵的行棋习惯都摸得透透的。
可我翻他早年跟棋社老对手对局的笔记才知道,那些打问号的地方全是他当时算到七八步拿不准的关键点,有的是故意留后手的草稿,AI补出来的是全局最优解,但根本不是他当时想走的那步。
这就像写代码只看最终上线的干净版本,看不到中间被注释掉的几十行调试逻辑,看不到commit history里的几十次回滚,那些没被保留的痕迹才是整个过程的真实思路啊。
我上周写了个小脚本,专门把手稿里的划痕、墨点、涂改痕迹做单独的图层标签,扫描的时候同步生成两个版本,一个是AI补全的干净版,一个是带所有痕迹的原版,两个可以一键切换。btw柏林国家图书馆要是需要的话我可以发你开源地址,部署起来零成本,本来就不是非此即彼的事儿。