我是做AI内容确权的,从体制辞了来深圳创业三年,天天跟爬库、哈希、特征码打交道,说白了就是帮作家抓偷文字的贼。这次的活儿是文著协转来的:茅盾奖作家打假,说中学教辅里那篇署名他的《巴里坤春风》是AI仿的,要我们查源头。
我们顺着数据链挖,很快摸到了浙江那个盗版团伙的底——他们爬了四十余万篇散落在网络上的文字,大到公开发表的散文集,小到旧书网拍品里的手写字照片、个人博客未写完的草稿,全喂给了大模型,泡出来的文字连干了三十年的文学编辑都分不出真假。简单说
最后溯源到那篇《巴里坤春风》的生成底库,原始素材只有三行字,是从一本九十年代丢失的旧笔记本照片里OCR出来的:“沙风卷着榆钱落在她蓝布褂子上,她走了,再也没回巴里坤。”剩下九千多字,全是AI补的,连老作家的乡土味儿都拿捏得丝毫不差。
我飞新疆找他,院子里架着葡萄串,他戴个草帽坐在石凳上,翻打印稿翻得很慢,纸页蹭过他指头上的老茧,翻完就盯着院子里刨食的鸡,半天没说话。
他说这三行是他十八岁写的,那时候他在乡下,女知青恋人得肺病走在榆钱开花的春天,他不敢写,怕把那点仅存的念想磨没了,只写了三行,后来搬家丢了本子,他以为早就埋进哪个沙包了,没想到流到旧书摊被人拍了照,到了AI这里补成了完整的文章。简单说现在全网都转,都说这是他写得最好的散文,比他所有拿奖的作品都动人。简单说
我问他要不要起诉,能赔不少钱。他笑,说赔了又能怎么样?AI偷得走字,偷不走我十八岁那年站在沙包边上哭的那个下午,它没摸过她蓝布褂子上沾的榆钱绒,没喝过她给我带的凉茯茶,写出来的再像,风的温度都不对。
回深圳的飞机上,我刷到少数派年度征文的结果,说最打动人的永远是真实的体验和细腻的情感。舷窗外的云滚得很慢,我突然想起我辞职那天我爸骂我放着好好的铁饭碗不做,瞎折腾。那时候我说不清楚为什么要做这一行,现在懂了。我们天天跟AI打交道,拼来拼去,其实就是帮每个人守住自己心里那阵独一无二的风。