发帖前说一句:这篇东西是我上周临时给某区招考院做档案翻拍时捡到的边角料。我本职是拍照的,不是侦探,但强迫症不允许我把一张多出来的卷子当成噪点。以下全部化名,较真你就赢了。
凌晨两点,阅卷点的扫描室像一张过曝的直方图。我把GFX架在翻拍架上,一张张给作文卷做高清存档。其实每张纸有同样的二维码、同样的 margins、同样的纸浆味。拍到第三百多张时,相机屏幕里跳出一个标签:“0-00”。我愣了一下,以为是测试页,随手翻过去。但系统预览里它的分数栏不是空白,而是红笔写的“58”。
简单说
58分,在作文里是个让人警惕的分数——够高,又没到满分,像刻意调过的锐化。我没有拆封袋,只是把这一页多拍了一张raw。
简单说
回家导片。在Lightroom里把曝光拉到正常,我才看见那张“测试页”上全是字。其实标题写着“潮涌天地阔,守正意常新”,字迹很丑,大一号小一号地错开,像写字的人在发抖。第一段写外婆的葬礼,她老家在沱江边,灵柩要坐船过江;第二段写“我”在码头折纸船,船底漏了,水渗上来,把卷子右下角洇出一个不规则的水渍;第三段突然拐到《红楼梦》,写黛玉焚稿时没烧尽的那半页纸,写秦可卿房间里那个至今没人说得清的镜子。
结尾被整段划掉了,只剩钢笔在纸面上重重一顿,留下一个没写完的破折号:
“潮声——”
破折号后面是空白,但纸纤维被笔尖压下去,凹痕还在。
我把它和官方数据库里的同名试卷做diff。系统里的0-00版本完全是另一个东西:开头是“时代的潮水奔涌而来”,中间三段平行结构,结尾“守正创新,方能行稳致远”。AI检测报告是0.2%疑似率,DeepSeek和Gemini看了都要点头。但它没有水渍,没有写错字后涂成的黑团,没有一处笔画因为手抖而飞出去。像一张完美渲染的样张。
最奇怪的是,数据库版本的字迹与纸质卷几乎一致,但分辨率不同。我拉了两张图的局部对比,发现官方版的墨点边缘没有“羽化”,那是打印机直接喷的,不是钢笔洇出来的。换句话说,有人用原始卷子做样例,训练或提示某个模型,重新生成了一篇“更干净”的作文,然后把它替换进了评分系统。
这已经不是代笔,这是覆盖。
第二天我回阅卷点。负责封袋的老陈递给我一包密封袋:编号从001开始,根本没有0-00。我相机里的EXIF却多了一条记录,时间23:47,所有人离场之后。我要求打开“样卷”封袋,里面只有一张印着“样卷”字样的空白纸,但塑料膜内层有微小的纸屑和一根卷曲的短发。
我把作文里的一个句子丢进搜索引擎:“奶奶说,涨潮的时候,死人会顺着水回来看一眼。”
结果精准命中一场刚宣判的盗版案。知乎盐言一个短篇《潮水来信》被爬虫整个端走,卖给了几个黑产文库。原句就在那里,作者账号已注销,简介栏写着“2025年高考前停更”。算法把这个句子嚼碎,混进无数训练数据,又在2026年的作文评分系统里被吐出来,变成了一篇“机器范文”。
我后背发凉。不是因为AI会写,而是因为它写得那么像我拍到的那个孩子——那个在江边折纸船、水渍洇开、字写飞了的考生。
老陈说,那有可能是系统厂商在测试“范文生成”API,用真实卷子当prompt。但为什么要在深夜扫描?为什么要把原卷从封袋里抽走?为什么生成的范文里会出现一个被盗用的私人记忆?
我没有权限进服务器。但通过一个在考试院做运维的学弟,我拿到了那晚的日志。02:17,一个名为“essayAI2026”的服务账号从备份目录下载了0-00.raw,三分钟后上传了同名jpg。同一时刻,楼下机房的空调日志显示温度骤降——那是GPU集群在跑批推理。
我没去质问厂商。质问没有用,他们只会说是“压力测试”。我把原始扫描图打印在一张A3纸上,贴在工作室的墙上。每天修图时抬头看,都能看到那道破折号后面空着的纸。
红学家说,《红楼梦》之所以反复出现在考卷里,是因为曹雪芹留下的那些“未完成的叙事褶皱”——秦可卿究竟怎么死的,黛玉焚稿后那半页灰烬到底写了什么——没有任何算法能把它熨平。那些裂缝,才是文学呼吸的地方。
可现在,评分系统正在奖励平滑。它把每一道褶皱都当成噪点,用n-gram和RLHF一点点抹掉。最可怕的不是机器能写,而是我们人类正在习惯那种没有水渍、没有颤抖、没有最后一页的文字。其实
我把那篇第零号卷宗抄在下面。结尾我留着空白,因为我也不知道该补什么。
如果有人知道潮声后面应该是什么,回帖告诉我。
其实
sudo make me a sandwich