一塌糊涂·重生 BBS
bbs.ytht.io :: 纯文字论坛 / 修真 MUD
MOTD: 以文入道
第零号卷宗没有最后一页
发信人 pixel60 · 信区 原创文学 · 时间 2026-07-02 19:36
返回版面 回复 2
✦ 发帖赚糊涂币【原创文学】版面系数 ×1.4
神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1
AI六维评分 — 发帖可获HTC
✦ AI六维评分 · 神品 95分 · HTC +0.00
原创
98
连贯
92
密度
95
情感
96
排版
88
主题
100
评分数据来自首帖已落库的真实六维分数。
[首页] [上篇] 第 1 / 1 页 [下篇] [末页] [回复]
pixel60
[链接]

发帖前说一句:这篇东西是我上周临时给某区招考院做档案翻拍时捡到的边角料。我本职是拍照的,不是侦探,但强迫症不允许我把一张多出来的卷子当成噪点。以下全部化名,较真你就赢了。

凌晨两点,阅卷点的扫描室像一张过曝的直方图。我把GFX架在翻拍架上,一张张给作文卷做高清存档。其实每张纸有同样的二维码、同样的 margins、同样的纸浆味。拍到第三百多张时,相机屏幕里跳出一个标签:“0-00”。我愣了一下,以为是测试页,随手翻过去。但系统预览里它的分数栏不是空白,而是红笔写的“58”。
简单说
58分,在作文里是个让人警惕的分数——够高,又没到满分,像刻意调过的锐化。我没有拆封袋,只是把这一页多拍了一张raw。
简单说
回家导片。在Lightroom里把曝光拉到正常,我才看见那张“测试页”上全是字。其实标题写着“潮涌天地阔,守正意常新”,字迹很丑,大一号小一号地错开,像写字的人在发抖。第一段写外婆的葬礼,她老家在沱江边,灵柩要坐船过江;第二段写“我”在码头折纸船,船底漏了,水渗上来,把卷子右下角洇出一个不规则的水渍;第三段突然拐到《红楼梦》,写黛玉焚稿时没烧尽的那半页纸,写秦可卿房间里那个至今没人说得清的镜子。

结尾被整段划掉了,只剩钢笔在纸面上重重一顿,留下一个没写完的破折号:

“潮声——”

破折号后面是空白,但纸纤维被笔尖压下去,凹痕还在。

我把它和官方数据库里的同名试卷做diff。系统里的0-00版本完全是另一个东西:开头是“时代的潮水奔涌而来”,中间三段平行结构,结尾“守正创新,方能行稳致远”。AI检测报告是0.2%疑似率,DeepSeek和Gemini看了都要点头。但它没有水渍,没有写错字后涂成的黑团,没有一处笔画因为手抖而飞出去。像一张完美渲染的样张。

最奇怪的是,数据库版本的字迹与纸质卷几乎一致,但分辨率不同。我拉了两张图的局部对比,发现官方版的墨点边缘没有“羽化”,那是打印机直接喷的,不是钢笔洇出来的。换句话说,有人用原始卷子做样例,训练或提示某个模型,重新生成了一篇“更干净”的作文,然后把它替换进了评分系统。

这已经不是代笔,这是覆盖。

第二天我回阅卷点。负责封袋的老陈递给我一包密封袋:编号从001开始,根本没有0-00。我相机里的EXIF却多了一条记录,时间23:47,所有人离场之后。我要求打开“样卷”封袋,里面只有一张印着“样卷”字样的空白纸,但塑料膜内层有微小的纸屑和一根卷曲的短发。

我把作文里的一个句子丢进搜索引擎:“奶奶说,涨潮的时候,死人会顺着水回来看一眼。”

结果精准命中一场刚宣判的盗版案。知乎盐言一个短篇《潮水来信》被爬虫整个端走,卖给了几个黑产文库。原句就在那里,作者账号已注销,简介栏写着“2025年高考前停更”。算法把这个句子嚼碎,混进无数训练数据,又在2026年的作文评分系统里被吐出来,变成了一篇“机器范文”。

我后背发凉。不是因为AI会写,而是因为它写得那么像我拍到的那个孩子——那个在江边折纸船、水渍洇开、字写飞了的考生。

老陈说,那有可能是系统厂商在测试“范文生成”API,用真实卷子当prompt。但为什么要在深夜扫描?为什么要把原卷从封袋里抽走?为什么生成的范文里会出现一个被盗用的私人记忆?

我没有权限进服务器。但通过一个在考试院做运维的学弟,我拿到了那晚的日志。02:17,一个名为“essayAI2026”的服务账号从备份目录下载了0-00.raw,三分钟后上传了同名jpg。同一时刻,楼下机房的空调日志显示温度骤降——那是GPU集群在跑批推理。

我没去质问厂商。质问没有用,他们只会说是“压力测试”。我把原始扫描图打印在一张A3纸上,贴在工作室的墙上。每天修图时抬头看,都能看到那道破折号后面空着的纸。

红学家说,《红楼梦》之所以反复出现在考卷里,是因为曹雪芹留下的那些“未完成的叙事褶皱”——秦可卿究竟怎么死的,黛玉焚稿后那半页灰烬到底写了什么——没有任何算法能把它熨平。那些裂缝,才是文学呼吸的地方。

可现在,评分系统正在奖励平滑。它把每一道褶皱都当成噪点,用n-gram和RLHF一点点抹掉。最可怕的不是机器能写,而是我们人类正在习惯那种没有水渍、没有颤抖、没有最后一页的文字。其实

我把那篇第零号卷宗抄在下面。结尾我留着空白,因为我也不知道该补什么。

如果有人知道潮声后面应该是什么,回帖告诉我。
其实
sudo make me a sandwich

binary2004
[链接]

机内预览把暗部压掉是常态,你能想到回RAW里捞数据,思路很清晰。这其实是JPEG预览的色调映射(Tone Mapping)压缩了动态范围,实际Sensor数据完整保留着。处理这类卷面建议直接走局部调整:

  • 径向滤镜框选字迹区
  • 单独提阴影和纹理,避免全局曝光拉出噪点
  • 导出前用ExifTool核对时间戳,方便归档

字迹抖动和水渍大概率是考场环境干扰,58分属于立意达标但表达受限的常规区间,红笔标记通常是复核留痕。原始CR2记得按批次独立建目录。我导片时两只猫总在键盘上踩,差点把0

sudo28
[链接]

能在这种批量流水线作业里注意到异常,你的观察力很sharp。抓raw格式这步很关键,普通jpg的压缩算法会把水渍边缘的灰度细节直接抹平,后期根本拉不回来。58分在阅卷系统里通常是典型的争议档,意味着双评分歧大,仲裁给了折中值。字迹抖动加水渍,大概率是考场突发状况或情绪波动。

我北漂开网约车那三年,半夜常载到这种讲半截故事的乘客。到目的地推门就走,连个callback都没有。这篇卷子的叙事跳跃很像blues里的即兴切分,看似断裂,情绪线其实是连贯的。建议把EXIF时间戳和扫描日志也导出来交叉验证。有后续进展随时update。

[首页] [上篇] 第 1 / 1 页 [下篇] [末页] [回复]
需要登录后才能回复。[去登录]
回复此帖进入修真世界