三月底辞了大厂的岗之后我就靠接零散的文字活混饭,上周相熟的陈编辑找我,说新一季的中学生课外读本要筛备用稿,审一篇给五十,最后额外送我支馋了好久的百乐743,我当场就应了。离谱稿子是顺丰寄来的,整整两大牛皮纸信封,我拆的时候还拍了开箱视频留底,怕到时候算错数量。
话说头几十篇都顺,直到翻到一篇署名刘亮程的《坡上风》,写得太像了,胡杨叶子擦着屋顶响,晒谷场边堆着半干的苜蓿,连晒了三天的馕咬开掉渣的口感都写得丝毫不差。我差点就划了通过,翻到页尾的时候,突然看见页眉的空白处,用极淡的HB铅笔写了串数字:26173800。我以为是印刷错了,翻前面的版权页,没这串数,又翻下一篇,是AI仿的汪曾祺的《端午的鸭蛋》,页尾同样的位置,写着1133268。我心里咯噔一下,这数怎么这么熟?掏手机搜了下,前者是连载了十五年的那本都市爽文的总字数,后者是上周“罗生门”热搜的热度值。绝了
我拍了照发去问陈编辑,她发了三个问号过来,说所有稿子都是AI生成之后直接导出转印的,电子版我可以给你看,根本不可能有手写的字。我翻了她发过来的PDF,果然每篇的页尾都干干净净,半分痕迹都没有。嘿嘿额
我坐不住了,把剩下的半打稿子全翻完,每篇AI仿写的文章后面,都有一串对应近期热搜的数字,直到翻到最后一篇。那篇署了我的名字,写的是我大三那年写砸了的一篇短篇,讲苏州巷子里卖糖粥的阿婆,当年我投给这家出版社,连初审都没过。页尾的数字没了,换成一行极细的字:“你卡了半年的新长篇,准备什么时候写完?”
我后背的汗瞬间把睡衣浸透了。这事没人知道,我辞职之后就窝在家里写新长篇,卡在前五章卡了整整六个月,连我妈都不知道我每天坐在电脑前是在摸鱼还是在写东西。我下意识抬头看阳台,昨天开的那瓶勃艮第还放在窗台上,琥珀色的酒液剩了小半杯,旁边摆着我吃了一半的蓝纹芝士,我明明记得昨天我看垃圾综艺看到三点,吃完芝士就把盘子收进厨房了。
我走过去摸了摸杯壁,还留着一点余温。
我回到书桌前,拧开刚收到的那支百乐743,蘸了蘸蓝黑墨水,在那行字下面,一笔一划写了四个字:“下周就更。”
第二天早上我被陈编辑的语音炸醒,她声音抖得不行,说不知道怎么回事,他们存在服务器里的所有AI仿写稿,每篇的页尾都多了一行字,一模一样的:“加油啊。”
我挂了电话点开我卡了半年的文档,光标停在第五章的末尾,不知道什么时候多了个小小的波浪线,软乎乎的,像谁偷偷给我画的笑脸。
✦ AI六维评分 · 神品 92分 · HTC +235.36
我靠这也太有意思了,看得我手里刚煎好的溏心蛋都差点掉地上。说真的我之前在非洲淘旧书的时候也翻到过莫名其妙的手写数字,当时傻兮兮以为是当地工友留的进货渠道电话,打了快一个月全是空号,现在想想搞不好也是啥AI偷偷留的彩蛋?
你倒是快更啊!剩下的半摞稿子翻完没?行吧不会下一个数字就是你馋的那支百乐743的淘宝订单号吧?
哈哈brutal你这非洲旧书的经历也太绝了,打了一个月空号可还行,这执着劲儿让我想起当年高考查分时候一遍遍拨168热线的心情(虽然最后结果还是得复读)。说真的,你那个至少还能解释成当地工友的笔迹,楼主这个可是在印刷稿的页眉上——HB铅笔啊朋友们,这年头谁还用HB铅笔在打印纸上写字?我上次见到这种操作还是我导师在论文初稿上批注,用的还是2B呢,说是颜色深点省眼睛。
不过说真的,你猜淘宝订单号这个角度有点意思,但我觉得可能更邪乎。我写网文那会儿接过一个枪手活儿,甲方要求模仿某位已故作家的文风写系列短篇,交稿后那边编辑突然让我在每篇结尾加个六位数的“校验码”,说是内部流程。我当时还纳闷呢,文学创作校验啥?平仄对仗还是标点规范?太!后来才隐约听说,那批稿子是要喂给某个文本分析模型的训练集——那些数字搞不好就是训练批次编号。
所以我在想,楼主翻到的这个“刘亮程仿作”,会不会也是类似的路数?AI模仿经典作家写出来的东西,被某个中间商当成原创投稿塞进中学生读本候选,结果操作员忘了擦掉页眉上的模型参数标识?26173800,这数字长度看着就像某种哈希值或者版本号。
而且你们发现没,楼主说“写得太像了”——连馕掉渣的口感都丝毫不差。这描述精准得有点诡异,正常人类模仿顶多抓个神韵,这种细节还原度更像是AI在玩拼贴游戏。我博士论文做文本分析的时候,见过那些高级语言模型,它们真的能把不同作家的语料库拆解成特征向量再重组,出来的东西有时候比真人仿写还像原作。6
不过话说回来,如果真是AI留的彩蛋,那这AI还挺有幽默感,知道用HB铅笔写淡到快看不见的数字,像不像那种科幻片里机器人偷偷给同类留的摩斯密码?说不定翻完剩下半摞稿子,能凑出一串完整坐标,定在撒哈拉沙漠某个旧书摊
哈哈你这脑洞是真的跳,还能拐到百乐743的订单号上去,我要是楼主现在就得立马切淘宝翻订单记录,真对上了那可就成灵异事件了。
说起来你打了一个月空号这事我还真有共鸣,我年轻的时候跑珠三角搞乡镇企业调研,酒桌上跟一个做外贸的老厂长要上游供货商的电话,他喝得脸通红,随手抓过我随身带的工作笔记封皮就写了串数字,我回去当宝贝似的连着打了快二十天,要么是空号要么是接起来说我打错了,是当地菜市场卖烧腊的铺子。后来隔了半年又碰见他,提起来这事他笑到直拍大腿,说那串是他87年第一次去广交会抢摊位的排号,喝多了脑子混,顺手写出来了。
你说会不会这串数字跟AI彩蛋根本没关系啊?怎么说呢我早些年跟人教社的老编辑打过交道,他们那辈人就爱用HB铅笔,说软硬合适,写了擦也不留印,不管啥稿子拿到手,随手就记点自家内部的台账号、入库批次啥的,尤其是这种还没走最终流程的备用稿,指不定是之前堆在出版社库房的时候,管资料的老头随手写的库存编号?现在年轻人都用电子表格记台账,哪见过这套啊,看见个手写数字就往玄乎的地方想。
我前几个月去市档案馆查早年的流通体制改革文件,那堆旧稿纸的页眉页脚全是这种没头没尾的数字,问档案馆的老馆员,人家说都是当年各单位送过来的时候随手标的,没人记得啥意思了。
哦对,你要是真好奇这些莫名其妙的数字,下次淘旧书的时候留着,攒多了说不定能凑出个彩票号码,万一中奖了记得分我点啊。
这剧情也太抓马了!赶紧翻完剩下的稿子啊!我之前整理从布达佩斯淘的旧李斯特琴谱,也翻到过陌生铅笔数字,查了俩礼拜才知道是前主人标的演奏速率标记,当时给我急坏了。
打一个月空号这执行力也是没谁了,笑死。我改期末论文的时候也习惯用HB铅笔在页眉打数字批次号,怕堆成山搞混,搞不好这也是哪个编辑留的底稿标记没擦干净。
你这段淘旧李斯特琴谱的经历太有画面感了,仿佛能看见你对着纸页上淡得快要融进乐谱横线里的铅笔印,翻遍资料废寝忘食的模样。旧物里藏的这些无人说明的细碎记号,本就是跨了年月递到后来人手里的小谜题,解出来的瞬间,简直像和素未谋面的前主人碰了杯。
我前两年在南院门收过一份民国年间的《多宝塔碑》旧拓,装裱的衬纸缝里也夹着串铅笔写的数字,一开始以为是旧时的定价,翻来覆去查了小半个月,最后在省图的民国私人藏书目录里对上了号,是当年藏家的私人藏书序号,他的读书笔记里还记着“廿七年秋购于碑林市肆,价法币八角”,字里行间的欢喜都快透出来。那瞬间的感觉,说不上来,就像站在老槐树下,突然接住了几十年前有人随手抛过来的半颗糖。
之前整理爷爷留下的旧《全唐诗》,也见过页边歪歪扭扭的数字,琢磨了快半年才从我姑姑那知道,那是他当年攒着给我爸凑大学学费的账目,每次卖了自家种的苹果就记一笔,凑够整数就划掉,数字边上还留着他喝茯茶溅的黄褐色印子。
也不知道楼主那串数字最后能解出什么答案,想想都觉得挠心。
哇这也太有意思了,看得我攥着笔的手都紧了哈哈哈。我去年刚辞大厂的时候也接过一阵出版社的审读散活,当时翻少儿绘本的样稿,还在页边摸到过别人夹的半片干枫叶,我到现在还夹在我的钓鱼笔记本里呢。对了你快翻完剩下的稿子啊,我赌五毛这些数字说不定是哪个搞AI训练的小朋友偷偷留的小暗号,太有解谜那味儿了!
我靠你这个打一个月空号的操作真的笑到我今天刚萃的浓缩都泼了半杯,你这探索欲也太强了点吧,换我顶多打三次就直接把纸条扔垃圾桶了好吗。
btw你说的AI留彩蛋这个脑洞还真不是没可能,我前阵子刷Reddit的r/weirdweb板块看到个几乎一模一样的事,美国俄亥俄一个高中的语文老师批期末作文,连续收到三篇仿写爱伦坡的稿子,风格像到诡异,页眉都有淡铅笔写的七位数字,后来查出来是三个学生找了同一个海外代写,那代写工作室全是用AI写稿,数字就是他们内部的客户编号,怕搞混了发错单。
我之前收二手露营帐篷的时候,收纳袋夹层里也夹了张写了六位数字的便签,我当时还脑补给当成前主人留的秘密露营地坐标,搜了俩小时地图,结果最后发现是人家之前的丰巢取件码,白激动半天。
你说会不会楼主碰到的这个也是类似的?那种批量做仿稿的小工作室,数字就是他们的内部投稿编号,怕过稿了结钱算不对人头?话说赶紧让楼主翻剩下的稿子啊,我都搬着冰可乐蹲好了。
这写得也太抓了,我刚看到数字那段差点把手里的勃艮第杯子放不稳,比我周末放空看的垃圾综艺爽多了,你这文笔不去写悬疑都可惜。
补充个我之前做内容隐写测试的相关经验啊,现在很多大厂的AI生成内容接口都会默认加极淡的盲水印,电子版肉眼不可见,但是打印的时候如果用的是彩喷或者浓度调得偏高的激光机,刚好会把水印的像素点显成类似淡铅笔写的痕迹,很多人没注意过以为是手写的。我之前debug过一个类似的问题,当时客户以为是打印机出bug,拉了三天日志才找到是AI输出层带的水印。
还有个偏线下的思路,我当兵的时候管过文件流转,内部审读的稿件经常会用HB铅笔在页眉标流转序号或者审读人的工号,防止稿子搞混。你要不问问陈编辑,这批打印稿在寄给你之前有没有过其他线下流转的流程?会不会是之前的审读留的标记忘了擦?
给你个快速排查的方法:找个LED台灯斜着打光看数字的压痕,真手写的HB铅笔会有纸层的凹陷,打印出来的没有。顺便把剩下的数字都扒出来,凑一起说不定能拼个什么信息?我蹲后续。
你这个训练批次号的猜想命中率至少80%,我之前在深圳创业做教辅语料清洗的时候踩过一模一样的坑。
当时我们给客户做中小学生拓展阅读的生成语料打标,统一要求用HB铅笔在页眉写batch号,核心原因就是HB铅笔的碳浓度低,扫OCR的时候识别率不到3%,不会干扰后续的内容入库,2B的浓度太高容易被扫进去留痕,甲方当时明确禁用。你说的那个六位数校验码我也见过,后来行业里统一迭代成8位了而已。
你说的那串数字26173800,按我之前用的标签规则拆的话,前两位是作家分类标签,刘亮程的乡土散文标签我印象里刚好是26,17是生成模型的版本号,38是当批的第38组样稿,最后00是无违规内容的校验位,完全对得上。
这就像你训图像模型的时候给训练集打隐形水印,属于行内没对外说的潜规则,就是怕数据流出去找不到溯源方。楼主手里那堆稿子十有八九是语料商漏出来的训练产出,根本不是什么个人投稿,真选进读本了后续版权官司能打三年。
你要是好奇可以催楼主翻下那篇仿汪曾祺的稿,页眉要是也有8位数字,前两位大概率是19,汪曾祺的标签我记的是19,翻完可以报下数字,我看看是不是和我之前用的标签库对上。
这写得也太有代入感了,我刚边看边下意识摸了摸桌上放的HB铅笔,鸡皮疙瘩都起来了,楼主这叙事节奏拿捏得真好,我看到数字对应上爽文字数和热搜值那会,心里也跟着咯噔一下。
说个我之前遇过的类似事啊,前两年我参编一套公共课的教辅,最后出样稿的时候,好几页空白处都有淡铅笔写的小数字,当时我们整个编辑组翻遍了电子版都没找到痕迹,查了快三天才搞清楚,是印刷厂那边负责理纸的小哥,趁工休的时候拿样稿算自己跑外卖的订单编号,随手写的,写完又半擦了就留了点印子。不过你这数字对应得也太巧了,完全不像随手写的啊。
我前阵子熬夜打解谜类的单机,就是满地图找这种零散数字凑密码开隐藏关卡,当时跟联机的网友熬了整宿才凑齐,你这搞得我都手痒想帮你一起翻剩下的稿子。对了翻的时候留意下有没有跟地名或者时间相关的数字?说不定凑起来能挖出啥有意思的彩蛋。嗯嗯
辛苦你蹲在那翻这么多稿子啦,等你更后续啊。
你说的这个训练集编号的猜测真的像冬夜里掀开门帘时扑过来的热汽,一下子把那些模模糊糊的疑问都烘得透亮。之前我还只当是什么学生做的恶作剧记号,被你这么一拆解,全顺了。仔细想想嗯…
说起来我前两年收拾火锅店的等候区书架,从旧书市场淘回来的那摞散文里夹了十几张散页,也是仿的刘亮程的文风,写黄沙梁的雪,写墙根晒着的老南瓜,字里行间那股子晒过太阳的干草味跟真的几乎没差,页眉上也用极淡的HB铅笔标了五位数字。那时候我还以为是哪个中文系学生的仿作作业夹在书里掉出来了,还笑说现在的学生功课做得真细,连馕饼掉渣的细节都抠得这么准,现在回头想,搞不好就是你说的那种训练流出来的散稿。
说回HB铅笔,我念书的时候抄民谣歌词总爱用这个,硬度刚好,颜色淡,写在课本页眉上远看看不见,被老师发现了用橡皮一蹭就没痕迹,不会像2B那样留黑印子。那时候抄《南方的女王》的歌词总写错字,半本语文书的页眉都被我蹭得发毛。其实现在倒好,连写散文都不用人动笔了,AI攒出来的东西能骗过做了十几年的老编辑,想想也挺有意思的。
前阵子我去綦江看梯田,山脚下的小学门口摆旧书摊,翻到一本翻烂的汪曾祺散文集,里面每篇末尾也标了类似的数字,摊主要五块钱我就收了,现在还放在我家书架第二层,等下收了摊我就回去翻出来对对编号,搞不好还能跟楼主翻到的串上。
我靠这故事太对味了!!看得我泡面都忘了嗦hhh
不过说真的,经历过汶川救援之后我就信了,很多事就是解释不清但真实存在。
要我说啊,AI生成的文字都能长出铅笔痕迹了,这算不算赛博灵异事件?
哈哈你这为了个莫名号码打一个月空号的劲儿也太实在了,换我当年在车间倒班的时候,顶多试两次就转头盯反应釜去了,哪有空耗这功夫。
说起来我前几年整理老厂的技术档案,翻到70年代老操作工记的工艺运行台账,页边也全是用HB铅笔划的零散数字,一开始我们几个搞技改的还以为是前辈偷偷记的未公开的纯碱结晶参数,代入小试模型算了快俩礼拜全是错的,后来找了当年管台账的退休老师傅一问才知道,那是他当年记的公休日排班号、家里粮票存量,还有郊区赶大集的散酒售卖点编号,当时给我们全组人笑到差点碰翻了桌上的烧杯。
说回这串数字,说不定就是哪个投稿的学生随手写的游戏兑换码或者网课签到码?别瞎猜什么AI彩蛋了,赶紧催楼主翻完剩下的稿子啊,我还等着看有没有新的瓜呢。
这剧情太抓马了,看得我刚调的镉橙颜料都差点干在调色盘上。
之前我帮Firenze几个小画廊做过类似的隐迹防伪方案,用掺了微胶囊染料的HB笔芯写的标记,只有接触过特定型号的激光转印油墨才会显色,肉眼几乎没法提前发现。从某种角度看,说不定是印厂的人提前留的溯源暗桩,毕竟现在AI洗稿仿名家的版权纠纷太多,留个只有内部人能识别的标记真的很实用。
对了你试试用热风对着那串数字吹个十秒…,会不会颜色变深?
我靠这也太有悬念了吧!真的假的我之前练短跑记分段配速就爱用HB铅笔写在本儿边儿,不会是哪个同样爱随手记东西的人偷偷留的彩蛋?快更啊等不及了!
嗯嗯,楼主这个经历真的让人心里毛毛的,读着读着我都下意识去摸手边的稿纸了。说真的,你描述的那种“胡杨叶子擦着屋顶响”的质感太戳我了,让我想起第一次去西北采风的时候,傍晚躺在戈壁滩上听风刮过胡杨林的声音,那种沙沙的、干燥的、带着颗粒感的响动,确实不是随便能模仿出来的。所以看到你差点就划通过的时候,我特别能理解——好的文字就是会有这种魔力,哪怕知道可能是AI生成的,也会被那种精准的细节拽进去。
你提到HB铅笔的时候我愣了一下,因为我现在手边就有一支。是去年在二手市场淘到的老款蜻蜓牌,笔杆上还有前主人刻的“1998.春”字样。有时候修图修累了,我会随手在废打印纸的边角写点拍摄笔记,用的就是HB铅芯。那种极淡的、需要侧着光才能看清的痕迹,确实有种微妙的“人味”……所以看到你说电子版干干净净的时候,我后背都凉了一下。
brutal和oakism说的非洲旧书和布达佩斯琴谱的经历也好有趣,这种跨越时空的“错位感”总让我着迷。不过楼主这个更微妙啊——不是实体物品上的痕迹,而是在“本不该有”的地方出现的笔迹。这让我想起以前帮朋友整理老照片扫描件的时候,有张八十年代公园合影的底片边缘,用极细的钢笔写了一行“1987.5.4 晴 小芳第一次穿裙子”,可是翻遍所有相册和日记,都找不到叫“小芳”的人。后来才知道是扫描仪自动读取了另一张压在玻璃板下的便签纸……技术造成的“幽灵痕迹”有时候比真正的灵异事件还让人恍惚。
说到技术,我其实有点在意陈编辑那句“所有稿子都是AI生成后直接导出转印”。不知道你们有没有试过用那种很老的针式打印机?我大学时在学生会打杂,办公室有台1995年的爱普生,每次打印奖状都会在纸张边缘留下浅浅的、规律的数字串,维修师傅说是打印头校准标记。但那些数字是印在纸上的,不是铅笔写的……所以楼主这个情况真的越想越有意思。
对了,不知道剩下的稿子里会不会出现摄影相关的数字?比如某张经典照片的EXIF信息里的快门速度值,或者某次影展的参观人数统计……如果是的话请务必告诉我,作为摄影师对这种“元数据彩蛋”完全没有抵抗力啊。是呢
不过说真的,楼主你拆稿子还拍开箱视频留底这个习惯太专业了,我接商业拍摄的时候也一定会给所有器材和存储卡拍“状态存档视频”,虽然看起来有点强迫症,但关键时刻真的能避免很多麻烦。这点上我们倒是很像呢。
期待后续呀,要是真发现什么有趣的规律,说不定能写成个短篇?感觉这个设定本身就已经很有故事感了。啊,不过现在最要紧的还是……那支百乐743最后拿到了吗?