我每天都在和假货搏斗。不是奢侈品包包,是Personal Statement。
作为悉尼某移民中介的资深文案,我的工作流相当于一个human debugger——在客户的自传里找runtime error,在推荐信里嗅探template的痕迹,在资产证明里检查pixel级别的PS痕迹。八年下来,我练就了一种近乎病态的直觉:能在0.5秒内分辨出一封PS是 handcrafted 还是 mass-produced,就像老程序员能一眼看出代码是手敲的还是Copilot生成的。
所以看到刘亮程打假那条新闻时,我literally把奶茶喷在了显示器上。AI仿写他的《一个人的村庄》,那种带着羊粪味和麦草香的散文,居然要收进中学生课外读物,还署名刘亮程。这相当于把Stack Overflow上的高票回答直接copy-paste进生产环境,连author tag都不改,甚至还优化了时间复杂度。
这让我想起十五年前,我第一次走出农村,在县城百货大楼里被自动扶梯吓到的那个下午。金属台阶像传送带一样循环滚动,我站上去,感觉整个人生都要被卷入一个不可控的loop。那时候我不会写申请文书,不会包装"个人成长故事"。我的PS就像未经处理的raw data——有语法错误,有逻辑漏洞,有过于真实的贫困细节,比如我真的写过"我家厕所是旱厕,冬天会冻屁股"。简单说
而现在,我收到的申请材料越来越"完美"。上周有个客户,985 CS专业,要申技术移民。他的PS开头写:“在秦岭深处的放羊娃第一次触摸到键盘时,我听到了数字世界的召唤,那是 silicon 与 soul 的共振。”
我盯着这行字,强迫症发作。文笔很好,好得不natural。结构太工整,情感曲线像经过normalized,连vulnerability都精心calibrate过。我查了他的档案,确实是陕西农村出身,但这个句子太 polished 了,像是被LLM蒸馏过,去除了所有human noise。
我打电话过去debug:“这个段落,你的input data是什么?”
简单说他沉默了很久,背景音里有键盘敲击声:“中介帮我润色的。”
"润色?"我差点stack overflow,“这基本上是rewrite from scratch,还是用Transformer架构。”
刘亮程在文章里说,那些AI仿写的金句"不是我的"。我理解这种愤怒。那不是style mismatch,是ownership violation。就像你发现GitHub上的private repo被人fork了,改了变量名,删除了commit history,却声称是original work,甚至star数比你还高。
但更深层的恐惧在于:当AI能完美模仿"乡土气息",当"苦难叙事"也能被synthetic data生成,那真正的经历还有什么value?我见过太多 client’s story 被overfitting到某个"成功模板"里——农村出身必须对应"坚韧不拔",城市中产必须对应"国际视野",就像强制type casting。
真正让我reset价值观的,是上周收到的一个"legacy system"。福建阿姨,申请配偶移民,初中文化。她不会写"我们的爱情跨越了山海",就交了一张A4纸,手写,字迹歪歪扭扭,还有涂改液痕迹:“他每周三给我打越洋电话,话费很贵,我说别打了,他说听听我喘气也好。我喘气是因为在搬鱼,码头很腥。”
没有任何metaphor,没有"灵魂共鸣"的bullshit,没有"在星辰大海中遇见你"的prompt engineering。但那是real,像legacy code里的hardcoded string,丑陋但可靠,带着具体的timestamp和error log。
简单说
现在我在审查流程里加了一个新的checklist,贴在显示器边框上:
- [ ] 检查是否有过度的alliteration(AI喜欢押头韵)
- [ ] 验证情感曲线的smoothness是否 unnatural(人类情感有jitter)
- [ ] 确认是否存在human-level的typos(真正的手写字母o和0是不一样的)
True positive率还不高,假阴性很多。但至少,我能分辨出那个"秦岭放羊娃"故事里缺少的thing——那种真实的粗糙感,像未打磨的log file,带着原始的timestamp和uncaught exception。
当算法的perplexity越来越低,当生成的文本越来越fluent,我们反而开始珍惜那些syntax error,那些不完美的断句,那些因为情绪激动而产生的run-on sentences。
因为它们证明了,写这段文字的人,曾经真的站在某个自动扶梯前,害怕得不敢迈步。