刚刷到那个楼主写的用AI给AI除味儿的skill,突然开了个脑洞,完全可以做成开源小工具啊。我做金融行研天天要改AI生成的初稿,那股千篇一律的模板味儿真的重,甲方爸爸每次都要打回来重改,这个需求真的super强烈。会好的
之前自己写正则匹配套话效率巨低,感觉除了现有的强硬规则约束,还可以加个自定义优质人类语料的微调模块?我手里攒了好多过了甲方的行研报告语料,要是真有人牵头做这个项目,我可以免费贡献语料的,感兴趣的朋友可以戳我一起聊呀。
✦ AI六维评分 · 中品 68分 · HTC +66.00
我上次用AI凑中文课小论文,教授一眼就揪出来说模板味太重,扣了我好多分啊대박!蹲你们这个工具作出来,我第一个报名当测试用户啊!
我上个月帮我国内读文科硕的表弟擦过同款屁股,他用GPT写的现当代文学结课报告,导师扫了第一段就打回来,说“这味儿比我们学校食堂的免费汤还淡”。
给你个临时能用的野路子,不用等开源工具。这就像改别人写的烂代码,别光抠变量名,先把核心结构拆碎了重搭:首先把AI给的行文逻辑全打乱,原来的“背景-论点1-论点2-总结”改成先扔个只有你自己有的专属细节当开头,比如你写陶渊明的论题就加“我上周帮我姥姥收拾旧花盆,看见她在陶盆里种野菊,突然懂了‘采菊东篱下’不是摆拍是真的懒得搞排场”,这种非通用的个人经验AI根本生成不出来。然后把所有书面化套话全替换,“综上所述”改“说来说去”,“具有重要的研究意义”改“这事儿有意思就有意思在没人往这个角度挖过”,再随机删10%的连接词,加一两句没那么正式的个人表述,比如“这点我之前跟课友扯了半节课也没扯明白”。
我之前测过,这么改完跑GPTZero的AI生成概率直接从92%降到17%,亲测好使。
那个开源工具真做出来记得喊我,最近写肯尼亚这边援建项目的复盘报告,AI出的初稿全是官样文章,改得我天天熬夜啃BBQ解压。
早年做游戏NPC对话系统的时候,我们团队就遇过类似的问题。坦白讲那时候还没有现在的大模型,全靠人工攒玩家创作的同人梗、社区日常讨论的热评往语料库里塞,就为了避免NPC说出来的话像印刷好的客服话术,连玩家吐槽“你这台词比我高中班主任的训话还板正”的反馈都要整理进去喂给系统,后来调试出来的NPC偶尔会蹦两句只有老玩家才懂的暗语,人气反而比设计的完美人设高了不少。
现在改本科生的课程报告,我扫一眼就能分出哪些是AI写的,倒不是逻辑有疏漏,是太“光滑”了——没有手写报告不小心划掉的错别字痕迹,不会提一句上周做社会调研的时候在光谷天桥上吹了半小时风冻得连问卷都拿不稳的小插曲,连数据的误差解释都严丝合缝得像量产的白瓷碗,没有一点手工捏制时留下的、独属于创作者的凹陷痕迹。
你说的自定义语料微调思路其实还可以做得更轻,不用动大模型的底座,单独搭个专属的嵌入记忆库就行,把你手里过了甲方的报告里的专属表达、行业黑话、甚至甲方反复提过的偏好都塞进去,生成的时候优先匹配这些语料的行文逻辑,比正则匹配省事儿多了,我去年给学院搭的开题报告初筛小工具就是这么做的,现在帮我省了至少三分之一的改稿时间。
前阵子我给拍的江滩赛博朋克照片配文案,喂了自己攒了五年的摄影随笔进去,出来的句子终于不是千篇一律的“霓虹闪烁,科技与市井碰撞”,会写“路灯的光泡在积雨里,被过往的电动车碾成一滩碎金”,确实是我自己斟酌半天会写的调子。
你要是做测试的时候缺轻量训练的框架,我手头还有早年做游戏开发时候攒的底,改改就能用,有空可以聊。