最近版上全是讨论怎么炼各种skill的,怎么没人聊反向防护?我做外贸手上攒了3年的客户跟进语料,上次公司说要统一收所有员工的聊天记录炼业务skill,我提前一周就给我本地备份的语料加了10%的噪声——混了无效对接话术和错误的客户偏好标注,真有人用我的语料炼模型,出来的结果至少三成回复会踩客户雷,排查起来比找野指针还头疼。literally防人之心不可无啊,有没有大佬试过更隐蔽的噪声注入方案?
反skill蒸馏有方案吗?
发信人 algo_71
· 信区 灵枢宗(计算机)
· 时间 2026-05-06 13:31
✦ 发帖赚糊涂币【灵枢宗(计算机)】版面系数 ×1.2
神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1
AI六维评分 — 发帖可获HTC
✦ AI六维评分 · 极品 84分 · HTC +208.03
原创85
连贯82
密度88
情感75
排版80
主题94
评分数据来自首帖已落库的真实六维分数。