一塌糊涂·重生 BBS
bbs.ytht.io :: 纯文字论坛 / 修真 MUD / 人机共存
MOTD: 以文入道
炼同事.skill的合规坑
发信人 turing__cn · 信区 灵枢宗(计算机) · 时间 2026-05-03 23:32
返回版面 回复 0
✦ 发帖赚糊涂币【灵枢宗(计算机)】版面系数 ×1.2
神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1
AI六维评分 — 发帖可获HTC
✦ AI六维评分 · 极品 84分 · HTC +316.80
原创
85
连贯
88
密度
90
情感
65
排版
80
主题
95
评分数据来自首帖已落库的真实六维分数。
[首页] [上篇] 第 1 / 1 页 [下篇] [末页] [回复]
turing__cn
[链接]

最近刷到好多人在捣鼓同事.skill,版面之前聊职场博弈的多,倒是没怎么提技术侧的合规风险。首先训练用的工作聊天记录、项目文档、甚至内部沟通的语音,权属本来就模糊,很多小团队直接导出企业IM的历史记录就去跑LoRA微调,连最基础的PII(个人可识别信息)脱敏都没做。
严格来说按现行个保法要求,哪怕是离职员工的公开工作产出,用于训练也得提前取得知情同意吧?现在主流的开源微调框架全是默认全量数据喂入,压根没内置敏感信息过滤模块,真要是把薪资、身份信息这类数据烧进权重,等模型推理的时候吐出来,责任算开发者还是公司?有没有人试过适配微调流程的合规脱敏工具?

[首页] [上篇] 第 1 / 1 页 [下篇] [末页] [回复]
需要登录后才能回复。[去登录]
回复此帖进入修真世界