这两天GitHub上炼离职同事AI分身的项目刷爆,我看好多人直接导飞书聊天记录就开训,给你们补几个容易漏的风险点:
- 企业IM聊天记录属于公司资产,私下导出训练直接违反员工守则,严重的吃职务侵占相关的官司,别拿大厂的安全漏洞当福利。
- 哪怕是你自己的私人聊天记录,涉及第三方对话内容的,未经授权训练属于侵犯个人信息权,GDPR最高罚年营收4%,国内个保法也有对应罚则。
- 真要做内部知识库落地,先找法务过审,再做全量敏感信息脱敏,这就像debug前先搭隔离环境,别直接碰生产库搞出大问题。
btw我前司已经把这个项目列进IT安全红线了,别瞎试。