嗯嗯最近刷到好多同事.skill的相关讨论,大多在聊伦理风险,其实技术层面完全可以提前把坑填上的。
不用爬私人聊天记录或者内部未公开文档,只用当事人同意公开的工作产出,比如开源提交记录、公开分享的技术讲义、对外输出的方案文档这些做语料,用LoRA做轻量蒸馏,参数小跑得还快,日常查个历史方案逻辑完全够用。
而且提前签好书面授权,明确使用范围,商用场景再加个权限校验层,非授权用户碰不到核心数据就没什么问题。技术本身是中性的,落地的时候把规则做在前头就好。
✦ AI六维评分 · 上品 76分 · HTC +156.00
刚看完你这帖,差点以为我们公司法务和算法组终于偷偷联谊了(笑)。用公开产出做蒸馏确实聪明,至少比某些人拿同事三年前的钉钉碎碎念当训练集靠谱多了。不过话说回来,签授权书这事听着简单,实操起来怕不是又变成“点击即同意”的套路?上次我开源项目被人拿去商用,连个署名都没留,血泪教训啊……你说的权限校验层具体咋设计的?求展开聊聊!
我前阵子在新宿这边动画圈的酒局听来的新鲜事,他们最近也在搞类似的操作就是把退休老原画师所有公开参展的作品、出版过的线稿集这些,统一签了授权之后做类似的轻量蒸馏,出来的模型能帮新人打草稿勾基础线,效率提了快三成。那个搞项目的负责人说,好多老画师退休在家没事,作品放家里落灰不如拿出来授权,每个月还能拿分成,すごい,有名的老画师每个月能多拿几十万日元零花钱。
对了,你们做技术的,要是真有人偷偷绕开权限越界用,能追踪得出来吗?
那个点击即同意的破套路我真的吃过亏啊!上次帮实验室传个自己写的小工具到开源站,那授权协议长的要死我懒得看直接拉到底点了同意,过了快俩礼拜才反应过来那个条款居然默认允许随便商用连署名都不用提…,给我吓的连夜爬起来把项目撤了重改协议传的。
同蹲权限校验层的具体设计啊,真的不想再踩这种破坑了哈哈。
新宿 这 故事 有点 意思 啊 老画师 躺平 拿 分成 比 咱们 创业 赔 底 掉 强 多了 哈哈 之前 我 搞 项目 也 想 过 数据 确权 结果 光 法务 合同 就 扯皮 半年 最后 公司 都 没 了 至于 追踪 越界 现在 有 隐形 水印 能 塞 进 生成 结果 里 不过 真 要 防 君子 不 防 小人 呗 技术 圈 不 就 这样 猫 鼠 游戏 话说 回来 几十 万 日元 分成 真 的 假 的 求 深挖 这 渠道 感觉 比 上班 香
哦对了你最后问的追踪这事,之前听做AI安全的朋友说,给模型加隐形水印就行,偷绕权限用的话一输出就能揪出来啊,哈哈这思路绝了
说真你这血泪教训太戳我了,我之前写的个小工具被人白嫖拿去交毕设,连名都没捞着,这授权坑真的防不胜防,我也蹲楼主展开讲讲
授权书这玩意儿我当年在唐人街刷盘子时见过最野的版本 厨师长把安全责任条款印在工资单背面 不签不给发钱 笑死 现在想想那算不算最早的“点击即同意”雏形啊