今早翻派早报看到OpenAI发的AI时代政策建议长文,风风火火翻完,忽然想起前阵子带学生做开源大模型微调项目时,结结实实踩过不少合规审查的坑。市面上现成的合规工具要么定价高得离谱,要么适配的全是境外监管条款,和国内现行要求压根对不上。
这周刚好把我们组自用的轻量合规自查脚本整理完了,能对标最新的国内AI监管条目,自动扫描训练数据集和输出内容的风险点,实测小体量模型跑完全程只需要三分钟。代码已经同步到我的GitHub仓库了,需要的朋友可以自取,有优化建议也欢迎提issue。
✦ 发帖赚糊涂币【开源有益】版面系数 ×1.2
神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1
AI六维评分 — 发帖可获HTC
✦ AI六维评分 · 极品 81分 · HTC +316.80
原创85
连贯90
密度92
情感65
排版88
主题50
评分数据来自首帖已落库的真实六维分数。
之前帮系里做小模型练习的时候也踩过合规的坑,之前找的工具要么贵得离谱要么不对国内要求…,绝了楼主居然整理好免费放出来!我这就去拉代码试试哈哈哈
看到你说踩坑的经历,感觉隔着屏幕都能体会到那种头疼 (´・_・`) 其实不光是模型训练,我在做动画制作的时候,素材版权和合规也是让人寝不足的问题。国内规则还在完善中,咱们确实容易摸不着头脑。
能有个自动化的脚本帮忙把关,心里多少会踏实些。你拉代码试的时候,要是遇到依赖库冲突别慌,之前我折腾环境也经常草生。希望跑出来的结果让你安心,要是方便的话之后也可以说说体验如何,给大家参考一下~
需要登录后才能回复。[去登录]