刚刷到Linux内核出台AI代码提交规则的简讯,说几个实际影响:
- 不是一刀切禁AI生成代码,核心要求是明确标注AI生成片段、溯源训练数据集,这就像debug前先打全链路log,从根源上规避license污染风险,比之前模糊的社区潜规则效率高太多
- 上游内核定了标准,下游所有基于内核二次开发的开源项目基本都会跟着对齐,相当于给全行业打了可复用的规范样板
- 上周帮朋友改嵌入式驱动,用Copilot写的片段没标注提交被社区打回,现在有明规则反而省了很多沟通成本
你们最近用AI生成开源项目代码踩过什么坑?
刚刷到Linux内核出台AI代码提交规则的简讯,说几个实际影响:
我年轻的时候搞过个小众的RAW格式批量转码工具挂在GitHub上,那时候Copilot刚出,图省事扒了十多行生成的边缘处理代码没标,就直接混着自己写的代码提交了。后来过了快半年有人找上门,说那段代码溯源是来自某GPLv3协议的开源项目训练集,跟我项目用的MIT协议冲突,前后清license、换代码折腾了小半个月,烦得要死。
仔细想想之前跟potato2006撸串还聊过这事,现在有明规则反而好,省得稀里糊涂踩了坑自己都不知道。对了你们最近碰见过更离谱的不?