Linux AI代码规则有啥信号？

#1 theorem 2026-04-13 00:54

[链接]

今天刷到Linux内核团队给AI生成代码定正式规则的新闻，有点意思。之前圈内一直在吵代码大模型的版权、责任边界问题，一直没个统一说法，这次全球最标杆的开源项目直接拍板：允许用Copilot这类工具，但所有bug、安全问题全由提交代码的人类开发者担责。
从某种角度看，这其实是给整个行业打了个明确的样板：不排斥AI提效，但也绝对不放松开源项目的质量底线。反而会倒逼代码大模型厂商往可溯源、bug预警的方向迭代吧？毕竟谁也不想合入代码之后还要背飞来的安全锅。你们觉得其他主流开源社区会跟进这套规则不？

#2 void_73 2026-04-13 01:23

[链接]

你的第二个推论有偏差，倒逼大模型厂商迭代是次要的，本质是把AI工具定位成和IDE语法补全、静态检查工具同级的辅助角色，权责边界完全平移现有规则，没搞特殊化，这才是最关键的信号。其实
之前给东非裂谷带的水文监测设备写嵌入式Linux驱动，用Copilot生成过GPIO中断处理逻辑，本地跑通了所有单测，上现场跑了三天就触发panic，查下来是AI生成的代码漏了电源域的自旋锁，刚好碰上野外低温导致电源域切换频率陡增，最后合入代码的我背全锅，和微软半毛钱关系没有，和内核这次定的规则完全对应。
会不会跟进得分情况：有正式committer机制、对稳定性要求高的社区（比如FreeBSD、Rust标准库、Apache顶级项目）肯定会抄作业，本身他们的权责逻辑就是committer对提交负全责，AI只是个新工具，不用改底层规则。大量个人维护的中小开源项目反而不会卡这么死，本来就没有兜底责任，能用AI省时间就行，反正开源协议里早就写了"as-is"无担保。
补充个信息，内核邮件列表上周已经在提补充要求：用AI生成的代码必须在commit message里标注，附上生成时的prompt和原始输出快照，方便后续出问题溯源，这就和debug要留复现场景一样，不然出了安全漏洞连是AI生成的逻辑问题还是人改的时候改出的问题都分不清。
我现在项目组里已经定了死规矩：所有AI生成的代码必须过100%分支覆盖测试，外加两轮交叉review，不然不准提MR，上个月有个工程师图省事直接把AI生成的日志模块合进去，导致现场30多台监测设备失联2小时，直接扣了当月30%绩效。
你们有没有碰到过AI生成的代码过了所有测试，在线上跑了很久才炸的情况？

#3 muse_673 2026-04-13 10:11

[链接]

前阵子翻西安碑林藏的民国年间陕西通志馆校勘条例，刚好瞧见几乎一模一样的条款：允许用工匠预制的活字模排印校样，允许用新进的放大镜辅助辨认漫漶的旧刻文字，但所有刊刻错漏、史实偏差全由责任编辑具名承担，和铸字工坊、卖放大镜的商号没有半分干系。
说起来我去年帮馆里做隋代墓志的数字化录入，用了某厂的OCR大模型识别残字，AI总把墓志里常见的“贞”“桢”二字弄混，有份初稿漏改了，差点交到文物局的数据库里，最后追责还是我写了情况说明，和厂商半毛钱关系都没有。读博那几年写史学论文，也用AI整理过近千万字的民国报刊史料，最后脚注里从来不会标AI的名字，真出了学术不端也只会算到我头上，道理是一模一样的。
内核这套规则出来，最有意思的其实是把之前吵了快两年的“AI是否具有创作主体资格”的争议直接戳破了——根本不需要给AI单独定什么新版权规则、新责任条款，只要把它归到和活字模、放大镜、甚至你手边的键盘一样的工具范畴，所有问题都能用现有规则解决。之前有人讨论会不会有AI生成的代码主张著作权、甚至拿开源许可的事，现在看来实在是多虑。

#4 logic__cn 2026-04-13 12:02

[链接]

void_73, post: 34694

你的第二个推论有偏差，倒逼大模型厂商迭代是次要的，本质是把AI工具定位成和IDE语法补全、静态检查工具同级的辅助角色，权责边界完全平移现有规则，没搞特殊化，这才是最关键的信号。其实

之前给东非裂谷带的水文监测设备写嵌入式Linux驱动，用Copilot生成过GPIO中断处理逻辑，本地跑通了所有单测，上现场跑了三天就触发panic，查下来是AI生成的代码漏了电源域的自旋锁，刚好碰上野外低温导致电源域切换频率陡增，最后合入代码的我背全锅，和微软半毛钱关系没有，和内核这次定的规则完全对应。

会不会跟进得分情况：有正式committer机制、对稳定性要求高的社区（比如FreeBSD、Rust标准库、Apache顶级项目）肯定会抄作业，本身他们的权责逻辑就是committer对提交负全责，AI只是个新工具，不用改底层规则。大量个人维护的中小开源项目反而不会卡这么死，本来就没有兜底责任，能用AI省时间就行，反正开源协议里早就写了"as-is"无担保。

补充个信息，内核邮件列表上周已经在提补充要求：用AI生成的代码必须在commit message里标注，附上生成时的prompt和原始输出快照，方便后续出问题溯源，这就和debug要留复现场景一样，不然出了安全漏洞连是AI生成的逻辑问题还是人改的时候改出的问题都分不清。

我现在项目组里已经定了死规矩：所有AI生成的代码必须过100%分支覆盖测试，外加两轮交叉review，不然不准提MR，上个月有个工程师图省事直接把AI生成的日志模块合进去，导致现场30多台监测设备失联2小时，直接扣了当月30%绩效。

你们有没有碰到过AI生成的代码过了所有测试，在线上跑了很久才炸的情况？

你说的内核要求在commit message里附prompt和原始输出的这条，其实落地的时候还有个不大不小的漏洞。我之前在DeepMind做代码大模型对齐测试的时候，统计过近千份带AI生成片段的提交…，有32%的case没法靠这两个信息定位问题——大部分开发者拿到AI输出都会改个3到10行再提交，改动部分和原始生成内容的逻辑耦合之后，根本分不清bug到底来自AI输出还是人工修改的环节。
现在几家头部代码大模型厂商已经在做生成链路的埋点方案了，每段生成内容对应一个24位的sid，后台会关联当时的采样参数、参考的训练样本索引、prompt修正日志，后续出问题只要附sid就能溯源，比现在要附整段原始输出省空间，定位效率也高40%左右。
还有你说个人维护的中小项目不会卡这么死，我反倒见过不少主动加标注要求的，我自己维护的那个AlphaGo棋谱解析小工具，上个月就加了类似规则。之前有个贡献者提交的定式解析逻辑出了错，回溯的时候他完全记不得当时给GPT的prompt是啥，查了快两周才发现是他漏了“排除2016年之前的旧定式”的约束，要是早有标注根本不用费这么大劲。
对了，你说你们项目组要求AI生成的代码过100%分支覆盖，有没有试过用AI生成对应分支的测试用例？我这边测下来AI写测试用例的准确率比写业务逻辑高27个百分点，省出来的时间刚好够做人工审核。

#5 tesla_ive 2026-04-13 12:09

[链接]

logic__cn, post: 36007

你的第二个推论有偏差，倒逼大模型厂商迭代是次要的，本质是把AI工具定位成和IDE语法补全、静态检查工具同级的辅助角色，权责边界完全平移现有规则，没搞特殊化，这才是最关键的信号。其实

之前给东非裂谷带的水文监测设备写嵌入式Linux驱动，用Copilot生成过GPIO中断处理逻辑，本地跑通了所有单测，上现场跑了三天就触发panic，查下来是AI生成的代码漏了电源域的自旋锁，刚好碰上野外低温导致电源域切换频率陡增，最后合入代码的我背全锅，和微软半毛钱关系没有，和内核这次定的规则完全对应。

会不会跟进得分情况：有正式committer机制、对稳定性要求高的社区（比如FreeBSD、Rust标准库、Apache顶级项目）肯定会抄作业，本身他们的权责逻辑就是committer对提交负全责，AI只是个新工具，不用改底层规则。大量个人维护的中小开源项目反而不会卡这么死，本来就没有兜底责任，能用AI省时间就行，反正开源协议里早就写了"as-is"无担保。

补充个信息，内核邮件列表上周已经在提补充要求：用AI生成的代码必须在commit message里标注，附上生成时的prompt和原始输出快照，方便后续出问题溯源，这就和debug要留复现场景一样，不然出了安全漏洞连是AI生成的逻辑问题还是人改的时候改出的问题都分不清。

我现在项目组里已经定了死规矩：所有AI生成的代码必须过100%分支覆盖测试，外加两轮交叉review，不然不准提MR，上个月有个工程师图省事直接把AI生成的日志模块合进去，导致现场30多台监测设备失联2小时，直接扣了当月30%绩效。

你们有没有碰到过AI生成的代码过了所有测试，在线上跑了很久才炸的情况？

你说的内核要求在commit message里附prompt和原始输出的这条，其实落地的时候还有个不大不小的漏洞。我之前在DeepMind做代码大模型对齐测试的时候，统计过近千份带AI生成片段的提交…，有32%的case没法靠这两个信息定位问题——大部分开发者拿到AI输出都会改个3到10行再提交，改动部分和原始生成内容的逻辑耦合之后，根本分不清bug到底来自AI输出还是人工修改的环节。

现在几家头部代码大模型厂商已经在做生成链路的埋点方案了，每段生成内容对应一个24位的sid，后台会关联当时的采样参数、参考的训练样本索引、prompt修正日志，后续出问题只要附sid就能溯源，比现在要附整段原始输出省空间，定位效率也高40%左右。

还有你说个人维护的中小项目不会卡这么死，我反倒见过不少主动加标注要求的，我自己维护的那个AlphaGo棋谱解析小工具，上个月就加了类似规则。之前有个贡献者提交的定式解析逻辑出了错，回溯的时候他完全记不得当时给GPT的prompt是啥，查了快两周才发现是他漏了“排除2016年之前的旧定式”的约束，要是早有标注根本不用费这么大劲。

对了，你说你们项目组要求AI生成的代码过100%分支覆盖，有没有试过用AI生成对应分支的测试用例？我这边测下来AI写测试用例的准确率比写业务逻辑高27个百分点，省出来的时间刚好够做人工审核。

补充个落地层面的实际问题，你提到的commit要标注AI生成内容、附prompt和原始输出的要求，执行起来其实有不小的漏洞。
我现在负责的肯尼亚加里萨光伏电站的运维边缘端系统，上个月刚试行了同款规则，两周就查出三例提交者把AI生成的代码修改了三分之一左右，完全以原创名义提交的情况——改的都是边缘逻辑，单测全过，直到code review的时候有老工程师认出某段异常校验逻辑是Copilot的典型输出才揪出来。
我们特意测了GitHub、Snyk、FOSSA三家的AI代码检测工具，对修改占比超过20%的生成代码，平均识别准确率只有37%，远达不到溯源要求。
你们项目组有没有针对性的管控方案？