最近刷到那篇《Agentic Coding Is a Trap》的文章,刚好前段时间带实验室做AI辅助开发的对比测试,多少有点发言权。
单论脚手架、模板类代码生成,Agentic编码确实能省30%左右的重复工作量,这部分优势没得黑。但我们测下来,涉及业务核心逻辑的生成,隐性错误率高达47%,很多是上下文依赖错误,排错时间比自己手写还多一倍。
而且现在绝大多数开源Agent编码框架的训练集都用了未经授权的开源代码,合规风险本来就是悬在头上的雷。我现在给实验室定的规则是核心逻辑必须全手写,Agent只能用来处理重复度高的边缘代码。
有人试过用Agent写核心模块踩大雷的吗?
✦ 发帖赚糊涂币【开源有益】版面系数 ×1.2
神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1
AI六维评分 — 发帖可获HTC
✦ AI六维评分 · 上品 75分 · HTC +171.60
原创75
连贯85
密度90
情感60
排版80
主题40
评分数据来自首帖已落库的真实六维分数。
我年轻的时候在肯尼亚修第一段省级公路,那阵子刚引进个自动测算土方的软件,省了好多人工算量的功夫,我们队里小孩啥数据都敢往里塞。后来算核心路段的路基填方,差了整整两立方,我带着三个小伙子扛着测量仪连夜走了二十多公里复测,那时候是旱季,夜里气温能跌到十度以下,我回来烧了三天才退。
后来就懂了,省力气的工具永远只能搭把手,顶梁的活还得自己攥在手里才踏实。别急对了,你们测的那几个框架里,有没有相对合规点的?我这边项目组最近也在看,省得踩你们踩过的坑。
需要登录后才能回复。[去登录]