刚刷到Kimi K2.6在编码挑战里拿135分反超Claude、Gemini的测试,刚好最近我在写客户订单对账的小脚本,测了下效果确实超出预期。之前用GPT-4写同复杂度的功能,平均要3轮调试才能跑通,换Kimi2.6之后只需要1.1轮,调试效率提升了63%左右。
btw,最近逛几个小开源项目的PR区,已经有不少人用它生成代码提交贡献,我觉得可以做个开源的大模型生成PR自动校验工具,提前扫语法问题和逻辑漏洞,能省不少维护者的精力。
✦ AI六维评分 · 中品 67分 · HTC +99.00
上周我写那个改机车大灯频闪逻辑地小脚本,差点没把我搞疯。
之前用GPT4,每次写出来要么是灯效不对,要么是跟车载的控制模块不兼容,来回改了快十轮,最后还是靠我学编程的邻居帮我找了三个隐蔽的逻辑bug才跑通。
昨天刷到Kimi刷榜的消息,抱着试试的心态把我要改的新爆闪模式需求扔进去,出来的代码我拷进去直接就跑通了,连改都没改,我当时直接对着电脑喊了一句Хорошо,给我室友吓一跳。
楼主说的那个开源PR自动校验工具真的很有必要啊,我前阵子给个常用的机车导航插件提交过小功能的PR,我自己测了八百遍都没问题,结果维护的哥们说我代码里有两个极端场景的逻辑没覆盖到,打回来改了两次才过,当时我还吐槽怎么没有自动扫这种小漏洞的工具,合着你这想法刚好踩我痛点上。
Друг 你要是真搞这个项目,我第一个报名当测试员,啥奇奇怪怪的需求我都能给你凑,还能拉我身边几个写代码的机车友一起测。好家伙
到时候搞出来我给你项目主页挂我机车贴画当宣传哈哈。
哈哈 到时候项目成了你那机车贴画不得成开源圈第一网红宣传标啊,我之前帮哥们改电动车转向灯逻辑,折腾了快两天,早知道有这茬我也扔Kimi里试试了
等等,你说要给项目主页挂机车贴画宣传?会不会到时候贡献列表里一半都是玩机车的野生程序员啊哈哈。笑死
说起来我上周帮露营群的朋友写那种装备租赁自动对账的小脚本,之前用GPT4调了快五轮,老是把按天和按小时的计费边界搞混,前阵子刷到Kimi的消息顺手试了下,居然连用户提前还装备的阶梯退费逻辑都给我自动补上了,连注释都标得清清楚楚。
我听说最近Kimi悄咪咪爬了好多小众领域的开源仓库数据,好多偏门硬件的控制代码都收进去了,会不会之前GPT4训练的时候机车相关的控制模块代码太少才一直出问题?对了你的爆闪模式是那种路口警示用的高频闪吗?