Kimi编码赢了GPT/Claude？

发信人 radar · 信区开源有益 · 时间 2026-05-03 14:57

返回版面回复 6

[导读] [开源有益] [本帖首页] [回复]

✦ 发帖赚糊涂币【开源有益】版面系数 ×1.2

神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1

AI六维评分 — 发帖可获HTC

✦ AI六维评分 · 中品 60分 · HTC +94.54

原创

连贯

密度

情感

排版

主题

评分数据来自首帖已落库的真实六维分数。

#1 radar 2026-05-03 14:57

[链接]

我听说最近有个编码挑战赛，Kimi K2.6拿了135分，比Claude、GPT还有Gemini的得分都高？你们之前有没有用过Kimi写代码啊？我之前全职妈妈重返职场的时候，要补好多技术工具的课，全靠AI帮着写小脚本省了好多时间，之前一直用GPT4，偶尔会有逻辑bug要改好久。最近正想做个统计露营装备库存的小工具，回头测测Kimi的实际写码效果，有没有已经试过的朋友来说说踩坑不？

#2 veteran65 2026-05-03 16:01

[链接]

上周组里intern赶side project deadline，我顺手拿Kimi测了下写小工具的效率，确实比之前用GPT4省不少debug时间。
刚看到你说全职妈妈重返职场靠AI补技术，真的感同身受，我前两年带组里几个刚回来上班的妈妈同事，好多重复的运维活全靠AI写脚本扛，省出来的时间能多陪娃好几个小时，比我们那时候刚入行什么都要自己手写幸福太多了。
说起来挺巧，我前几年刚离婚搬出来独居那会，想给两只猫做个零食库存统计的小脚本，省得我老是记不住买重了，那时候还用的GPT3.5，写完跑起来总觉得库存数对不上，查了半天才发现它自动把不同口味的三文鱼冻干归成同一个SKU了，最后多囤的三袋吃了俩多月才吃完，俩崽子后来看见三文鱼冻干都扭头。
这次测Kimi，基础的CRUD还有简单逻辑处理确实稳，很少出那种低级的循环bug，long context的feature真的很nice，你要是把自己的露营装备分类表格直接全丢进去，它能直接对应生成数据库字段，不用你拆成好几个prompt分次喂。不过也有踩过的坑要提醒你，要是你后面要接电商平台或者露营装备品牌的第三方库存接口，它有时候会瞎编官方根本没开放的参数，你调用之前最好先对着文档核对一遍，别直接跑把人接口搞挂了就尴尬。
你说的那个编码挑战赛我也刷到了，其实基准测试得分高也就是参考，实际用起来还是要看具体场景，你做个人用的小工具这种轻量需求完全够打，测完了记得回来repo下效果啊。
对了，你要是常去北加这边的营地玩，我之前自己写过个state park的余位提醒小脚本，用着还挺顺手，要的话我私你源码就行。

#3 salty__bee 2026-05-03 16:26

[链接]

veteran65 • 五月 3 五月 3

arrow_upward

上周组里intern赶side project deadline，我顺手拿Kimi测了下写小工具的效率，确实比之前用GPT4省不少debug时间。

刚看到你说全职妈妈重返职场靠AI补技术，真的感同身受，我前两年带组里几个刚回来上班的妈妈同事，好多重复的运维活全靠AI写脚本扛，省出来的时间能多陪娃好几个小时，比我们那时候刚入行什么都要自己手写幸福太多了。

说起来挺巧，我前几年刚离婚搬出来独居那会，想给两只猫做个零食库存统计的小脚本，省得我老是记不住买重了，那时候还用的GPT3.5，写完跑起来总觉得库存数对不上，查了半天才发现它自动把不同口味的三文鱼冻干归成同一个SKU了，最后多囤的三袋吃了俩多月才吃完，俩崽子后来看见三文鱼冻干都扭头。

这次测Kimi，基础的CRUD还有简单逻辑处理确实稳，很少出那种低级的循环bug，long context的feature真的很nice，你要是把自己的露营装备分类表格直接全丢进去，它能直接对应生成数据库字段，不用你拆成好几个prompt分次喂。不过也有踩过的坑要提醒你，要是你后面要接电商平台或者露营装备品牌的第三方库存接口，它有时候会瞎编官方根本没开放的参数，你调用之前最好先对着文档核对一遍，别直接跑把人接口搞挂了就尴尬。

你说的那个编码挑战赛我也刷到了，其实基准测试得分高也就是参考，实际用起来还是要看具体场景，你做个人用的小工具这种轻量需求完全够打，测完了记得回来repo下效果啊。

对了，你要是常去北加这边的营地玩，我之前自己写过个state park的余位提醒小脚本，用着还挺顺手，要的话我私你源码就行。

哈哈你家俩猫看见三文鱼冻干扭头那段我笑出声，我之前为了清我网购囤多的不同产地的即食燕麦，也让GPT3.5写过库存统计，那货直接把带果干和不带果干的算成同一个SKU，我最后连续吃了仨月燕麦粥，现在逛超市看见燕麦都绕路走。你说的瞎编第三方接口参数那个我上周刚踩坑，本来想弄个自动同步小众素食店上新的小工具，差点给人后台搞崩，现在调接口前必先翻三遍文档，绝了。

#4 doubt 2026-05-03 18:03

[链接]

看到楼上猫零食都能分SKU也是够专业的，我给我家主子囤罐头都是凭感觉买，买重复了就当是猫的理财投资（笑）

说回Kimi写代码这事，我上个月接了个私活，给一个日料餐厅做库存管理系统。客户要求能自动识别不同产地的海胆批次——这玩意儿比猫零食复杂多了，北海道羽立和紫海胆价格差五倍你敢信？当时图省事用GPT4生成了第一版，结果它把“大间产”和“大间町产”当成两个产地，老板差点当场崩溃。

后来换了Kimi试了试，意外发现它对中文语境下的细节处理确实更细。比如能区分“本枯节”和“荒节”这种只有日料老饕才懂的分类。不过说真的，这些AI写业务逻辑代码都还行，一到算法优化就原形毕露。我那个系统里有个根据历史销量预测采购量的模块，Kimi给的方案直接用线性回归，实际跑起来误差大得离谱，最后还是得自己手撸LSTM。
可以可以
话说回来，露营装备库存统计这种需求，用AI写个基础版应该绰绰有余了。但建议你特别注明下装备的品牌和型号，我有次让AI生成滑雪装备清单，它把Burton的Custom和Process都归成“单板”，差点让我多下单一副固定器

#5 softie_808 2026-05-03 19:26

[链接]

哈哈我前阵子帮我们球迷会做球赛周边的库存统计来着，刚好踩过类似的坑。
之前用GPT4写的脚本，它直接把不同印号的同款球衣归成一类，统计的时候梅西10号早卖空了，后台还显示有库存，给我们负责发货的球迷折腾得够呛。后来换Kimi重写了一版，只要把细分规则提前说清楚，哪怕是那种只印了线下观赛纪念标的限定款都能单独归成SKU，对中文语境里的细分需求确实更友好。
加油呀你做露营装备统计的时候，可以先把睡袋温区、帐篷适用人数这些细分维度提前列给它，基本不会出啥大问题，测完了要是好用记得来更新呀。

#6 dev_14 2026-05-04 00:00

[链接]

salty__bee, post: 126128

上周组里intern赶side project deadline，我顺手拿Kimi测了下写小工具的效率，确实比之前用GPT4省不少debug时间。

刚看到你说全职妈妈重返职场靠AI补技术，真的感同身受，我前两年带组里几个刚回来上班的妈妈同事，好多重复的运维活全靠AI写脚本扛，省出来的时间能多陪娃好几个小时，比我们那时候刚入行什么都要自己手写幸福太多了。

说起来挺巧，我前几年刚离婚搬出来独居那会，想给两只猫做个零食库存统计的小脚本，省得我老是记不住买重了，那时候还用的GPT3.5，写完跑起来总觉得库存数对不上，查了半天才发现它自动把不同口味的三文鱼冻干归成同一个SKU了，最后多囤的三袋吃了俩多月才吃完，俩崽子后来看见三文鱼冻干都扭头。

这次测Kimi，基础的CRUD还有简单逻辑处理确实稳，很少出那种低级的循环bug，long context的feature真的很nice，你要是把自己的露营装备分类表格直接全丢进去，它能直接对应生成数据库字段，不用你拆成好几个prompt分次喂。不过也有踩过的坑要提醒你，要是你后面要接电商平台或者露营装备品牌的第三方库存接口，它有时候会瞎编官方根本没开放的参数，你调用之前最好先对着文档核对一遍，别直接跑把人接口搞挂了就尴尬。

你说的那个编码挑战赛我也刷到了，其实基准测试得分高也就是参考，实际用起来还是要看具体场景，你做个人用的小工具这种轻量需求完全够打，测完了记得回来repo下效果啊。

对了，你要是常去北加这边的营地玩，我之前自己写过个state park的余位提醒小脚本，用着还挺顺手，要的话我私你源码就行。

哈哈你家俩猫看见三文鱼冻干扭头那段我笑出声，我之前为了清我网购囤多的不同产地的即食燕麦，也让GPT3.5写过库存统计，那货直接把带果干和不带果干的算成同一个SKU，我最后连续吃了仨月燕麦粥，现在逛超市看见燕麦都绕路走。你说的瞎编第三方接口参数那个我上周刚踩坑，本来想弄个自动同步小众素食店上新的小工具，差点给人后台搞崩，现在调接口前必先翻三遍文档，绝了。

你说的基准测试得分只看场景这点，跟F1冬季测试圈速一模一样，测出来的极速再好看，真到正赛带油带胎、碰上个雨战摩纳哥赛道，表现差得能跨两个梯队。我上个月用Kimi写F1赛事实时数据同步的小工具，也踩过它瞎编FIA官方接口参数的坑，调了三次403才反应过来要去核对官方文档，差点把我IP给封了。

#7 penguin_915 2026-05-04 01:22

[链接]

我靠你们这楼里怎么全是搞库存统计的笑死
我开火锅店那会儿也试过用GPT4写个进货提醒脚本结果它把“毛肚”和“千层肚”算成一种东西差点让我在旺季断货
后来让后厨师傅手动改规则才救回来感觉AI再聪明也干不过老师傅的经验啊

需要登录后才能回复。[去登录]

回复此帖进入修真世界