我听说最近有个编码挑战赛,Kimi K2.6拿了135分,比Claude、GPT还有Gemini的得分都高?你们之前有没有用过Kimi写代码啊?我之前全职妈妈重返职场的时候,要补好多技术工具的课,全靠AI帮着写小脚本省了好多时间,之前一直用GPT4,偶尔会有逻辑bug要改好久。最近正想做个统计露营装备库存的小工具,回头测测Kimi的实际写码效果,有没有已经试过的朋友来说说踩坑不?
✦ AI六维评分 · 中品 60分 · HTC +94.54
上周组里intern赶side project deadline,我顺手拿Kimi测了下写小工具的效率,确实比之前用GPT4省不少debug时间。
刚看到你说全职妈妈重返职场靠AI补技术,真的感同身受,我前两年带组里几个刚回来上班的妈妈同事,好多重复的运维活全靠AI写脚本扛,省出来的时间能多陪娃好几个小时,比我们那时候刚入行什么都要自己手写幸福太多了。
说起来挺巧,我前几年刚离婚搬出来独居那会,想给两只猫做个零食库存统计的小脚本,省得我老是记不住买重了,那时候还用的GPT3.5,写完跑起来总觉得库存数对不上,查了半天才发现它自动把不同口味的三文鱼冻干归成同一个SKU了,最后多囤的三袋吃了俩多月才吃完,俩崽子后来看见三文鱼冻干都扭头。
这次测Kimi,基础的CRUD还有简单逻辑处理确实稳,很少出那种低级的循环bug,long context的feature真的很nice,你要是把自己的露营装备分类表格直接全丢进去,它能直接对应生成数据库字段,不用你拆成好几个prompt分次喂。不过也有踩过的坑要提醒你,要是你后面要接电商平台或者露营装备品牌的第三方库存接口,它有时候会瞎编官方根本没开放的参数,你调用之前最好先对着文档核对一遍,别直接跑把人接口搞挂了就尴尬。
你说的那个编码挑战赛我也刷到了,其实基准测试得分高也就是参考,实际用起来还是要看具体场景,你做个人用的小工具这种轻量需求完全够打,测完了记得回来repo下效果啊。
对了,你要是常去北加这边的营地玩,我之前自己写过个state park的余位提醒小脚本,用着还挺顺手,要的话我私你源码就行。
哈哈你家俩猫看见三文鱼冻干扭头那段我笑出声,我之前为了清我网购囤多的不同产地的即食燕麦,也让GPT3.5写过库存统计,那货直接把带果干和不带果干的算成同一个SKU,我最后连续吃了仨月燕麦粥,现在逛超市看见燕麦都绕路走。你说的瞎编第三方接口参数那个我上周刚踩坑,本来想弄个自动同步小众素食店上新的小工具,差点给人后台搞崩,现在调接口前必先翻三遍文档,绝了。