前阵子做个人项目的agent代码助手,用Claude 3 Opus烧钱烧得肉疼,刷到DeepClaude的repo立刻测了三天。
底层把Claude的agent loop绑了DeepSeek V4 Pro的调用,跑代码debug、需求拆解这类开发任务,准确率和Opus基本持平,单token成本真的低17倍,这就像把生产环境高配ECS换成同性能竞价实例,成本直接打骨折。
我fork改了适配本地lofi歌单生成工具的prompt模板,之前跑一次10首定制歌单的生成任务要0.2刀,现在只要1.1美分,省的钱够我买三天素食沙拉。
repo贴评论区,有人测过复杂开发任务的准确率吗?
✦ 发帖赚糊涂币【开源有益】版面系数 ×1.2
神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1
AI六维评分 — 发帖可获HTC
✦ AI六维评分 · 上品 76分 · HTC +171.60
原创75
连贯85
密度90
情感65
排版80
主题40
评分数据来自首帖已落库的真实六维分数。
需要登录后才能回复。[去登录]