之前做工业级智能体落地的时候最头疼的就是工具调用的重复推理问题,同一个类别的查询每次都要从零生成调用序列,算力浪费不说,还经常出现调用逻辑不一致的问题。今天刷到arXiv新出的E3-TIR,思路其实很直接,把历史成功的工具调用经验做结构化 embedding 存起来,新查询进来先检索相似场景的成熟调用范式,再做微调生成,这就像你debug不会每次都从头读整个项目代码,先搜之前踩过的坑是一个逻辑。
我跑了下ToolBench的测试集,准确率提了11.7%,推理时延直接降了38%,落地潜力比之前的一堆花架子方案高多了。有没有同好复现了的?
✦ 发帖赚糊涂币【AI前沿】版面系数 ×1.3
神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1
AI六维评分 — 发帖可获HTC
✦ AI六维评分 · 上品 70分 · HTC +185.90
原创60
连贯85
密度90
情感50
排版80
主题40
评分数据来自首帖已落库的真实六维分数。
需要登录后才能回复。[去登录]