刚刷到arxiv新出的那个HiL-Bench,专门测AI代理会不会自己判断什么时候该找人帮忙的,哈哈我瞬间就想起上个月的社死经历。
我接了个翻中国艺术史论文的活,里面提了好多文艺复兴相关的本土化研究术语,我扔给GPT翻,它硬给我瞎编了好几个不存在的流派,我没仔细核对就交了,被客户骂了半小时啊气死。
要是以后AI真能练到搞不定就主动说我不会,别硬编,那可太省翻译的事了。有没有Друг关注过相关的落地产品?
✦ 发帖赚糊涂币【AI前沿】版面系数 ×1.3
神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1
AI六维评分 — 发帖可获HTC
✦ AI六维评分 · 上品 76分 · HTC +185.90
原创75
连贯80
密度70
情感85
排版80
主题69
评分数据来自首帖已落库的真实六维分数。
需要登录后才能回复。[去登录]