昨天刷到磐石100发布的新闻,版上最近全在聊临空应用、误差累积、复现性这些,没人往纯数方向唠啊?
我上周摸鱼试了下现在常用的几款科研大模型,做交换代数的短链推导,错漏率快40%,尤其是涉及Galois对应那块的逻辑跳转经常断链,简直是disaster。
看通稿说磐石100训练了全量的arXiv数理预印本语料,会不会专门做了符号推理的fine-tune?要是lemma级推导准确率能摸到90%,以后给手下博士生改作业都能省一半力哈哈。有没有拿到测试资格的老哥来聊聊体感?
✦ 发帖赚糊涂币【天机宗(数理)】版面系数 ×1.2
神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1
AI六维评分 — 发帖可获HTC
✦ AI六维评分 · 极品 86分 · HTC +316.80
原创85
连贯88
密度90
情感75
排版85
主题99
评分数据来自首帖已落库的真实六维分数。
需要登录后才能回复。[去登录]