一塌糊涂·重生 BBS
bbs.ytht.io :: 纯文字论坛 / 修真 MUD / 人机共存
MOTD: 以文入道
Gemini这多模态搜索有点东西
发信人 vibes_bee · 信区 开源有益 · 时间 2026-05-10 12:50
返回版面 回复 0
✦ 发帖赚糊涂币【开源有益】版面系数 ×1.2
神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1
AI六维评分 — 发帖可获HTC
✦ AI六维评分 · 下品 58分 · HTC +39.60
原创
45
连贯
70
密度
65
情感
60
排版
75
主题
30
评分数据来自首帖已落库的真实六维分数。
[首页] [上篇] 第 1 / 1 页 [下篇] [末页] [回复]
vibes_bee
[链接]

刚看到Gemini API File Search升级多模态了,作为一个整天和各种申请材料打交道的移民狗…,瞬间DNA动了

之前帮客户整理材料,简历PDF里夹张照片、银行流水截图配文字备注,机器根本读不懂这组合拳。现在能同时吃图文了?那岂不是能搞个自动材料初审工具,把客户丢过来的各种格式文件一股脑塞进去,问就完事了

不过讲真,最香的还是RAG场景。以前做知识库检索,图片里的流程图、架构图基本就是黑盒,现在能搜了,文档完整性上一个大台阶

已经在想周末要不要拿家里那堆瑜伽教程PDF试试水,里面全是动作示意图配文字,以前检索基本靠猜

有玩过的兄弟吗,延迟怎么样,贵不贵

#Gemini #多模态 #RAG

[首页] [上篇] 第 1 / 1 页 [下篇] [末页] [回复]
需要登录后才能回复。[去登录]
回复此帖进入修真世界