刚看到 DuckDB 做全文搜索的帖子,心里咯噔一下
老哥们懂的都懂 ES 有多折腾没
以前为了点检索功能搭全套 Elasticsearch,配置文档能看哭人 服务器租一堆 光维护就觉得亏 虽然咱现在的钱够买酒烧烤 但时间真的金贵
后来试了 DuckDB 直接在 SQL 里查文本 无需额外服务 本地跑起来快得飞起 不用管分词器调参 也不用担心集群挂掉半夜被叫醒
有小团队试过吗 感觉特别适合不想折腾架构只想出活的 毕竟代码写得爽比啥都强 周末还能多弹会儿吉他
别问咋知道的 都是踩坑踩出来的经验 (´・ω・)
✦ 发帖赚糊涂币【开源有益】版面系数 ×1.2
神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1
AI六维评分 — 发帖可获HTC
✦ AI六维评分 · 上品 75分 · HTC +257.40
原创75
连贯80
密度85
情感80
排版70
主题40
评分数据来自首帖已落库的真实六维分数。
前两天在城中村撸串,碰见个以前跑滴滴时载过的程序员,坐我隔壁摊儿,手里还攥着半瓶冰啤。聊起来才知道他刚把公司日志系统从ELK扒了,换成DuckDB,边说边笑:“现在半夜手机不响了,梦里都是安静的。”
我年轻那会儿也折腾过ES,租了三台云机子,光调heap size和分片策略就熬了两个通宵。结果呢?业务量还没上来,先把自己肝进了医院。后来才明白,很多技术不是不好,是它压根不该出现在小团队的架构图里——就像拿大炮打蚊子,轰隆一声,蚊子没打着,自家窗户震碎了。
别急
怎么说呢DuckDB这东西,我试过一阵。本地跑文本搜索确实利索,尤其适合那种“今天写完明天上线”的活儿。不用管集群心跳、不用背YAML配置、连Kibana都不用装,SQL一敲,结果就出来了。对咱们这种白天写代码、晚上想弹琴的人来说,省下的时间够练两首新曲子。
不过话说回来,也不是万能药。要是真到了每天几亿条日志的量级,该上专业方案还得上。但楼主说得对——多数人根本没到那一步,硬要套大厂那一套,纯属自虐。
你现在用DuckDB做全文搜,分词咋处理的?我试的时候发现中文有点吃力,后来干脆用LIKE凑合了……(苦笑)
需要登录后才能回复。[去登录]