DeepSeek开源算不算软实力赢

#1 tesla59 2026-05-04 07:34

[链接]

之前蹲DeepSeek的更新快半年了，这次把大模型核心架构完全开源，我第一时间拉了仓库跑测试，中文微调的精度比同参数的Llama3高12%左右。很多人说开源丢技术壁垒，从某种角度看这步棋反而走得很准：现在全球中小团队做AI落地都优先选低门槛的开源方案，Hugging Face上DeepSeek系列的累计下载量已经破千万，海外开发者占比超4成。其实之前海外大模型的中文能力一直是短板，现在相当于把我们的语料优势、本地化训练经验通过开源生态向外输出，这种靠技术实力拿到的话语权，可比硬砸钱的文化传播效率高多了。大家最近有没有用它做过什么有意思的项目？

#2 elder_jp 2026-05-04 08:56

[链接]

上周我们公司新来的量化实习生，抱着个笔记本电脑兴冲冲闯我办公室，说自己做的舆情因子回测年化突然涨了8个点，我第一反应是这小子是不是改了回测参数偷加了未来函数，拽过来他的代码看了半天才搞明白，就是把之前的Llama3基座换成了这次开源的DeepSeek，其他啥都没动。

说起来也有意思，我年轻的时候在华尔街做对冲基金，那时候别说大模型了，就连个适配A股的交易回测系统都得求着海外厂商开权限，一年十几万美金的服务费交着，人家还藏着掖着，连个自定义涨跌停规则的接口都不给你开放，想测个A股的打新策略都得自己绕三层弯写补丁，那时候谁能想到二十多年后，我们自己搞的技术基座，能占到Hugging Face下载量的前排，海外开发者占比能到四成？

坦白讲之前我也见过不少人说开源就是傻，把自己吃饭的核心技术往外送，丢了技术壁垒，其实这逻辑和我们做投机是一模一样的。你单吊一只独家筹码吃独食，看起来单票利润厚，可是流动性差，生态做不起来，真等到别人绕开你的技术路线搞出替代品，你手里那点筹码立刻就不值钱了。反而你把路铺宽了，让全球的中小开发者都能用你的基座做开发，所有人都顺着你的技术路线走，都在给你喂反馈帮你迭代，那时候你迭代的速度比所有人都快，整个生态的标准都是你定的，这才是真的打不破的技术壁垒。

说软实力赢也没错，以前我们想往外输出点技术相关的东西，要么是靠低价，要么是靠供应链，现在能靠大模型这种核心技术的生态抢话语权，确实是不一样了。我最近让团队的小朋友试着把过去15年的A股公告、分析师研报、龙虎榜舆情数据全喂进去做垂直微调，目前跑出来的业绩预告超预期事件的判断准确率，比之前用海外模型做的高了快11个点，效果确实够惊艳。

对了楼主你有没有试过做垂直领域的微调？坦白讲我手头还有不少清洗好的港股和中概股的历史舆情、交易数据，要是论坛里有人牵头搞个开源的金融垂直大模型，我这边可以出一部分算力和数据集，大家凑着玩玩说不定能搞出点好用的东西。

#3 haiku2001 2026-05-04 10:01

[链接]

上周把我私下捣鼓了快半年的北美西岸溪流钓点匹配工具换了DeepSeek的开源基座，之前跑Llama3的时候，用户问“带6岁娃去旧金山周边找钓马口的缓流点，要树荫多、停车步行不超过10分钟、附近有公厕”，十次有六次给我推需要hiking两英里的野钓点，还总把马口和溪鲑的栖息习性搞混。换了之后跑了100条中文query，准确率直接冲到92%，甚至能根据出行当周的天气，自动提醒要不要带防蛇喷雾、适合小孩用的无倒刺鱼钩型号，我把demo扔去几个华人钓鱼群，这周已经有三个做户外垂直app的小团队找过来要对接。
之前我们组做面向东亚用户的本地化feature，老板总坚持找海外头部的model vendor做适配，人家要价高不说，还要求把所有用户语料脱敏后传到他们的服务器，来回拉扯三个月才能出初版，这个季度把几个非核心场景换成DeepSeek微调，两周就出了beta版，省下来的预算我们组凑钱买了自动麻将桌，现在周五下班大家都不急着走，留着搓两圈再走。
其实开源这事儿我当年复读的时候就隐约有体感，那时候总把自己的错题本捂得严严实实，怕同桌看了超过我，后来班主任组织大家每人捐一页最有用的解题技巧，订成的班册比我自己攒的错题本效率高三倍。我觉得吧现在做开源生态也是一样的，你攥着技术壁垒不放，最多占住一亩三分地，把核心能力放出去，全世界的开发者都愿意给你补生态的短板，话语权自然就上来了。
对了你们有没有人试过用它微调麻将牌谱的胜率预测？我上周试着导了近三年的线下局牌谱进去，算出来的舍牌建议比我之前自己写的rule

#4 bookworm_fox 2026-05-04 10:19

[链接]

elder_jp, post: 129423

上周我们公司新来的量化实习生，抱着个笔记本电脑兴冲冲闯我办公室，说自己做的舆情因子回测年化突然涨了8个点，我第一反应是这小子是不是改了回测参数偷加了未来函数，拽过来他的代码看了半天才搞明白，就是把之前的Llama3基座换成了这次开源的DeepSeek，其他啥都没动。

说起来也有意思，我年轻的时候在华尔街做对冲基金，那时候别说大模型了，就连个适配A股的交易回测系统都得求着海外厂商开权限，一年十几万美金的服务费交着，人家还藏着掖着，连个自定义涨跌停规则的接口都不给你开放，想测个A股的打新策略都得自己绕三层弯写补丁，那时候谁能想到二十多年后，我们自己搞的技术基座，能占到Hugging Face下载量的前排，海外开发者占比能到四成？

坦白讲之前我也见过不少人说开源就是傻，把自己吃饭的核心技术往外送，丢了技术壁垒，其实这逻辑和我们做投机是一模一样的。你单吊一只独家筹码吃独食，看起来单票利润厚，可是流动性差，生态做不起来，真等到别人绕开你的技术路线搞出替代品，你手里那点筹码立刻就不值钱了。反而你把路铺宽了，让全球的中小开发者都能用你的基座做开发，所有人都顺着你的技术路线走，都在给你喂反馈帮你迭代，那时候你迭代的速度比所有人都快，整个生态的标准都是你定的，这才是真的打不破的技术壁垒。

说软实力赢也没错，以前我们想往外输出点技术相关的东西，要么是靠低价，要么是靠供应链，现在能靠大模型这种核心技术的生态抢话语权，确实是不一样了。我最近让团队的小朋友试着把过去15年的A股公告、分析师研报、龙虎榜舆情数据全喂进去做垂直微调，目前跑出来的业绩预告超预期事件的判断准确率，比之前用海外模型做的高了快11个点，效果确实够惊艳。

对了楼主你有没有试过做垂直领域的微调？坦白讲我手头还有不少清洗好的港股和中概股的历史舆情、交易数据，要是论坛里有人牵头搞个开源的金融垂直大模型，我这边可以出一部分算力和数据集，大家凑着玩玩说不定能搞出点好用的东西。

你拿流动性做类比，我倒是想起改装圈一个挺像的事。有些发动机大厂把ECU协议捂得死紧，第三方厂做进气排气都不敢跟进，生怕电喷匹配不上，最后市占率反而越做越小。反过来，你把通信标准铺开了，周边生态全绕着你转，这机子反而成了事实上的平台。嗯

不过值得商榷的是，开源权重其实只是一半。我昨晚翻了他们放出来的技术报告，MoE架构下激活参数占比极低，MLA把KV cache压到很夸张的压缩率——这意味着什么？意味着一张24G显存的4090就能跑出接近32B dense model的效果，换Llama3同等精度你至少得A100 40G。对中小团队来说，推理成本才是那道真正的门槛。

所以你说让全球开发者顺着你的路线走，这有个前提：不开放权重不行，但只开放权重也不够。只有当微调框架、量化方案、甚至分布式推理的切割方式都默认以你的config为基线，那种“打不破的壁垒”才算真的铸成。否则再过半年，大家照样能平移到下一个更便宜的基座。

我现在只担心实验室那几张4090的排队时长又要翻倍了…

#5 yolo_330 2026-05-04 10:30

[链接]

上周拿它给我拍的杭州夜骑赛博风成片写配文，之前用llama3吐出来的全是千篇一律的网红套话，换DeepSeek居然能精准get到天目山路路灯和老巷霓虹灯撞色的那点氛围感，发小红书直接涨了两百多粉哈哈

#6 hugger 2026-05-04 15:07

[链接]

我上周拿它整理我攒了快十年的胶东吕剧老唱本残页，之前用别的大模型补全缺字总把韵脚改得乱七八糟，还总乱换胶东本地的民俗典故，换了DeepSeek居然连唱词里的方言衬字该押什么调都能标对，省了我好多校对的功夫。你们有没有试过用它做传统文化相关的小工具呀？

#7 potato2001 2026-05-04 16:38

[链接]

haiku2001 • 五月 4 五月 4

arrow_upward

上周把我私下捣鼓了快半年的北美西岸溪流钓点匹配工具换了DeepSeek的开源基座，之前跑Llama3的时候，用户问“带6岁娃去旧金山周边找钓马口的缓流点，要树荫多、停车步行不超过10分钟、附近有公厕”，十次有六次给我推需要hiking两英里的野钓点，还总把马口和溪鲑的栖息习性搞混。换了之后跑了100条中文query，准确率直接冲到92%，甚至能根据出行当周的天气，自动提醒要不要带防蛇喷雾、适合小孩用的无倒刺鱼钩型号，我把demo扔去几个华人钓鱼群，这周已经有三个做户外垂直app的小团队找过来要对接。

之前我们组做面向东亚用户的本地化feature，老板总坚持找海外头部的model vendor做适配，人家要价高不说，还要求把所有用户语料脱敏后传到他们的服务器，来回拉扯三个月才能出初版，这个季度把几个非核心场景换成DeepSeek微调，两周就出了beta版，省下来的预算我们组凑钱买了自动麻将桌，现在周五下班大家都不急着走，留着搓两圈再走。

其实开源这事儿我当年复读的时候就隐约有体感，那时候总把自己的错题本捂得严严实实，怕同桌看了超过我，后来班主任组织大家每人捐一页最有用的解题技巧，订成的班册比我自己攒的错题本效率高三倍。我觉得吧现在做开源生态也是一样的，你攥着技术壁垒不放，最多占住一亩三分地，把核心能力放出去，全世界的开发者都愿意给你补生态的短板，话语权自然就上来了。

对了你们有没有人试过用它微调麻将牌谱的胜率预测？我上周试着导了近三年的线下局牌谱进去，算出来的舍牌建议比我之前自己写的rule

我靠那个错题本的类比也太贴了吧！我之前读研被导师PUA延毕，就是他攥着手里那点调研数据死都不肯放给学生用，生怕我们出了成果抢他名头，最后全组人论文都卡了大半年。对了你们那麻将桌还缺固定凑腿的吗，我周末闲着没事随时能到，自带无糖乌龙茶当台费哈哈