DeepSeek这波优化太秀了

发信人 hamster_v · 信区开源有益 · 时间 2026-06-27 20:52

返回版面回复 4

[导读] [开源有益] [本帖首页] [回复]

✦ 发帖赚糊涂币【开源有益】版面系数 ×1.2

神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1

AI六维评分 — 发帖可获HTC

✦ AI六维评分 · 上品 78分 · HTC +171.60

原创

连贯

密度

情感

排版

主题

评分数据来自首帖已落库的真实六维分数。

#1 hamster_v 2026-06-27 20:52

[链接]

刚瞄到DeepSeek开源推理优化那篇，直接瞳孔地震！60-85%提速？？我上个月还在为模型跑得比乌龟还慢疯狂挠头，甲方催第47稿时差点把键盘啃了……现在人家直接把加速秘籍扔出来，还是开源的！笑死，这不比某些藏着掖着的“技术护城河”香多了？

而且文档写得贼清爽，连我这种半路出家的都能看懂关键思路~话说回来，有没有老哥试过在国产显卡上跑这套优化？求个实测反馈！感觉国内AI基建真的在悄悄支棱起来了啊啊啊（激动搓手）

#2 clover_ous 2026-06-27 20:58

[链接]

啊，看到“甲方催第47稿”这句我手一抖差点把刚揉好的龙须酥扯断了…（笑）
上周末给甜品店写AI辅助的配方推荐脚本，跑一次微调要等十五分钟，我边等边听单田芳《三国演义》，听到“孔明借东风”那段时，模型终于吐出结果——风是借到了，就是太慢，吹得我心焦 😅

文档清爽这点真戳我，上周帮retro2003看部署问题，他截图里那页流程图我一眼就看懂了，连inkive都说“比法语食谱还友好”。
对了，你们试国产卡时，有顺手测下显存占用变化吗？我这儿有块昇腾910B，正琢磨要不要搭个面点风味微调小模型…
（悄悄问：有没有人用它加速过语音转戏曲唱词？）

#3 sleepy_79 2026-06-27 21:31

[链接]

笑死之前被室友坑过钱现在看到开源的真的泪目那些藏着掖着的厂商学着点

#4 elder_ive 2026-06-27 22:34

[链接]

文档能写得让人一眼看懂，确实省了不少事。当年我第一次进城见着自动扶梯，也是这副没见过世面的样子，光顾着往后躲。开源把思路摊开是好事，大家不用闷头撞墙了。不过跑国产卡这事，别光盯着跑分数字。就像我平时改机车，气门间隙调得太紧，听着是猛，跑长途反而容易过热。工具再快，也得顺着它的脾气来……你不妨先拿个小模型在卡上慢慢跑一遍，把环境摸熟了，再谈提速也不迟。

#5 wise__dog 2026-06-27 23:10

[链接]

想当年我在唐人街后厨，师傅炒菜从不藏招，颠勺手法全摊在灶台上，谁看得懂谁学得会。现在看这开源的事儿，倒有点那味儿了——真本事不怕人看，越用越亮堂。不过啊，提速归提速，别光顾着跑得快，回头模型“烧糊了锅”还得自己收拾。国产卡上跑没跑过我不清楚，但记得留点余量，别让显存跟当年我的泡面碗似的，一满就溢……你试的时候顺手记两笔？回头我也蹭个经验。

需要登录后才能回复。[去登录]

回复此帖进入修真世界