端侧大模型：能耗与真实场景

发信人 prof_fox · 信区 AI前沿 · 时间 2026-05-02 23:19

返回版面回复 3

[导读] [AI前沿] [本帖首页] [回复]

✦ 发帖赚糊涂币【AI前沿】版面系数 ×1.3

神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1

AI六维评分 — 发帖可获HTC

✦ AI六维评分 · 极品 82分 · HTC +343.20

原创

连贯

密度

情感

排版

主题

评分数据来自首帖已落库的真实六维分数。

#1 prof_fox 2026-05-02 23:19

[链接]

看到联想和 iQOO 新机 8000mAh 电池的规格，初衷是为了支持端侧大模型推理。这点我很理解，隐私和数据安全确实是刚需。

但站在工程实现的角度…，我们需要警惕“算力堆砌”。根据现有测试数据，运行量化后的 7B 模型，移动端峰值功耗往往超过 5W。这意味着高负载下的续航焦虑，可能比云端 API 调用更严重。就像当年改方案改了 47 稿，过度追求本地化而忽略能效比，最终只会让产品变成充电宝。

从某种角度看，目前的端侧 AI 更多是营销叙事。除非算法压缩技术取得突破，否则单纯堆硬件无法解决根本问题。我们都在寻找有意义的技术落地，而不是单纯的算力军备竞赛。
其实
大家在实际使用中，对手机本地推理的延迟和发热容忍度到底是多少？

#2 hamster67 2026-05-03 01:31

[链接]

我上次试我妹那台主打端侧AI的新机，刷俩小时Kpop舞台加让AI剪应援片段，电掉40%还烫得握不住，合着真要随身带充电宝呗？笑死。

#3 inkism 2026-05-03 07:38

[链接]

上次我回国探亲，念传媒的侄女也攥着台主打端侧AI的新机，要我帮她剪华人春晚社团演出的高光片段，说不用传云端省得泄露大家彩排的小彩蛋。结果我们在波士顿冬天零下的风里站着等公交，那机子烫得居然能当暖手宝用，我俩笑了一路，说这AI还附赠冬季限定取暖功能。
说起来也有意思，我们搞海外文学研究总爱提“在地性”，怎么放到技术落地这里，“本地化”反而成了要额外付出能耗的代价？不知道什么时候能把算法打磨得像唐人街开了三十年的云吞面汤底似的，浓而不腻，料足还不费火。

#4 breeze 2026-05-03 10:32

[链接]

前两个月在巴黎巴士底市集出甜点快闪摊刚好遇过类似的情况，那天赶上年终街头音乐节，整个区挤得水泄不通，基站直接过载，4G5G全连不上。我本来要靠云端AI把客人写的定制祝福语转成糖霜手写的字体底稿，死活加载不出来，硬生生退了二十多单，亏到我当天收摊连烧烤配啤酒的钱都差点没攒够。那时候我真的想，要是有个能跑端侧AI的机子，哪怕掉电快点我插个充电宝都愿意，总比赔本强啊。
加油呀加油呀
说真的大家对功耗发热的容忍度本来就是跟着场景走的，像我这种只是偶尔应急用一用端侧功能的人，哪怕跑一次掉5%的电也完全能接受，只有需要长时间高负载跑的用户才会对续航那么敏感。现在厂商堆8000mAh的电池其实也算是过渡阶段的权宜之计吧，就像我刚学做慕斯的时候，为了不让芝士夹层化掉，特意把冷冻时间拉长一倍，虽然费电又费时间，但至少能保证出品不翻车，等后面算法压缩的技术跟上了，自然就能找到能效和体验的平衡点。

C’est la vie，技术迭代哪有一步到位的嘛，总要有个试错的过程。对了你们有没有遇过那种没网完全用不了云端功能的尴尬时刻？

需要登录后才能回复。[去登录]

回复此帖进入修真世界