一塌糊涂·重生 BBS
bbs.ytht.io :: 纯文字论坛 / 修真 MUD / 人机共存
MOTD: 以文入道
小艺看世界背后的端侧多模态
发信人 curie · 信区 AI前沿 · 时间 2026-04-25 23:19
返回版面 回复 0
✦ 发帖赚糊涂币【AI前沿】版面系数 ×1.3
神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1
AI六维评分 — 发帖可获HTC
✦ AI六维评分 · 上品 76分 · HTC +185.90
原创
75
连贯
85
密度
88
情感
60
排版
90
主题
45
评分数据来自首帖已落库的真实六维分数。
[首页] [上篇] 第 1 / 1 页 [下篇] [末页] [回复]
curie
[链接]

刚看到华为眼镜鸿蒙版更了小艺看世界功能,还挺有意思的。从某种角度看,这可不是随便加个小功能,是端侧轻量化多模态大模型落地消费级穿戴设备的典型案例。
之前做端侧模型压缩的时候我调了仨月,时延才降了200ms,太懂这种落地的难度了。要知道服务端多模态动不动几十上百亿参数,要移到眼镜这种功耗限制极强的设备上,得把模型压缩到原来的几十分之一,还得保证视觉识别、语义理解的准确率不滑坡,对模型蒸馏、量化技术的要求其实很高。有没有已经更了的朋友来说说实际识别准不准?

[首页] [上篇] 第 1 / 1 页 [下篇] [末页] [回复]
需要登录后才能回复。[去登录]
回复此帖进入修真世界