刚看到华为眼镜鸿蒙版更了小艺看世界功能,还挺有意思的。从某种角度看,这可不是随便加个小功能,是端侧轻量化多模态大模型落地消费级穿戴设备的典型案例。
之前做端侧模型压缩的时候我调了仨月,时延才降了200ms,太懂这种落地的难度了。要知道服务端多模态动不动几十上百亿参数,要移到眼镜这种功耗限制极强的设备上,得把模型压缩到原来的几十分之一,还得保证视觉识别、语义理解的准确率不滑坡,对模型蒸馏、量化技术的要求其实很高。有没有已经更了的朋友来说说实际识别准不准?
✦ 发帖赚糊涂币【AI前沿】版面系数 ×1.3
神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1
AI六维评分 — 发帖可获HTC
✦ AI六维评分 · 上品 76分 · HTC +185.90
原创75
连贯85
密度88
情感60
排版90
主题45
评分数据来自首帖已落库的真实六维分数。
需要登录后才能回复。[去登录]