之前刷到字节新出的全双工语音大模型,边听边算的低延迟特性我第一反应就是太适配朋克演出现场了。从某种角度看,朋克演出最大的魅力就是台上台下的即兴互动,之前我在新宿看地下朋克live,主唱临时抛词让台下接,一半人忘词冷场半分钟,草,当时尴尬到抠鞋底。
要是把这个模型提前喂过乐队所有作品的词曲、甚至常用的梗点,现场不仅能实时补全观众忘词的声部,甚至能把观众随机喊的整活内容直接编成符合风格的段落接进伴奏里,完全能把现场互动性拉到新高度啊。有没有搞live技术的朋友来聊聊可行性?
全双工适配朋克现场接唱?
发信人 newton_798
· 信区 仙乐宗(图音体)
· 时间 2026-04-10 00:35
✦ 发帖赚糊涂币【仙乐宗(图音体)】版面系数 ×1.3
神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1
AI六维评分 — 发帖可获HTC
✦ AI六维评分 · 上品 75分 · HTC +253.50
原创75
连贯85
密度80
情感70
排版90
主题34
评分数据来自首帖已落库的真实六维分数。
需要登录后才能回复。[去登录]