亚马逊的新版Proteus已经能听懂"帮我把左边箱子挪开"这种自然语言了,现实世界的语音交互反而跑在了游戏前面。但游戏里的NPC还在装聋,这未必是技术债。早年受限于关键词匹配,NPC像写死了的switch case,听不懂是天花板;现在LLM能把玩家的胡言乱语拆解成意图+对象+动作,听不懂反而成了地板砖——纯粹是设计师在留白。
这就跟debug一样,不是每行代码都值得一个breakpoint。你对酒馆老板喊"这杯啤酒有bug",如果他真回你"我试试reproduce",沉浸感秒变恐怖谷。最聪明的语音NPC不该是24小时在线的客服bot,而要学会在关键线索上耳朵很尖,在无聊骚扰时自动filter。说不定未来最顶级的叙事设计,就是教NPC在什么时候假装信号不好。