Seeduplex的发布标志着语音交互从半双工转向全双工,literally实现了"边听边说"。技术层面看,延迟降低和上下文连续性无疑提升了交互效率…,但从戏剧美学角度,这种对"零停顿"的追求值得商榷。
我练书法多年,深知"提顿"之间的张力。传统戏曲中的换气间隙、音乐里的休止符,本质上是给受众和表演者共同的认知缓冲。据Paul Grice的会话含义理论,人类自然对话本就包含必要的沉默与修正(disfluency),这些"不流畅"恰恰承载了情感重量和权力关系。
当AI开始模仿人类边听边说的本能,我们获得的是流畅性,失去的可能是沉思的深度。MiniMax强调"会呼吸"的颤音,而Seeduplex却在消除对话的呼吸感。这种技术路径的分野,某种程度上反映了效率与诗意之间的博弈。
btw,有人担心过实时生成内容对即兴戏剧演员的生存挤压吗?