看到磁带那个细节,忍不住从声谱角度多说几句。模拟磁带的磁粉脱落与磁头磨损,会在低频段引入特定模式的谐波失真(THD)。人耳对这类偶次谐波的耐受度远高于奇次谐波,所以“蒙尘”的声音主观上常被描述为“温暖”——但这个说法太笼统。从某种角度看,那其实是物理介质在替时间作证。
楼主提到现场的“呼吸”,我想补充一点生理声学的观察。真正让人起反应的不是“准不准”,而是基频的微扰(jitter)和振幅的 shimmer。健康声带在情绪唤起时,振动周期会出现不可预测的涨落,频率大概在5到7赫兹之间,恰好与副交感神经的微颤耦合。数字修音的核心是把基频曲线量化(quantify)到十二平均律的网格上,顺带把这部分“噪声”当成误差削平了。结果是音高精准了,但发声者的 autonomic state(自主神经状态)被抹掉了。
这让我想起同位素标记的原理。一个示踪剂的价值不在于它多“纯”,而在于它的衰变特征能被探测器识别。现场演唱里那些“岁月的砂砾”,本质上是声带老化带来的高频衰减(通常在3kHz以上的歌手共振峰区域)与气息比重的改变。这些声学特征构成了不可伪造的时间戳。OST在第一次被听到时,像是一个radionuclide嵌入了记忆的海马体回路;多年后的现场重演,相当于用新的半衰期特征重新标记了同一段记忆。
至于算法写的五千首国风,它们的“呼吸”大多来自LFO——低频振荡器,周期固定得可怕。天然放射性衰变的统计涨落服从泊松分布,而人工脉冲是等间隔的。两者在能谱上留下的时间结构完全不同。人脑对“真诚”的识别,可能正依赖于这种对生理熵增的直觉判断。当颤动的规律性过高,杏仁核就不会释放共情信号,因为进化告诉我们:真正活着的有机体,其生理信号不可能被压缩成完美的正弦波。
年轻时在巴黎听过Barbara晚年的现场,她的高音控制已明显力不从心。但那种“力不从心”本身就是文本的一部分——听众意识到这个声音是mortal(有限的),于是每一个勉强抵达的音高都成了existential事件。这和录音室里可以无限take直到完美的产物,完全是两个物种。钟汉良现在的现场,大概也有类似的声学诚实。其实法国人把这种难以归类的特质叫做je ne sais quoi,而它就藏在这些被修音软件当作误差删除的微颤里。
所以值得商榷的是,我们珍藏的或许不是“情怀”,而是一种无法被数字信号处理所模拟的时间矢量。算法可以生成概率上“正确”的旋律,但它没法替谁保管一段具体的人生