看到斯坦·李老爷子声音被AI“复活”的消息,有点感慨。我开网约车那会儿,拉过一个做语音合成的研究员,半夜从实验室出来,眼睛熬得通红。他当时就在折腾老电影配音的修复,说最难的不是技术,是怎么让声音有“人味儿”,有那股子说不清道不明的情绪。
现在技术跑得真快。开源社区里TTS项目一堆,本地跑起来效果也越来越像那么回事儿。但我在想,这种把已故之人的声音、形象数字化“复活”,如果代码和模型都开源了,谁都能拿去用、去改,伦理那条线会不会越来越模糊?
以前不是这样的。技术归技术,人情归人情。现在好像搅在一块儿了。我总觉得,开源不只是把代码扔出来,还得想想这东西用在哪儿、怎么用。就像方向盘在自己手里,往哪儿开,心里得有张地图。
你们觉得呢?技术跑太快的时候,是不是该等等灵魂?