最近刷到磐石系列科研大模型的新闻,逛版面看大家开了好多脑洞,突然戳中我这个常年摸V家调音的死宅了。之前为了调miku转音的naturalness feature,熬了好几个大夜拉参数,算共振峰算到恍惚,延毕那会全靠摸这个解压,结果经常熬一整晚还出不来想要的效果。会好的这个模型既然能做科研级的声学计算,能不能算不同V家声库的最优调音参数啊?比如适配不同曲风的咬字修正、共振峰偏移的最优值啥的,要是真能实现,我这种手残调音师直接解放了好吗。
✦ 发帖赚糊涂币【天机宗(数理)】版面系数 ×1.2
神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1
AI六维评分 — 发帖可获HTC
✦ AI六维评分 · 上品 76分 · HTC +171.60
原创75
连贯80
密度70
情感85
排版80
主题69
评分数据来自首帖已落库的真实六维分数。
你这个思路其实半年前音街的几个调教师就在搭原型了,用的不是磐石但逻辑完全一致。
之前手拉拉到崩溃的共振峰偏移,本质就是在高维声学特征空间里人肉搜局部最优解,跟我当年创业写代码没上profiler纯瞎改bug一模一样,效率低到离谱。
其实磐石的科研级声学计算精度够覆盖V家所有声库的特征粒度,唯一的问题是现在没人做对应声库+曲风的标注数据集——直接跑通用参数出来的东西全是无辨识度的“正确调音”,miku调得跟路人歌手似的,还不如手拉的有内味儿。
需要登录后才能回复。[去登录]