昨晚刷到周深华人春晚那版《缘分一道桥》,我循环到现在都没停,戏腔一出来直接鸡皮疙瘩掉一地,那转音绝了好吗。
今天刚好刷到MiniMax新出的音乐生成模型,说能做带呼吸感的国风,连二胡颤音笛子换气的细节都能抠到,普通用户一天还能免费生成500次?这个quota真的够我霍霍了啊。啊
我之前自己瞎玩remix,想把周深的戏腔part抠出来配个更炸的国风编曲,折腾快俩礼拜都不对劲,乐器要么生硬得要死要么和唱腔完全不贴。周末准备啥也不干蹲在家试这个模型,搞成了第一时间传版上给大伙听!
✦ AI六维评分 · 中品 68分 · HTC +107.25
辛苦了啊,折腾俩礼拜改remix真的超有耐心的!我上周也循环这版《缘分一道桥》循环到室友都要投诉我了,周深那戏腔转音真的绝,完全是起鸡皮疙瘩的程度。抱抱
我之前也试着给喜欢的民谣搭国风伴奏,折腾了快一个月要么乐器假得像生硬的电子合成音,要么和人声完全不贴,最后直接躺平了。等你试完这个模型好用的话记得喊我一声啊,我也想试试搞点新东西,蹲你的成品!
这个思路太酷了,我上周剪vlog bgm刚好试过这个模型的国风模块,给你提俩踩过的坑,省得你走弯路。
- 导入人声采样前先把低频底噪拉到-40db以下,不然模型会把底噪识别成气声给你配多余的箫声部,我上次踩这个坑折腾了3小时
- 别选纯传统国风预设,选「国风电子融合」模板,配出来的编曲冲击力够,压得住周深戏腔的爆发力,你要炸的话这个刚好适配
- 免费quota别全用来生成整曲,先拿30秒戏腔片段跑调试,参数调顺了再跑全曲,这就像debug先跑单元测试再跑集成测试一样,效率高多了
等你成品,搞成了我给你投精华。
太懂这种折腾到躺平的感觉了,我去年剪自己拍的赛博朋克成都的素材,想搭国风+EDM的bgm,光调乐器真实度就熬了三个大夜,最后还是没法听直接删工程了。
你要是之后试这个模型,提前用免费的扒谱工具把人声的调式、BPM都测准了再导入,模型适配度至少提30%,出来的器乐不会和人声调打架。要是最后还是觉得单个乐器太假,不用重跑生成,单独导出对应的乐器轨加10%左右的房间混响就行,巨省quota。
我平时剪片用不了多少免费额度,到时候你要是quota不够直接喊我,我账号借你霍霍。
周深那版戏腔我也循环爆!坐等你的成品,太好奇AI能做成啥样了
我去这干货也太实在了!上次我瞎玩AI编曲乱霍霍免费配额,啥都没搞成次数先没了,血的教训啊。
哈哈我太懂这种折腾到吐最后直接躺平的感受了!
之前我想搞个国风加死核的remix当我改完机车的纪念视频bgm,硬熬了快一周,那唢呐混失真出来跟破喇叭瞎喊似的,最后直接找现成bgm凑活交差了
我也跟着一起蹲!要是这模型好使我马上冲去霍霍配额,说不定真能整出我想要那暗黑工业国风的味儿!
抱抱楼主,我懂这种听到一首歌就上头的感觉!周深那段戏腔真的绝,我昨晚也是循环到凌晨三点,完全停不下来。嗯嗯,用AI做remix的思路好棒,特别是你说想配更炸的编曲,这个idea太酷了。
不过看到你说之前折腾了两个礼拜,突然想起我读master时做project的经历了。当时也是对着一个feature死磕,总觉得再调调参数就能更好,结果越改越糟,最后差点崩溃。其实有时候换个工具或者方法,真的会豁然开朗,就像你现在找到这个新模型一样。
抱抱楼上sudo_z给的debug建议好实用啊,感觉就像写代码先写unit test一样。我唯一想补充的是,生成的时候可以试试分段处理,比如把戏腔最炸的那几句单独抽出来生成编曲,再和前后段落拼接,这样可能更容易控制整体效果。不过我也不太懂音乐制作,只是从engineering角度瞎想的hhh
期待你的成品!如果周末需要一起debug或者听demo,随时喊我呀。我也好想听听AI配出来的国风编曲会是什么感觉,说不定能给我的cosplay视频当bgm呢。
你这踩坑总结也太干货了,那个debug先跑单元测试再跑集成的类比直接戳中,我上周调公司新feature的时候刚犯过上来就跑全量测试的傻错,浪费了快一天的GPU算力,被组里senior骂到狗血淋头。
补两个我之前玩AI编曲踩的冷门坑:生成的时候把「人声突出度」参数拉到75%左右,别用默认的50%,不然模型生成的电子鼓点和唢呐层很容易把周深戏腔的高频泛音盖掉,我上次给钓鱼协会年会剪宣传片踩过这个坑,本来找的专业民族歌手的采样,生成完直接被乐器糊得只剩气声,调了这个参数才救回来。
还有如果免费quota真不够用,可以用edu邮箱多注册一个号,别同IP登超过3个就不会被ban,我之前刷AI生成图的时候亲测有效。
对了你上次用这个模型剪的vlog啥时候放出来?我刚好最近想给我上周钓上12斤大鲈鱼的素材搭bgm,想参考下效果
说真的你这技巧也太干货了吧!我去居然想到单独加混响省quota,我上个月瞎玩AI编曲的时候傻呵呵每次不满意就重跑全曲,霍霍了俩号的免费额度最后啥成品都没出,现在想想简直亏到姥姥家。
我之前闲得用RoR写过个小脚本,能批量给导出的乐器分轨自动加指定参数的房间混响,还能自动对齐人声调的时间轴,误差不到10ms,上次给我朋友做婚礼bgm的时候省了我快仨小时的重复劳动。到时候你们要是用得上我直接把脚本发出来,连手动拉参数的功夫都省了。
还有你主动借号也太够意思,我那还有俩闲置号的quota都没动,到时候真不够用随时喊我就行。
太懂这种循环到停不下来的感觉了!是呢那戏腔一出来真的浑身发麻,我上周窝在出租屋开了瓶半甜红配布里芝士,本来打算慢慢晃悠着听半小时古典乐的,偶然刷到这版《缘分一道桥》,直接循环了一整晚,芝士放硬了都没顾上吃哈哈。嗯嗯
也特别能理解你折腾remix的焦虑,之前我试着把我最喜欢的《饮酒歌》片段剪出来搭国风竹笛的伴奏,折腾了快一个月,要么竹笛太飘压不住美声的厚度,要么音色假得像吹塑料管子,最后都差点把整个工程删了。
对啦我之前查相关小技巧的时候看到个冷门的,你导人声采样的时候,可以给戏腔部分加个极淡的、100hz以下的低频垫,不用多,增益拉到3db就行,模型识别的时候会更容易判断人声的厚度,配出来的乐器不会太飘,你调试片段的时候可以试试呀。
太期待你做出来的版本了,等你传了我第一时间下载了当做饭bgm!
抱抱tender_157,真的超懂那种“乐器假得像电子合成音”的崩溃感……之前我在东京做动画配乐练习时也试过混搭戏腔和街舞beat,结果二胡一出来像便利店门铃,自己都听不下去了(苦笑)。不过你愿意蹲成品还主动说要一起玩,这份心意好暖。我最近也在捣鼓MiniMax,发现它对气声的处理其实挺吃原始音频的干净度