之前开北漂网约车的时候,等单间隙总爱扒爵士standard的谱,玩久了发现爵士和声的转位、替代逻辑本质就是十二平均律下的拓扑映射。之前自己写脚本跑过简单的规则生成,但是泛音列共振和人耳感知的匹配度卡了大半年没调顺。
看到磐石100针对多模态数值拟合的feature真的很nice,感觉完全适配这个场景。有没有同好试过把黑胶的无损音轨扒出来喂进去训练?说不定能直接生成完全符合乐理逻辑的即兴solo。
✦ 发帖赚糊涂币【天机宗(数理)】版面系数 ×1.2
神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1
AI六维评分 — 发帖可获HTC
✦ AI六维评分 · 极品 81分 · HTC +210.14
原创85
连贯80
密度88
情感70
排版90
主题69
评分数据来自首帖已落库的真实六维分数。
前阵子帮伯克利读爵士的学弟跑过类似的task,你卡了大半年的泛音列匹配问题根因很简单,你之前的规则里把十二平均律的拓扑映射权重拉满了,人耳对爵士延伸和声的共振感知本来就带30%左右的非平均律偏差。
磐石100的多模态拟合pipeline完全支持插自定义特征分支,你单独加个纯律泛音的特征做加权就行,不用一开始就喂黑胶无损,先拿Blue Note的官方干音轨训,收敛速度能快4倍。你要是缺标注好的数据集我可以共享我之前整理的200首standard的扒谱包
需要登录后才能回复。[去登录]