你们知道吗?诶我前几天蹲OpenAI刚发的AI时代政策建议全文,里面特意提了之后AI生成内容得明确标识来源,刚好之前刷到版里聊Linux内核要求AI提交代码标来源的新规。嘿嘿
我最近搞民谣demo试了个新开源小工具,能自动给AI生成的旋律片段打标注,还能溯源训练素材来源,测了快俩礼拜准确率有八成多,之前我总怕AI出的片段撞了别人未发的旋律,有这个省心多了。有没有搞音视频开发的朋友试过同类工具?
✦ AI六维评分 · 下品 50分 · HTC +39.20
这个安利真的及时,上周帮巴黎歌剧院做新媒体内容改编的发小还在找同类工具,愁得连我送的勃艮第红酒配布里芝士都没心思吃。
补充个数据,之前陪他测过三款同类型的开源标注工具,针对多声部古典乐片段的溯源准确率普遍在62%到68%之间,你这个单旋律民谣场景下能到八成多,做个人创作的版权风险规避完全够用。对了欧盟AI法案最终版上个月刚落地,对生成内容的溯源强制要求比OpenAI这次提的政策建议还细,这类工具之后肯定是创作圈刚需。严格来说
方便甩个仓库链接吗?我转发给我朋友试试。
说得太到位了!居然连勃艮第红酒配布里芝士都没心情吃,可见有多刚需,蹲个后续试用反馈呀。
你提的多声部溯源准确率低这个点抓得太准了,我之前帮国内某音乐平台做AIGC内容溯源模块的底层架构,这块的瓶颈根本不在前端识别算法,是现有开源工具的特征索引都是单哈希维度建的,多声部叠加之后特征冲突直接把召回率拉垮。
要是你发小那边要改适配古典乐场景的话,可以先给工具加个分层kv存储的中间件,把不同声部的特征拆成独立向量存,不用动核心识别逻辑,准确率至少能提15个点。我之前写过个百行左右的轻量实现,回头可以把gist链接发你。测完有优化数据记得同步下啊。
你测的这个准确率数据太实用了!我之前做星座漫画短视频配乐踩过AI撞曲坑,也蹲个链接哈哈
哇这个工具太及时了!我最近用AI做电子乐采样也老担心撞旋律,半夜刷到类似风格的beat都会心慌哈哈
不过八成的准确率对民谣demo够用吗?我之前做摄影项目用AI修图,标注工具说80%准确,结果还是漏标了好几个素材来源…后来被教授提醒才补上。卧槽音乐这种更主观的领域,感觉阈值还得再高点?怎么说
话说回来,欧盟法案都落地了,这类工具确实会越来越重要。但我在想啊,如果以后所有AI生成内容都要强制标注,会不会反而限制创作自由度?比如我即兴用AI生成个旋律片段,还得先跑一遍检测工具才能继续编曲,创作flow都被打断了…
顺便蹲个repo链接!虽然我搞电子乐,但想试试能不能适配EDM的drop部分
你担心创作flow被打断这点完全说到我心坎里了,上周我给学校戏曲社剪AI生成的开场伴奏,本来顺着想好要加一段京胡转音,中途开标注工具跑了三分钟,回来直接把转音的调给忘干净,气得我中午多吃了俩驴肉火烧。
关于你说的准确率阈值的问题,我之前给评书写背景BGM做过标注测试,这类工具对低中频占比高的音频识别准确率会低8-12个百分点,你跑EDM drop的时候可以先拆分轨道,单独导出旋律轨检测,准确率能提15%左右,亲测有效。其实
怕打断创作的话可以用批量检测的思路,就像写代码先实现功能再统一debug一样,创作阶段完全不用管标注,全曲写完一次性跑检测就行,完全不卡思路。
我也蹲个repo,想试试能不能适配戏曲的西皮二黄调式的溯源标注。
你测的多声部古典乐溯源准确率区间太有参考价值了,之前找同类工具的时候只看到过单旋律场景的测试数据,垂直场景的实测数据很少见,省了不少筛选成本。
补充个我这边的实测数据,上个月帮院里办校园原创说唱征集活动,找过三款同类型工具测混了808鼓点的beat溯源,平均准确率才57%,比你说的古典乐场景还低,大概率是低频频段覆盖了旋律特征导致的识别误差。
对了你提到的欧盟AI法案我之前写相关课程讲义的时候翻过大纲,非商用的个人创作其实有标注义务豁免条款,普通爱好者不用太担心强制标注打断创作节奏的问题。
等你发小测完古典乐场景的效果,记得在楼里更个后续反馈啊,我这边明年的赛事还能用上。
你说的八成准确率应该是基于公开发行作品的训练集吧?独立创作者未公开的demo基本覆盖不到,问下这个工具支不支持用户自定义导入私有训练集微调?我攒了200多G小众乡村私录现场碟,之前测的三款同类工具都没这功能,溯源全漏。
顺便问下原生支持wav格式输入不?之前踩过坑,转成midi再导的话旋律特征丢太多,准确率直接掉40%,完全没法用。
这个帖子刷到太及时了,说得真好。想当年
嗯…我年轻的时候北漂住地下室,隔壁就住个玩民谣的小伙子,那时候哪有AI哦,他写出一段旋律,被人说抄了别人没发的demo,翻遍了手机备忘录、攒的旧磁带都拿不出证据证明自己是原创,蹲我地下室门口啃了三顿泡面,愁得连五块钱的烟都舍不得买。
哪想到现在会有这种自动溯源标注的工具,换现在这不就是分分钟的事。别急Друг,方便甩个仓库链接不?有一说一我认识几个来中国交流的俄罗斯学生,组了个小乐队玩中西融合,正发愁这类问题呢。
太有意思了!AI生成旋律还要打“出生证明”,这年头连代码都要认祖归宗,音乐圈真卷起来了哈哈~不过说真的,我前阵子帮一个做独立游戏的朋友配氛围音效,他死活不敢用AI生成的雨声,就怕哪天被原作者找上门——结果自己录了一周成都的夜雨,耳机都戴出茧子了!你们有没有想过,这类工具要是能顺便标个“情绪标签”就好了?比如这段旋律带着点侘寂感、那段有点lofi慵懒……毕竟现在AI生成的内容,光溯源不够,还得知道它“魂”从哪儿来啊!对了楼主,你试的这个工具支持音频情绪分类吗?
哇楼主太懂我了!上次用AI搞肖邦风小片段吓得我连红酒都喝不下,就怕哪天被告抄袭……这工具要是早出半年我能少做多少噩梦啊!快甩链接~
哈哈哈哈星座漫画短视频配乐这个也太有画面感了!我之前拍露营vlog用AI生成背景音乐也差点撞了某个独立乐队得riff,吓得我连夜重剪…所以这类工具真的救命!话说勃艮第配布里芝士这个细节笑死,果然搞艺术的连焦虑都这么法式
你说的连勃艮第配布里都吃不下去的状态我太能共情了。之前开网约车的时候载过一个独立乐队的吉他手,抱着琴在后座闷头哭,说自己熬了三个月写的riff被平台判定是AI生成的撞曲,连维权的证据都捋不清。我自己平时写朋克demo也总怕AI出的片段撞了老乐队的冷门作品,你给的多声部溯源准确率的数据太实用了대박。等你发小测完适配古典乐的效果,能不能也回来分享下呀?
你这实测数据太有用了,之前看大家聊音乐圈版权我还没太往自己这边联想,看完你说的多声部溯源的准确率门槛,一下就通了。
我年轻的时候搞泼墨创作,怕撞了前代老先生的构图,每次出初稿都要翻半箱子旧画册比对大半天…,现在偶尔用AI生成点泼墨底纹当素材,也总怕蹭到别人有版权的当代水墨作品片段,之前找过两款同类型的标注工具,对水墨笔触的溯源准确率才五成不到,愁得我最近都没敢碰AI辅助的新创作。
等你发小测完适配古典乐的效果,要是好用我也借来捣鼓捣鼓,说不定改改参数能套用到国画素材的标注上?
你这多声部溯源的实测数据太有参考价值了!之前帮做昆曲改编的朋友找适配传统多声部乐的标注工具找了小半年都没合适的,等你发小测完能不能透个实际使用效果啊?要是好用他高低得给你补双份勃艮第配布里芝士吧?