哇哦,你们知道吗?2023年,AI和音乐碰出了火花!这次,Soul张璐领着她的团队,在歌声合成这个领域里玩出了新花样。大家以前总觉得,歌声合成技术太麻烦,给的内容太少,现在终于有了解决办法!张璐带着吉利汽车研究院人工智能中心、天津大学视听觉认知计算团队,还有西北工业大学音频语音与语言处理研究组的成员们一起搞了个大动作,推出了SoulX-Singer!这个玩意儿厉害着呢,就算你没听过某个歌手的歌,它也能把你要的音色给你搞出来。而且合成出来的声音听起来特别稳、特别自然。技术背后的故事也挺有趣的。SoulX-Singer用了FlowMatching这种生成模型,把歌词、旋律和发声这三样东西的关系给理顺了。通过引入note级别的对齐机制,每个音符的起始时间、音高还有持续时间都被精确地建模控制好了。这样一来,不管是多复杂的音乐条件,SoulX-Singer都能保持高质量的表现。这是因为它训练用的数据足足有42000小时啊!数据里面涵盖了各种语言、各种音色还有演唱风格呢。 这个技术有多厉害?不仅能给MIDI驱动的音乐进行歌声合成,还能直接基于Melody来控制呢!前一种适合搞音乐创作和歌词编辑,后一种则适合翻唱和风格迁移。用户评论区里可热闹了,好多人都说听这首歌的时候特别感动。“每一次低头都是想你”,这歌词太打动人了。还有网友说在加班的时候听这首歌就像是点燃了一盏心灵的明灯。甚至有人在聊时间、生活还有感情这些话题呢。大家还一起推荐了好多好听的歌曲呢!SoulX-Singer开源之后真的为SVS技术注入了新的活力呀!以后我们能享受到的音乐可能性简直无穷无尽。Soul团队也会继续优化这个模型,把它用到更多场景中去哦!你听这首歌的时候想到了谁?快来分享你的音乐故事吧!