Synthesized singing voice demos for ICASSP 2023 paper 《WeSinger 2: Fully Parallel Singing Voice Synthesis via Multi-Singer Conditional Adversarial Training》

Paper

WeSinger 2: Fully Parallel Singing Voice Synthesis via Multi-Singer Conditional Adversarial Training

[arxiv link]

Authors

Zewang Zhang, Yibin Zheng, Xinhui Li, Li Lu

Abstract

This paper aims to introduce a robust singing voice synthesis (SVS) system to produce very natural and realistic singing voices efficiently by leveraging the adversarial training strategy. On one hand, we designed simple but generic random area conditional discriminators to help supervise the acoustic model, which can effectively avoid the over-smoothed spectrogram prediction and improve the expressiveness of SVS. On the other hand, we subtly combined the spectrogram with the frame-level linearly-interpolated F0 sequence as the input for the neural vocoder, which is then optimized with the help of multiple adversarial conditional discriminators in the waveform domain and multi-scale distance functions in the frequency domain. The experimental results and ablation studies concluded that, compared with our previous auto-regressive work, our new system can produce high-quality singing voices efficiently by fine-tuning different singing datasets covering from several minutes to a few hours. A large number of synthesized songs with different timbres are available online\footnote{https://zzw922cn.github.io/wesinger2} and we highly recommend readers to listen to them.

Following updated singing demos listed with red fonts(update date: 20221009).

[update 1] Singing demos from different singers' adapted system with different Chinese pop songs

To show the robustness and performance, here we do not use ground-truth duration for length-regulator, we use predicted duration to match BGM instead.

Chinese pop song《失恋阵线联盟》with BGM

Chinese pop song《泡沫》without BGM

Chinese pop song《去年夏天》with BGM

Chinese pop song《七里香》with BGM

Chinese pop song《小手拉大手》with BGM

Chinese pop song《失恋阵线联盟男高音版》with BGM

Chinese pop song《失恋阵线联盟》with BGM
Chinese pop song《泡沫》without BGM
Chinese pop song《去年夏天》with BGM
Chinese pop song《七里香》with BGM
Chinese pop song《小手拉大手》with BGM
Chinese pop song《失恋阵线联盟男高音版》with BGM

[update 2] Singing demos from different singers' adapted system with different kinds of user-defined lyrics and musical scores(not shown)

To show the robustness and performance, here we do not use/have ground-truth duration for length-regulator, we just use predicted duration instead.

user-modifed lyrics 欢迎大家来听我的歌唱合成分享
欢迎大家来听我的歌唱合成分享
欢迎大家来听我的歌唱合成分享
欢迎大家来听我的歌唱合成分享
欢迎大家来听我的歌唱合成分享
这个唱得怎么样

Synthesized singing audios

user-modifed lyrics 零三年的离别在高考后的校园一个个少年在操场肆意妄为
从此没人关心谁又考了第一因为失落不许人回忆
学习上若在意成绩痛苦就多一个来源人生起起伏伏
不必太过焦虑若不潇洒就是罪二零八没有散席友谊常存
联系的更紧密毕业的我原本以为可能一辈子不相见
二零八没有散席同学相聚不住笑的聊天
让距离变的不再遥远记住相互的美

Synthesized singing audios

user-modifed lyrics 找个好日子愿美好满载而归老了有你陪每天幸福来点缀
是谁的祝贺好运气年年岁岁哦生活也不想白头与我去相偎
日吉祥夜如意祝愿你平安顺遂快到那时候将所谓都一起面对
乐开怀地笑谈为崭新的岁月干杯

Synthesized singing audios

user-modifed lyrics	零三年的离别在高考后的校园一个个少年在操场肆意妄为从此没人关心谁又考了第一因为失落不许人回忆学习上若在意成绩痛苦就多一个来源人生起起伏伏不必太过焦虑若不潇洒就是罪二零八没有散席友谊常存联系的更紧密毕业的我原本以为可能一辈子不相见二零八没有散席同学相聚不住笑的聊天让距离变的不再遥远记住相互的美
Synthesized singing audios

user-modifed lyrics	找个好日子愿美好满载而归老了有你陪每天幸福来点缀是谁的祝贺好运气年年岁岁哦生活也不想白头与我去相偎日吉祥夜如意祝愿你平安顺遂快到那时候将所谓都一起面对乐开怀地笑谈为崭新的岁月干杯
Synthesized singing audios

Following singing voices are all predicted on the test set from SVS systems with Chinese lyrics and musical scores as input.

Selected ground-truth (GT) recordings of three singers for experiments

Singer Name Data-L Data-S Opencpop

Lyrics 后来我总算学会了如何去爱
可惜你早已远去消失在人海没有你的冬天我会一直唱着
唱着直到你出现一双围在我胸口的臂弯足够
抵挡天旋地转

GT Recordings

Singer Name	Data-L	Data-S	Opencpop
Lyrics	后来我总算学会了如何去爱可惜你早已远去消失在人海	没有你的冬天我会一直唱着唱着直到你出现	一双围在我胸口的臂弯足够抵挡天旋地转
GT Recordings

1. Selected predicted samples with ground-truth duration from WeSinger and WeSinger 2

Singer Name Data-L Data-S Opencpop

Lyrics 《后来》片段

栀子花白花瓣落在我蓝色百褶裙上
爱你你轻声说我低下头闻见一阵芬芳
那个永恒的夜晚十七岁仲夏你吻我的那个夜晚
让我往后的时光每当有感叹总想起当天的星光
那时候的爱情为什么就能那样简单而又是为什么
《后来》片段

总想起当天的星光那时候的爱情
为什么就能那样简单而又是为什么
人年少时一定要让深爱的人受伤
在这相似的深夜里你是否一样
也在静静追悔感伤如果当时我们能不那么倔强
现在也不那么遗憾你都如何回忆我
《给我一首歌的时间》片段

能不能给我一首歌的时间紧紧的把那拥抱变成永远
在我的怀里你不用害怕失眠如果你想忘记我也能失忆
能不能给我一首歌的时间把故事听到最后才说再见
你送我的眼泪让它留在雨天越过你划的线我定了勇气的终点

WeSinger

WeSinger 2

Singer Name	Data-L	Data-S	Opencpop
Lyrics	《后来》片段栀子花白花瓣落在我蓝色百褶裙上爱你你轻声说我低下头闻见一阵芬芳那个永恒的夜晚十七岁仲夏你吻我的那个夜晚让我往后的时光每当有感叹总想起当天的星光那时候的爱情为什么就能那样简单而又是为什么	《后来》片段总想起当天的星光那时候的爱情为什么就能那样简单而又是为什么人年少时一定要让深爱的人受伤在这相似的深夜里你是否一样也在静静追悔感伤如果当时我们能不那么倔强现在也不那么遗憾你都如何回忆我	《给我一首歌的时间》片段能不能给我一首歌的时间紧紧的把那拥抱变成永远在我的怀里你不用害怕失眠如果你想忘记我也能失忆能不能给我一首歌的时间把故事听到最后才说再见你送我的眼泪让它留在雨天越过你划的线我定了勇气的终点
WeSinger
WeSinger 2

2. Selected predicted samples with ground-truth duration from WeSinger 2

Lyrics 《传奇》片段

只是因为在人群中多看了你一眼
再也没能忘掉你容颜
梦想着偶然能有一天再相见
从此我开始孤单思念
《匆匆那年》片段

匆匆那年我们究竟说了几遍再见之后再拖延
可惜谁有没有爱过不是一场七情上面的雄辩
匆匆那年我们一时匆忙撂下难以承受的诺言
只有等别人兑现不怪那吻痕还没积累成茧
拥抱着冬眠也没能羽化再成仙
不怪这一段情没空反复再排练
是岁月宽容恩赐反悔的时间
《画心》片段

啦啦啦啦啦啦啦啦啦啦啦啦啦啦啦啦啦啦
啦啦啦啦啦啦啦啦啦啦啦啦啦
啦啦啦啦啦啦啦啦啦啦
看不穿是你失落的魂魄猜不透是你瞳孔的颜色
一阵风一场梦爱如生命般莫测
你的心到底被什么蛊惑
《空山新雨后》片段

山风轻摆尾卷下落花随流水
路过擦拭曾经用你柔情换我的眼泪
当爱恨都败退没谢幕的人啊
井中月举杯砸碎佐一场宿醉
抽签的玫瑰作熏香还能余味
猜测无解答案算了满地也是种浪费
我才终于明白终于明白不能被施舍的是爱
《芒种》片段

一想到你我就呼空恨别梦久呜
烧去纸灰埋烟柳于鲜活的枝丫
凋零下的无暇是收获谜底的代价
余晖沾上远行人的发他洒下手中牵挂于桥下
《默》片段

我被爱判处终身孤寂不还手不放手
笔下画不完的圆心间填不满的缘是你
为何爱判处众生孤寂挣不脱逃不过
眉头解不开的结命中解不开的劫是你

Data-L

Lyrics 《漠河舞厅》片段

如果有时间你会来看一看我吧
看大雪如何衰老的我的眼睛如何融化
如果你看见我的话请转过身去再惊讶
我怕我的眼泪我的白发像羞耻的笑话
我从没有见过极光出现的村落
也没有见过有人在深夜放烟火
晚星就像你的眼睛杀人又放火
你什么都不必说野风惊扰我
《最初的梦想》片段

如果骄傲没被现实大海冷冷拍下
又怎会懂得要多努力才走得到远方
如果梦想不曾坠落悬埃千钧一发
又怎会晓得执着的人拥有隐形翅膀
把眼泪种在心上会开出勇敢的花
可以在疲惫的时光闭上眼睛闻到一种芬芳
就像好好睡了一夜直到天亮
又能边走着边哼着歌用轻快的步伐
《小半》片段

灯火阑珊我的心借了你的光是明是暗
笑自己情绪太泛滥形只影单
自嘲成习惯多敏感又难缠
低头呢喃嗯对你的偏爱太过于明目张胆
在原地打转的小丑伤心不断
空空留遗憾多难堪又为难
释然慵懒尽欢
时间风干后你与我再无关
没答案怎么办看不惯我自我欺瞒
《相见恨晚》片段

看着天空不让泪流下不说一句埋怨
只是心中的感慨万千当作前世来生相欠
你说是我们相见恨晚我说为爱你不够勇敢
我不奢求永远永远太遥远却陷在爱的深渊
你说是我们相见恨晚我说为爱你不够勇敢
在爱与不爱间来回千万遍
哪怕已伤痕累累我也不管~~
你说是我们相见恨晚我说为爱你不够勇敢
我不奢求永远永远太遥远却陷在爱的深渊
你说是我们相见恨晚我说为爱你不够勇敢
在爱与不爱间来回千万遍哪怕已伤痕累累
我也不管哈~~

Opencpop

3. Selected predicted samples with predicted duration from WeSinger 2

To show the robustness and performance, here we do not use ground-truth duration for length-regulator, we use predicted duration instead.

Lyrics 《我的歌声里》片段

没有一点点防备也没有一丝顾虑
你就这样出现在我的世界里
带给我惊喜情不自已可是你偏又这样
在我不知不觉中悄悄的消失
从我的世界里没有音讯剩下的只是回忆
你存在我深深的脑海里
我的梦里我的心里我的歌声里
你存在我深深的脑海里
我的梦里我的心里我的歌声里
《小半》片段

不敢回看左顾右盼不自然的暗自喜欢
偷偷搭讪总没完地坐立难安试探说晚安多空泛又心酸
低头呢喃对你的偏爱太过于明目张胆在原地打转的小丑伤心不断
空空留遗憾多难堪又为难释然慵懒尽欢
时间风干后你与我再无关没答案怎么办看不惯自我欺瞒
纵容着喜欢的讨厌的宠溺的厌倦的一个个慢慢黯淡
纵容着任性的随意的放肆的轻易的将所有欢脱倾翻
不应该太心软不大胆太死板不果断玩弄着肆无忌惮
不应该舍弃了死心了放手了断念了无可奈何不耐烦
不算
《遇见》片段

听见冬天的离开我在某年某月醒过来
我想我等我期待未来却不能因此安排
阴天傍晚车窗外未来有一个人在等待
向左向右向前看爱要拐几个弯才来
我遇见谁会有怎样的对白我等的人他在多远的未来
我听见风来自地铁和人海我排著队拿著爱的号码牌
《最初的梦想》片段

沮丧时总会明显感到孤独的重量
多渴望懂得的人给些温暖借个肩膀
很高兴一路上我们的默契那么长穿过风又绕了弯
心还连着像往常一样最初的梦想紧握在手上最想要去的地方
怎么能在半路就返航最初的梦想绝对会到达实现了真的渴望
才能够算到过了天堂
《年轮》片段

数着一圈圈年轮我认真将心事都封存
密密麻麻是我的自尊
修改一次次离分我承认曾幻想过永恒
可惜从没人陪我演这剧本
圆圈勾勒成指纹印在我的嘴唇回忆苦涩的吻痕是树根
春去秋来的茂盛却遮住了黄昏寒夜剩我一个人等清晨
世间最毒的仇恨是有缘却无分可惜你从未心疼我的笨
荒草丛生的青春倒也过的安稳代替你陪着我的是年轮

Data-L

4. Selected predicted samples with predicted duration and BGM from WeSinger 2

To show the robustness and performance, here we do not use ground-truth duration for length-regulator, we use predicted duration to match BGM instead.

Lyrics 《莫斯科没有眼泪》+ BGM
冬天的离别在莫斯科的深夜一列列军队在街上森严戒备这里没人察觉谁又爱上了谁因为苦难不许人崩溃
感情上若习惯防备寂寞就多一道墙围爱情隐隐约约提醒我这一回再不拥抱就是罪莫斯科没有眼泪大雪纷飞
你冷的好憔悴单身的我原本以为可以一辈子不跟谁莫斯科没有眼泪我却流泪不住哭的赞美让我付出不怕心碎是你最好的美
莫斯科没有眼泪我却流泪不住哭的赞美让我付出不怕心碎是你最好的美爱在最古老的国界再不求能全身而退

Data-L

Lyrics	《莫斯科没有眼泪》+ BGM 冬天的离别在莫斯科的深夜一列列军队在街上森严戒备这里没人察觉谁又爱上了谁因为苦难不许人崩溃感情上若习惯防备寂寞就多一道墙围爱情隐隐约约提醒我这一回再不拥抱就是罪莫斯科没有眼泪大雪纷飞你冷的好憔悴单身的我原本以为可以一辈子不跟谁莫斯科没有眼泪我却流泪不住哭的赞美让我付出不怕心碎是你最好的美莫斯科没有眼泪我却流泪不住哭的赞美让我付出不怕心碎是你最好的美爱在最古老的国界再不求能全身而退
Data-L

5. Only for research use: user-modified lyrics and musical scores with predicted duration from WeSinger 2

To show the robustness and performance, here we do not use ground-truth duration for length-regulator, we use predicted duration to match BGM instead.

Lyrics user-modified case 1

ji shi wan shang shui shuo
zai di qiu ling yi duan
ruo neng gou gei bi ye shen me dou hui zhi de qu zuo
user-modified case 2

ji shi wan shang shui shuo
zai di qiu de ling yi duan
ruo neng gou gei bi ye shen me dou hui xiang qu zuo
user-modified whole song + BGM

Data-L

Lyrics	《传奇》片段只是因为在人群中多看了你一眼再也没能忘掉你容颜梦想着偶然能有一天再相见从此我开始孤单思念	《匆匆那年》片段匆匆那年我们究竟说了几遍再见之后再拖延可惜谁有没有爱过不是一场七情上面的雄辩匆匆那年我们一时匆忙撂下难以承受的诺言只有等别人兑现不怪那吻痕还没积累成茧拥抱着冬眠也没能羽化再成仙不怪这一段情没空反复再排练是岁月宽容恩赐反悔的时间	《画心》片段啦啦啦啦啦啦啦啦啦啦啦啦啦啦啦啦啦啦啦啦啦啦啦啦啦啦啦啦啦啦啦啦啦啦啦啦啦啦啦啦啦看不穿是你失落的魂魄猜不透是你瞳孔的颜色一阵风一场梦爱如生命般莫测你的心到底被什么蛊惑	《空山新雨后》片段山风轻摆尾卷下落花随流水路过擦拭曾经用你柔情换我的眼泪当爱恨都败退没谢幕的人啊井中月举杯砸碎佐一场宿醉抽签的玫瑰作熏香还能余味猜测无解答案算了满地也是种浪费我才终于明白终于明白不能被施舍的是爱
Data-L
Lyrics	《漠河舞厅》片段如果有时间你会来看一看我吧看大雪如何衰老的我的眼睛如何融化如果你看见我的话请转过身去再惊讶我怕我的眼泪我的白发像羞耻的笑话我从没有见过极光出现的村落也没有见过有人在深夜放烟火晚星就像你的眼睛杀人又放火你什么都不必说野风惊扰我	《最初的梦想》片段如果骄傲没被现实大海冷冷拍下又怎会懂得要多努力才走得到远方如果梦想不曾坠落悬埃千钧一发又怎会晓得执着的人拥有隐形翅膀把眼泪种在心上会开出勇敢的花可以在疲惫的时光闭上眼睛闻到一种芬芳就像好好睡了一夜直到天亮又能边走着边哼着歌用轻快的步伐	《小半》片段灯火阑珊我的心借了你的光是明是暗笑自己情绪太泛滥形只影单自嘲成习惯多敏感又难缠低头呢喃嗯对你的偏爱太过于明目张胆在原地打转的小丑伤心不断空空留遗憾多难堪又为难释然慵懒尽欢时间风干后你与我再无关没答案怎么办看不惯我自我欺瞒	《相见恨晚》片段看着天空不让泪流下不说一句埋怨只是心中的感慨万千当作前世来生相欠你说是我们相见恨晚我说为爱你不够勇敢我不奢求永远永远太遥远却陷在爱的深渊你说是我们相见恨晚我说为爱你不够勇敢在爱与不爱间来回千万遍哪怕已伤痕累累我也不管~~ 你说是我们相见恨晚我说为爱你不够勇敢我不奢求永远永远太遥远却陷在爱的深渊你说是我们相见恨晚我说为爱你不够勇敢在爱与不爱间来回千万遍哪怕已伤痕累累我也不管哈~~
Opencpop