-
Notifications
You must be signed in to change notification settings - Fork 5.2k
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
【长期】训练克隆特定人声音&finetune #437
Comments
fine-tune的话大概需要多少数据才能使音色比较相似 |
最好是小时级别得 |
完全小白尝试,我想训练比如原神里安柏的声音,但发现训练出来都不像,可能因为声优配音通常都不是平调,会带有很多感情语气吧,不知道收集所有配音做个数据集后再训练会不会好一点?、像 #460 那样进行特化训练?,有模型分享更集中一点的平台吗?自己大概是训练不出来了,碰碰运气搞一搞 |
看起来你都还没训练把? |
是的,我想我得先换个电脑,只不过想事先了解一下可行性,或许还缺了亿点点学习时间 |
我想,配音数据过少的情况下,我或许可以把合成出来的某些句子,依靠自己的听力判断是否相像,挑出其中相像的拿来训练,循环往复,是不是就越来越接近了 |
效率会比较低 可以看下一楼的视频教程 |
您好,请问hifi-gan的电音问题可以通过微调解决吗
|
目前我发现关于文本的标注中的词之间的停顿都没有加入模型进行训练,是这部分不好处理吗。因为现在克隆出的人声停顿还不太好。 |
理论上可以加入的,预处理部分改下代码应该就可以了,有木有兴趣验证一下?可以帮忙找机器跑。另外注意symbols得覆盖停顿标志 |
预处理怎么加入对停顿的处理呢,我目前用%进行停顿标注,在symbols中覆盖了%的标注进行微调。 |
关于克隆特定人声音的问题 1、是用主页提供的模型接着训练,还是自己从零训练好些? 2、自己准备数据集,大概需要多丰富的数据效果才能好? |
+1 同样的疑问,另外还有个问题,是否每个人需要单独训练个合成器了(synthesizer)? |
我是一个小白,请问是只需要训练那个syn吗,还是encoder 和vocoder也要训练,我只想模拟一个人的声音,训练好之后怎么办 |
同样的问题,等更新 |
AyahaShirane
专项训练参照这个视频MockingBird数据集制作教程-手把手教你克隆海子姐的声线_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1dq4y137pH
实测在已有模型基础上训练20K左右就能改变成想要的语音语调了。你如果是想要泛用型台湾口音的话,就尽可能收集更多人的数据集,否则会偏向特定某一个人的口音,而且断句和停顿似乎也会受到新数据集的影响
Reference: #380
The text was updated successfully, but these errors were encountered: