Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

方言识别质量非常差 #33

Open
dfengpo opened this issue Jun 29, 2024 · 7 comments
Open

方言识别质量非常差 #33

dfengpo opened this issue Jun 29, 2024 · 7 comments

Comments

@dfengpo
Copy link

dfengpo commented Jun 29, 2024

我用一条包括粤语,普通话的录音进行识别
出来的结果质量非常差,出现英文单词的频率比较高,但是实际根本没有英文

@TTTdas
Copy link
Contributor

TTTdas commented Jul 5, 2024

我用一条包括粤语,普通话的录音进行识别 出来的结果质量非常差,出现英文单词的频率比较高,但是实际根本没有英文

如果您用的是开源出来的那个微调模型,确实不太支持粤语哈。那个模型就是简单的在kespeech上微调的,里面不包含粤语的标注数据

@rookie0607
Copy link

我用一条包括粤语,普通话的录音进行识别 出来的结果质量非常差,出现英文单词的频率比较高,但是实际根本没有英文

如果您用的是开源出来的那个微调模型,确实不太支持粤语哈。那个模型就是简单的在kespeech上微调的,里面不包含粤语的标注数据

v2版本会有大动作吧

@TTTdas
Copy link
Contributor

TTTdas commented Jul 10, 2024

我用一条包括粤语,普通话的录音进行识别 出来的结果质量非常差,出现英文单词的频率比较高,但是实际根本没有英文

如果您用的是开源出来的那个微调模型,确实不太支持粤语哈。那个模型就是简单的在kespeech上微调的,里面不包含粤语的标注数据

v2版本会有大动作吧

后面马上就会陆续开源在有监督数据上微调后的模型,方便直接使用

@rookie0607
Copy link

我用一条包括粤语,普通话的录音进行识别 出来的结果质量非常差,出现英文单词的频率比较高,但是实际根本没有英文

如果您用的是开源出来的那个微调模型,确实不太支持粤语哈。那个模型就是简单的在kespeech上微调的,里面不包含粤语的标注数据

v2版本会有大动作吧

后面马上就会陆续开源在有监督数据上微调后的模型,方便直接使用

期待ing~

@miaohuil
Copy link

v2版本预计什么时候出来?https://www.teleagi.cn/child-televoice/voiceIdentify 这里面用的方言识别是哪个版本?现有版本对四川话支持如何?

@TTTdas
Copy link
Contributor

TTTdas commented Dec 23, 2024

v2版本预计什么时候出来?https://www.teleagi.cn/child-televoice/voiceIdentify 这里面用的方言识别是哪个版本?现有版本对四川话支持如何?

v2版本暂时不会开源了,可能要等后续其他模型一起开源。这个链接里是我们内部微调的模型,可以认为是v1.5版本。现有版本对四川话支持还是挺不错的,您可以在这个网站上面体验超多方言混说的效果~

@csukuangfj
Copy link

可能要等后续其他模型一起开源

期待

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

5 participants