方言识别质量非常差 #33

dfengpo · 2024-06-29T07:15:21Z

我用一条包括粤语，普通话的录音进行识别
出来的结果质量非常差，出现英文单词的频率比较高，但是实际根本没有英文

TTTdas · 2024-07-05T01:42:32Z

我用一条包括粤语，普通话的录音进行识别出来的结果质量非常差，出现英文单词的频率比较高，但是实际根本没有英文

如果您用的是开源出来的那个微调模型，确实不太支持粤语哈。那个模型就是简单的在kespeech上微调的，里面不包含粤语的标注数据

rookie0607 · 2024-07-10T08:57:56Z

我用一条包括粤语，普通话的录音进行识别出来的结果质量非常差，出现英文单词的频率比较高，但是实际根本没有英文

如果您用的是开源出来的那个微调模型，确实不太支持粤语哈。那个模型就是简单的在kespeech上微调的，里面不包含粤语的标注数据

v2版本会有大动作吧

TTTdas · 2024-07-10T09:09:27Z

我用一条包括粤语，普通话的录音进行识别出来的结果质量非常差，出现英文单词的频率比较高，但是实际根本没有英文

如果您用的是开源出来的那个微调模型，确实不太支持粤语哈。那个模型就是简单的在kespeech上微调的，里面不包含粤语的标注数据

v2版本会有大动作吧

后面马上就会陆续开源在有监督数据上微调后的模型，方便直接使用

rookie0607 · 2024-07-10T09:17:40Z

我用一条包括粤语，普通话的录音进行识别出来的结果质量非常差，出现英文单词的频率比较高，但是实际根本没有英文

如果您用的是开源出来的那个微调模型，确实不太支持粤语哈。那个模型就是简单的在kespeech上微调的，里面不包含粤语的标注数据

v2版本会有大动作吧

后面马上就会陆续开源在有监督数据上微调后的模型，方便直接使用

期待ing~

miaohuil · 2024-12-17T11:40:11Z

v2版本预计什么时候出来？https://www.teleagi.cn/child-televoice/voiceIdentify 这里面用的方言识别是哪个版本？现有版本对四川话支持如何？

TTTdas · 2024-12-23T11:42:30Z

v2版本预计什么时候出来？https://www.teleagi.cn/child-televoice/voiceIdentify 这里面用的方言识别是哪个版本？现有版本对四川话支持如何？

v2版本暂时不会开源了，可能要等后续其他模型一起开源。这个链接里是我们内部微调的模型，可以认为是v1.5版本。现有版本对四川话支持还是挺不错的，您可以在这个网站上面体验超多方言混说的效果~

csukuangfj · 2024-12-24T02:18:24Z

可能要等后续其他模型一起开源

期待

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

方言识别质量非常差 #33

方言识别质量非常差 #33

dfengpo commented Jun 29, 2024

TTTdas commented Jul 5, 2024

rookie0607 commented Jul 10, 2024

TTTdas commented Jul 10, 2024

rookie0607 commented Jul 10, 2024

miaohuil commented Dec 17, 2024

TTTdas commented Dec 23, 2024

csukuangfj commented Dec 24, 2024

方言识别质量非常差 #33

方言识别质量非常差 #33

Comments

dfengpo commented Jun 29, 2024

TTTdas commented Jul 5, 2024

rookie0607 commented Jul 10, 2024

TTTdas commented Jul 10, 2024

rookie0607 commented Jul 10, 2024

miaohuil commented Dec 17, 2024

TTTdas commented Dec 23, 2024

csukuangfj commented Dec 24, 2024