Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

数据训练上了么?效果如何? #1

Open
casioexlim opened this issue Dec 28, 2023 · 6 comments
Open

数据训练上了么?效果如何? #1

casioexlim opened this issue Dec 28, 2023 · 6 comments

Comments

@casioexlim
Copy link

hi:
看到你的数据从火山引擎上爬取下来的,
你的数据训练上了么?效果如何?

@Jackiexiao
Copy link
Owner

还没有,有空的时候会弄一下

@casioexlim
Copy link
Author

casioexlim commented Jan 2, 2024

韵律边界预测:
2024-01-02 11-23-53屏幕截图
多音字预测:
2024-01-02 11-24-09屏幕截图
我这边用你的数据跑了下,性能尚可。

@casioexlim
Copy link
Author

还没有,有空的时候会弄一下
标贝开源的TN只有3w句的量级,似乎不够多,
后面会爬取一些TN的数据么?
这样我们可以把TN用模型也给解决了。

@Jackiexiao
Copy link
Owner

对,英文有这样的 TN 数据,中文获得这样的数据可能会比较困难。不过字节 API 中应该也能拿到 TN 的标注。

你表格中使用的测试集和代码是什么?可否分享一下,我后期有空做的话,应该是基于 wetts 的 frontend 做个 baseline @casioexlim

@casioexlim
Copy link
Author

对,英文有这样的 TN 数据,中文获得这样的数据可能会比较困难。不过字节 API 中应该也能拿到 TN 的标注。

你表格中使用的测试集和代码是什么?可否分享一下,我后期有空做的话,应该是基于 wetts 的 frontend 做个 baseline @casioexlim

这个私聊。方便的话可以提供下微信么?正好可以和你交流下。

@Jackiexiao
Copy link
Owner

Jackiexiao commented Jan 3, 2024

ok

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants