-
Notifications
You must be signed in to change notification settings - Fork 57
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
请问可以用在中文的多标签文本分类上吗? #6
Comments
你好 @lockingkao 目前还没有支持 multi-label 问题,如果不修改代码可以同时训练多个二分类模型,可能会比较慢,或者根据问题调整代码。 |
@Magicat128 感谢您的回覆 |
@lockingkao 应该是可以的,将标签改为one-hot,softmax改为sigmoid,损失函数可能也要相应改成sigmoid_cross_entropy_with_logits。 |
@Magicat128 你好大神,我已经将标签改为one-hot,softmax改为sigmoid,损失函数改成sigmoid_cross_entropy_with_logits。
|
@lockingkao 抱歉回复晚了。应该是因为y_true中的标签有的没出现在y_pred中,导致指标计算有除0存在,和代码应该没有关系。建议要么解决样本不均衡的问题,要么加上zero_division=1忽略这一问题 https://scikit-learn.org/stable/modules/generated/sklearn.metrics.precision_recall_fscore_support.html |
@Magicat128 但是用相同的前处理,textGCN可以跑! 希望大神能解答,是否 textING无法用中文数据集跑,还有资料平衡的问题. |
请问您在中文训练集上运行成功了吗,我也想把这个模型用到中文数据集上,但是会有错,请问您是怎么解决的? |
我用的是中文多标签文本分类 效果蛮差的 |
我就在两个标签的中文文本分类上尝试了一下,说是维度不一致的问题,感觉应该是语言不一样的事。 |
二元分类的任务的话不用改太多,记得先用 |
我的研究是多标签的文本分类(multi label classification)
类别有九个 但不是多元分类(multi class classification)
例子都是多元分类(multi class classification)
请问有实作在多标签分类(multi label classification)的文本上吗?
The text was updated successfully, but these errors were encountered: