default.mp4
python 3.8.16 torch 1.11.0+cu113~ paddlenlp 2.5.1 paddlepaddle-gpu 2.3.2 transformer 2.6.0
知识种子图图谱模型:paddlenlp-model-zoo-uie 所用模型类型:'information extraction'
训练集占比:50% 验证集占比:10% 测试集占比:40%
初始数据:《舰艇损管和潜水技术》 扩充数据:《舰船损管技术》等
利用doccanco标注不同类型的数据大约100条作为微调uie的初始数据,在uie进行初次抽取后,针对数据中效果较差的部分进行二次标注微调。