Skip to content

该项目是为了使用layoutlmv3针对中文图片训练和推理。 其中主要解决三个问题: 1.数据标准化成可以的训练数据集格式 2.layoutlmv3-base-chinese 分词修改 2.超过512长度的文本切分和滑窗操作

Notifications You must be signed in to change notification settings

tianchiguaixia/layoutlmv3-chinese

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

15 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

layoutlmv3 中文表单图片信息抽取

背景

该项目是为了使用layoutlmv3针对中文图片训练和推理。 其中主要解决三个问题:

  • 1.数据标准化成可以的训练数据集格式
  • 2.layoutlmv3-base-chinese 分词修改
  • 2.超过512长度的文本切分和滑窗操作

数据来源

https://github.com/doc-analysis/XFUND/releases/tag/v1.0 image

图片样例

image

代码结构

├── processing.py     # 数据处理
├── training.py       # 模型训练
├── inference.py       #模型推理

模型训练

image

模型推理效果

1 (5)

About

该项目是为了使用layoutlmv3针对中文图片训练和推理。 其中主要解决三个问题: 1.数据标准化成可以的训练数据集格式 2.layoutlmv3-base-chinese 分词修改 2.超过512长度的文本切分和滑窗操作

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages