PGnet魔改后如何训练 #14558
ChenControl
started this conversation in
Ideas & Features
PGnet魔改后如何训练
#14558
Replies: 1 comment 1 reply
-
PGnet 魔改后如何训练分为以下几个步骤,根据你的问题逐步解答: 问题1:合成训练过程中的 config 配置参考,尤其是预训练学习率(lr)设置根据提供的文档,PGNet 的训练分为两步:
配置参考
配置文件调整在 PaddleOCR 的配置文件中,调整如下: lr:
name: Cosine
learning_rate: 0.00001 # 初始学习率设置为 1e-5
warmup_epoch: 2 # 可设置 warmup 为 2 个 epoch 此外,注意保证以下参数与合成数据训练需求一致:
问题2:如何对固定输入的模型进行预处理?你提到 SynthText 图像整体较扁平,且垂直和水平宽高比与输入尺寸(128×128)不匹配的问题。 预处理方案
其他相关建议
总结
希望以上内容能帮助你顺利完成 PGNet 的魔改训练!如果还有具体问题,欢迎补充! Response generated by feifei-bot | chatgpt-4o-latest |
Beta Was this translation helpful? Give feedback.
1 reply
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
-
各位,大家好。
原来的Pgnet的backbone采用的是resnet,并且通道数比较多,为了便于部署,特地采用了较小的resnet进行取代,同时以前输入的dynamic dimension的CHW全部进行了固定,如下图所示,输入: float32[DynamicDimension.0,3,128,128]
参考 https://paddlepaddle.github.io/PaddleOCR/main/algorithm/end_to_end/algorithm_e2e_pgnet.html
如上文所述
PGNet训练分为两个步骤:step1: 在合成数据上训练,得到预训练模型,此时模型精度依然较低;step2: 加载预训练模型,在totaltext数据集上训练;为快速训练,我们直接提供了step1的预训练模型。
问题1,在合成训练过程中的config配置能否借鉴一下进行参考,尤其预训练lr要1e-5左右有看到过提示。
问题2,如何对固定输入的模型进行预处理?
之所以问这个问题是发现SynthText图像都很扁平,当垂直和水平宽高比与输入尺寸不匹配时如何处理?是强制调整大小吗?
谢谢!
Beta Was this translation helpful? Give feedback.
All reactions