FAQ(常见问题)

Q: 为什么我使用单GPU训练loss会出NaN?
A: 配置文件中原始学习率是适配多GPU训练(8x GPU)，若使用单GPU训练，须对应调整学习率（例如，除以8）。以faster_rcnn_r50 为例,在静态图下计算规则表如下所示，它们是等价的，表中变化节点即为piecewise decay里的boundaries: