Name		Name	Last commit message	Last commit date
parent directory ..
configs		configs
cpp_infer_ppyoloe		cpp_infer_ppyoloe
README.md		README.md
eval.py		eval.py
keypoint_utils.py		keypoint_utils.py
onnxruntime_eval.py		onnxruntime_eval.py
paddle_inference_eval.py		paddle_inference_eval.py
post_process.py		post_process.py
run.py		run.py

README.md

目标检测模型自动压缩示例

1.简介
2.Benchmark
3.开始自动压缩
4.预测部署
5.FAQ

1. 简介

本示例将以目标检测模型PP-YOLOE为例，介绍如何使用PaddleDetection中Inference部署模型进行自动压缩。本示例使用的自动压缩策略为量化蒸馏。

2.Benchmark

PP-YOLOE

模型	Base mAP	离线量化mAP	ACT量化mAP	TRT-FP32	TRT-FP16	TRT-INT8	配置文件	量化模型
PP-YOLOE-l	50.9	-	50.6	11.2ms	7.7ms	6.7ms	config	Model
PP-YOLOE-s	43.1	41.2	42.6	6.51ms	2.77ms	2.12ms	config	Model

mAP的指标均在COCO val2017数据集中评测得到，IoU=0.5:0.95。
PP-YOLOE-l模型在Tesla V100的GPU环境下测试，并且开启TensorRT，batch_size=1，包含NMS，测试脚本是benchmark demo。
PP-YOLOE-s模型在Tesla T4，TensorRT 8.4.1，CUDA 11.2，batch_size=1，不包含NMS，测试脚本是cpp_infer_ppyoloe。

SSD on Pascal VOC

模型	Box AP	ACT量化Box AP	TRT-FP32	TRT-INT8	配置文件	量化模型
SSD-MobileNetv1	73.8	73.52	4.0ms	1.7ms	config	Model

测速环境：Tesla T4，TensorRT 8.4.1，CUDA 11.2，batch_size=1，包含NMS.

3. 自动压缩流程

3.1 准备环境

PaddlePaddle >= 2.3 （可从Paddle官网下载安装）
PaddleSlim >= 2.3
PaddleDet >= 2.4
opencv-python

安装paddlepaddle：

# CPU
pip install paddlepaddle==2.3.2
# GPU 以Ubuntu、CUDA 11.2为例
python -m pip install paddlepaddle-gpu==2.3.2.post112 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html

安装paddleslim：

pip install paddleslim

安装paddledet：

pip install paddledet

注：安装PaddleDet的目的是为了直接使用PaddleDetection中的Dataloader组件。

3.2 准备数据集

本案例默认以COCO数据进行自动压缩实验，如果自定义COCO数据，或者其他格式数据，请参考PaddleDetection数据准备文档来准备数据。

如果数据集为非COCO格式数据，请修改configs中reader配置文件中的Dataset字段。

以PP-YOLOE模型为例，如果已经准备好数据集，请直接修改[./configs/yolo_reader.yml]中EvalDataset的dataset_dir字段为自己数据集路径即可。

3.3 准备预测模型

预测模型的格式为：model.pdmodel 和 model.pdiparams两个，带pdmodel的是模型文件，带pdiparams后缀的是权重文件。

注：其他像__model__和__params__分别对应model.pdmodel 和 model.pdiparams文件。

根据PaddleDetection文档导出Inference模型，具体可参考下方PP-YOLOE模型的导出示例：

下载代码

git clone https://github.com/PaddlePaddle/PaddleDetection.git

导出预测模型

PPYOLOE-l模型，包含NMS：如快速体验，可直接下载PP-YOLOE-l导出模型

python tools/export_model.py \
        -c configs/ppyoloe/ppyoloe_crn_l_300e_coco.yml \
        -o weights=https://paddledet.bj.bcebos.com/models/ppyoloe_crn_l_300e_coco.pdparams \
        trt=True \

PPYOLOE-s模型，不包含NMS：如快速体验，可直接下载PP-YOLOE-s导出模型

python tools/export_model.py \
        -c configs/ppyoloe/ppyoloe_crn_s_300e_coco.yml \
        -o weights=https://paddledet.bj.bcebos.com/models/ppyoloe_crn_s_300e_coco.pdparams \
        trt=True exclude_post_process=True \

3.4 自动压缩并产出模型

蒸馏量化自动压缩示例通过run.py脚本启动，会使用接口paddleslim.auto_compression.AutoCompression对模型进行自动压缩。配置config文件中模型路径、蒸馏、量化、和训练等部分的参数，配置完成后便可对模型进行量化和蒸馏。具体运行命令为：

单卡训练：

export CUDA_VISIBLE_DEVICES=0
python run.py --config_path=./configs/ppyoloe_l_qat_dis.yaml --save_dir='./output/'

多卡训练：

CUDA_VISIBLE_DEVICES=0,1,2,3 python -m paddle.distributed.launch --log_dir=log --gpus 0,1,2,3 run.py \
          --config_path=./configs/ppyoloe_l_qat_dis.yaml --save_dir='./output/'

4.预测部署

4.1 Paddle Inference 验证性能

量化模型在GPU上可以使用TensorRT进行加速，在CPU上可以使用MKLDNN进行加速。

以下字段用于配置预测参数：

参数名	含义
model_path	inference 模型文件所在目录，该目录下需要有文件 model.pdmodel 和 model.pdiparams 两个文件
reader_config	eval时模型reader的配置文件路径
image_file	如果只测试单张图片效果，直接根据image_file指定图片路径
device	使用GPU或者CPU预测，可选CPU/GPU
use_trt	是否使用 TesorRT 预测引擎
use_mkldnn	是否启用`MKL-DNN`加速库，注意`use_mkldnn`与`use_gpu`同时为`True`时，将忽略`enable_mkldnn`，而使用`GPU`预测
cpu_threads	CPU预测时，使用CPU线程数量，默认10
precision	预测精度，包括`fp32/fp16/int8`

TensorRT预测：

环境配置：如果使用 TesorRT 预测引擎，需安装 WITH_TRT=ON 的Paddle，下载地址：Python预测库

python paddle_inference_eval.py \
      --model_path=models/ppyoloe_crn_l_300e_coco_quant \
      --reader_config=configs/yoloe_reader.yml \
      --use_trt=True \
      --precision=int8

MKLDNN预测：

python paddle_inference_eval.py \
      --model_path=models/ppyoloe_crn_l_300e_coco_quant \
      --reader_config=configs/yoloe_reader.yml \
      --device=CPU \
      --use_mkldnn=True \
      --cpu_threads=10 \
      --precision=int8

模型为PPYOLOE，同时不包含NMS，可以使用C++预测demo进行测速：

进入cpp_infer文件夹内，请按照C++ TensorRT Benchmark测试教程进行准备环境及编译，然后开始测试：
```
# 编译
bash complie.sh
# 执行
./build/trt_run --model_file ppyoloe_s_quant/model.pdmodel --params_file ppyoloe_s_quant/model.pdiparams --run_mode=trt_int8
```

5.FAQ

如果想对模型进行离线量化，可进入Detection模型离线量化示例中进行实验。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

detection

detection

README.md

目标检测模型自动压缩示例

1. 简介

2.Benchmark

PP-YOLOE

SSD on Pascal VOC

3. 自动压缩流程

3.1 准备环境

3.2 准备数据集

3.3 准备预测模型

3.4 自动压缩并产出模型

4.预测部署

4.1 Paddle Inference 验证性能

5.FAQ

Files

detection

Directory actions

More options

Directory actions

More options

Latest commit

History

detection

Folders and files

parent directory

README.md

目标检测模型自动压缩示例

1. 简介

2.Benchmark

PP-YOLOE

SSD on Pascal VOC

3. 自动压缩流程

3.1 准备环境

3.2 准备数据集

3.3 准备预测模型

3.4 自动压缩并产出模型

4.预测部署

4.1 Paddle Inference 验证性能

5.FAQ