Skip to content

Latest commit

 

History

History
181 lines (130 loc) · 7.12 KB

File metadata and controls

181 lines (130 loc) · 7.12 KB

repvgg_a2_imagenet

模型名称 repvgg_a2_imagenet
类别 图像-图像分类
网络 RepVGG
数据集 ImageNet-2012
是否支持Fine-tuning
模型大小 163MB
指标 -
最新更新日期 2021-09-14

一、模型基本信息

  • 模型介绍

    • RepVGG(Making VGG-style ConvNets Great Again)系列模型是清华大学(丁桂光团队)、旷视科技(孙建等)、香港科技大学和阿伯里斯特威斯大学于2021年提出的一种简单但功能强大的卷积神经网络架构。有一个类似于 VGG 的推理时间代理。主体由3x3卷积和relu stack组成,而训练时间模型具有多分支拓扑。训练时间和推理时间的解耦是通过重新参数化技术实现的,因此该模型被称为repvgg。

二、安装

三、模型API预测

  • 1.命令行预测

    $ hub run repvgg_a2_imagenet --input_path "/PATH/TO/IMAGE" --top_k 5
  • 2.预测代码示例

    import paddle
    import paddlehub as hub
    if __name__ == '__main__':
        model = hub.Module(name='repvgg_a2_imagenet')
        result = model.predict(['flower.jpg'])
  • 3.如何开始Fine-tune

    • 在完成安装PaddlePaddle与PaddleHub后,通过执行python train.py即可开始使用repvgg_a2_imagenet对Flowers等数据集进行Fine-tune。

    • 代码步骤

      • Step1: 定义数据预处理方式

        • import paddlehub.vision.transforms as T
          transforms = T.Compose([T.Resize((256, 256)),
                                T.CenterCrop(224),
                                T.Normalize(mean=[0.485, 0.456, 0.406], std = [0.229, 0.224, 0.225])],
                                to_rgb=True)
          • transforms 数据增强模块定义了丰富的数据预处理方式,用户可按照需求替换自己需要的数据预处理方式。
      • Step2: 下载数据集并使用

        • from paddlehub.datasets import Flowers
          flowers = Flowers(transforms)
          flowers_validate = Flowers(transforms, mode='val')
          • transforms: 数据预处理方式。

          • mode: 选择数据模式,可选项有 train, test, val, 默认为train

          • 数据集的准备代码可以参考 flowers.pyhub.datasets.Flowers() 会自动从网络下载数据集并解压到用户目录下$HOME/.paddlehub/dataset目录。

      • Step3: 加载预训练模型

        • model = hub.Module(name="repvgg_a2_imagenet", label_list=["roses", "tulips", "daisy", "sunflowers", "dandelion"])
          • name: 选择预训练模型的名字。
          • label_list: 设置输出分类类别,默认为Imagenet2012类别。
      • Step4: 选择优化策略和运行配置

        optimizer = paddle.optimizer.Adam(learning_rate=0.001, parameters=model.parameters())
        trainer = Trainer(model, optimizer, checkpoint_dir='img_classification_ckpt')
        trainer.train(flowers, epochs=100, batch_size=32, eval_dataset=flowers_validate, save_interval=1)
        • 运行配置

        • Trainer 主要控制Fine-tune的训练,包含以下可控制的参数:

          • model: 被优化模型;
          • optimizer: 优化器选择;
          • use_vdl: 是否使用vdl可视化训练过程;
          • checkpoint_dir: 保存模型参数的地址;
          • compare_metrics: 保存最优模型的衡量指标;
        • trainer.train 主要控制具体的训练过程,包含以下可控制的参数:

          • train_dataset: 训练时所用的数据集;
          • epochs: 训练轮数;
          • batch_size: 训练的批大小,如果使用GPU,请根据实际情况调整batch_size;
          • num_workers: works的数量,默认为0;
          • eval_dataset: 验证集;
          • log_interval: 打印日志的间隔, 单位为执行批训练的次数。
          • save_interval: 保存模型的间隔频次,单位为执行训练的轮数。
    • 模型预测

      • 当完成Fine-tune后,Fine-tune过程在验证集上表现最优的模型会被保存在${CHECKPOINT_DIR}/best_model目录下,其中${CHECKPOINT_DIR}目录为Fine-tune时所选择的保存checkpoint的目录。 我们使用该模型来进行预测。predict.py脚本如下:

        • import paddle
          import paddlehub as hub
          if __name__ == '__main__':
              model = hub.Module(name='repvgg_a2_imagenet', label_list=["roses", "tulips", "daisy", "sunflowers", "dandelion"], load_checkpoint='/PATH/TO/CHECKPOINT')
              result = model.predict(['flower.jpg'])
        • NOTE: 进行预测时,所选择的module,checkpoint_dir,dataset必须和Fine-tune所用的一样。

四、服务部署

  • PaddleHub Serving可以部署一个在线分类任务服务。

  • 第一步:启动PaddleHub Serving

    • 运行启动命令:

    • $ hub serving start -m repvgg_a2_imagenet
    • 这样就完成了一个分类任务服务化API的部署,默认端口号为8866。

    • NOTE: 如使用GPU预测,则需要在启动服务之前,请设置CUDA_VISIBLE_DEVICES环境变量,否则不用设置。

  • 第二步:发送预测请求

    • 配置好服务端,以下数行代码即可实现发送预测请求,获取预测结果

      import requests
      import json
      import cv2
      import base64
      import numpy as np
      def cv2_to_base64(image):
          data = cv2.imencode('.jpg', image)[1]
          return base64.b64encode(data.tostring()).decode('utf8')
      def base64_to_cv2(b64str):
          data = base64.b64decode(b64str.encode('utf8'))
          data = np.fromstring(data, np.uint8)
          data = cv2.imdecode(data, cv2.IMREAD_COLOR)
          return data
      # 发送HTTP请求
      org_im = cv2.imread('/PATH/TO/IMAGE')
      data = {'images':[cv2_to_base64(org_im)], 'top_k':2}
      headers = {"Content-type": "application/json"}
      url = "http://127.0.0.1:8866/predict/repvgg_a2_imagenet"
      r = requests.post(url=url, headers=headers, data=json.dumps(data))
      data =r.json()["results"]['data']

五、更新历史

  • 1.0.0

    初始发布