Skip to content

Latest commit

 

History

History
131 lines (93 loc) · 5.01 KB

File metadata and controls

131 lines (93 loc) · 5.01 KB

English | 简体中文

MS-TCN 视频动作分割模型


内容

模型简介

MS-TCN模型是视频动作分割模型的经典的模型,发表在2019年的CVPR上。我们对官方实现的pytorch代码进行一些优化,在PaddleVideo获得了更高精度的结果。


MS-TCN Overview

数据准备

MS-TCN的训练数据可以选择50salads、breakfast、gtea三个数据集,数据下载及准备请参考视频动作分割数据集

模型训练

数据准备完毕后,可以通过如下方式启动训练:

# gtea数据集
export CUDA_VISIBLE_DEVICES=3
python3.7 main.py  --validate -c configs/segmentation/ms_tcn/ms_tcn_gtea.yaml --seed 1538574472
  • 从头开始训练,使用上述启动命令行或者脚本程序即可启动训练,不需要用到预训练模型,视频动作分割模型通常为全卷积网络,由于视频的长度不一,故视频动作分割模型的batch_size字段通常设为1,即不需要批量训练,目前也仅支持单样本训练

模型测试

可通过如下方式进行模型测试:

python main.py  --test -c configs/segmentation/ms_tcn/ms_tcn_gtea.yaml --weights=./output/MSTCN/MSTCN_split_1.pdparams
  • 指标的具体实现是参考MS-TCN作者evel.py提供的测试脚本,计算Acc、Edit和F1分数。

  • 数据集的评估方法采用MS-TCN论文中的折交验证方法,而折交的划分方式与MS-TCN论文中相同。

在Breakfast数据集下评估精度如下(采用4折交验证):

Model Acc Edit [email protected] [email protected] [email protected]
paper 66.3% 61.7% 48.1% 48.1% 37.9%
paddle 65.2% 61.5% 53.7% 49.2% 38.8%

在50salads数据集下评估精度如下(采用5折交验证):

Model Acc Edit [email protected] [email protected] [email protected]
paper 80.7% 67.9% 76.3% 74.0% 64.5%
paddle 81.1% 71.5% 77.9% 75.5% 66.5%

在gtea数据集下评估精度如下(采用4折交验证):

Model Acc Edit [email protected] [email protected] [email protected]
paper 79.2% 81.4% 87.5% 85.4% 74.6%
paddle 76.9% 81.8% 86.4% 84.7% 74.8%

给出在gtea数据集下的折交的模型权重

Test_Data [email protected] checkpoints
gtea_split1 70.2509 MSTCN_gtea_split_1.pdparams
gtea_split2 70.7224 MSTCN_gtea_split_2.pdparams
gtea_split3 80.0 MSTCN_gtea_split_3.pdparams
gtea_split4 78.1609 MSTCN_gtea_split_4.pdparams

模型推理

导出inference模型

python3.7 tools/export_model.py -c configs/segmentation/ms_tcn/ms_tcn_gtea.yaml \
                                -p data/MSTCN_gtea_split_1.pdparams \
                                -o inference/MSTCN

上述命令将生成预测所需的模型结构文件MSTCN.pdmodel和模型权重文件MSTCN.pdiparams

使用预测引擎推理

输入预测模型的txt文件为需要预测的文件列表,如:

S1_Cheese_C1.npy
S1_CofHoney_C1.npy
S1_Coffee_C1.npy
S1_Hotdog_C1.npy
...
python3.7 tools/predict.py --input_file data/gtea/splits/test.split1.bundle \
                           --config configs/segmentation/ms_tcn/ms_tcn_gtea.yaml \
                           --model_file inference/MSTCN/MSTCN.pdmodel \
                           --params_file inference/MSTCN/MSTCN.pdiparams \
                           --use_gpu=True \
                           --use_tensorrt=False

输出示例如下:

result write in : ./inference/infer_results/S1_Cheese_C1.txt
result write in : ./inference/infer_results/S1_CofHoney_C1.txt
result write in : ./inference/infer_results/S1_Coffee_C1.txt
result write in : ./inference/infer_results/S1_Hotdog_C1.txt
result write in : ./inference/infer_results/S1_Pealate_C1.txt
result write in : ./inference/infer_results/S1_Peanut_C1.txt
result write in : ./inference/infer_results/S1_Tea_C1.txt

参考论文