English | 简体中文
Kinetics-400是视频领域benchmark常用数据集,详细介绍可以参考其官方网站Kinetics。下载方式可参考官方地址ActivityNet,使用其提供的下载脚本下载数据集。
考虑到K400数据集下载困难的问题,我们提供了两种下载方式: (1) 百度网盘下载 (2) 脚本下载
网盘链接:https://pan.baidu.com/s/1S_CGBjWOUAuxL_cCX5kMPg 提取码:ppvi
- 下载训练集链接列表文件train_link.list和验证集链接列表文件val_link.list。
编写下载脚本download.sh
如下:
file=$1
while read line
do
wget "$line"
done <$file
下载训练集命令:
bash download.sh train_link.list
下载验证集命令:
bash download.sh val_link.list
类别 | 数据条数 | list文件 |
---|---|---|
训练集 | 234619 | train.list |
验证集 | 19761 | val.list |
-
下载后自行解压,并将数据路径添加到相应的list文件中。
-
由于部分视频原始链接失效,数据有部分缺失,全部文件大概需要135G左右的存储空间,PaddleVideo使用的也是这份数据。
此份数据仅限于学术研究,若对您有帮助,欢迎给项目star~
为了加速网络的训练过程,我们首先对视频文件(K400视频文件为mp4格式)提取帧 (frames)。相对于直接通过视频文件进行网络训练的方式,frames的方式能够极大加快网络训练的速度。
输入如下命令,即可提取K400视频文件的frames
python extract_rawframes.py ./videos/ ./rawframes/ --level 2 --ext mp4
视频文件frames提取完成后,会存储在指定的./rawframes
路径下,大小约为2T左右。
类别 | 数据条数 | list文件 |
---|---|---|
训练集 | 234619 | train_frames.list |
验证集 | 19761 | val_frames.list |