Object_Detection_Dataset_Utils

这是各种目标检测数据集预处理工具脚本集合，主要功能实现各种数据集之间的格式格式转换和VOC数据集各种预处理功能。

环境配置

cv2
xml
json
tqdm
numpy
pycocotools
multiprocessing
pascal_voc_writer

功能介绍

X2VOC

以下脚本是将各种数据集转换成VOC数据集格式的脚本，具体功能如下：

cityscapes2voc.py是利用多线程将Cityscapes数据集转换为VOC数据集格式的脚本；
cityscapes2foggy_cityscapes.py是根据雾深度图像数据集和Cityscapes数据集生成Foggy_Cityscapes数据集；
bdd100k2voc.py是利用多线程将BDD100k数据集转换VOC数据集格式的脚本；
kitti2voc.py是利用多线程将KITTI数据集转换为VOC数据集格式的脚本；
coco2voc.py是利用多线程将COCO数据集转换为VOC数据集格式的脚本；
mot2voc.py是利用多线程将MOT目标跟踪数据集转换为VOC数据集格式的脚本；

VOC相关预处理

以下脚本是对VOC格式数据集进行各种预处理功能，具体功能如下：

delete_voc_dataset_object.py是利用多线程删除VOC格式数据集XML标签文件中指定目标分类以外的所有目标框的脚本；
check_voc_dataset.py是利用多线程检查VOC格式数据集XML文件与图像文件是否一一对应，若不意义对应则删除相关XML文件或图像文件的脚本；
merge_voc_dataset.py是利用多线程将多个VOC格式数据集合并成一个VOC格式数据集的脚本；
random_split_voc_dataset.py是将VOC格式数据集随机划分成训练集和测试集，并生成对应子数据集txt文件的脚本；
raname_voc_dataset_object_label.py是利用多线程将VOC格式数据集中指定分类的目标进行重命名的脚本
video2voc_dataset.py是利用多线程将视频按照指定间隔进行抽帧生成VOC数据集的函数；
get_voc_dataset.py是利用多线程获取VOC格式数据集的目标分类数组的脚本
copy_voc_dataset.py是利用多线程复制VOC格式数据集，并只保留指定目标分类的函数

How to Use

Cityscapes --> VOC

下载Cityscapes数据集并完成解压，其文档结构如下所示：

cityscapes
    - leftImg8bit
        - train
            - city1
                - image1.png
                - image2.png
                - ...
            - city2
            - ...
        - val
        - test
    - gtFine
        - train
            - city1
                - label1.json
                - label2.json
                - ...
            - city2
            - ...
        - val
        - test

根据开发需要修改cityscape_dataset_dir、voc_dataset_dir和class_names,其中cityscape_dataset_dir代表原始Cityscapes数据集目录，voc_dataset_dir代表转换为VOC数据集格式后Cityscapes数据集目录，class_names代表目标名称数组，然后运行如下代码即可生成VOC数据集格式的Cityscapes数据集。

python cityscape2voc.py

Foggy Cityscapes --> VOC

首先下载Cityscapes的数据集和Foggy Cityscapes的图像数据集，并完成两个数据集的解压，Foggy Cityscapes图像数据集文件结构如下所示：

cityscapes_foggy
    - leftImg8bit_trainvaltest_foggy
        - leftImg8bit_foggy
            - train
                - city1
                    - image1_foggy_beta_0.005.png
                    - image1_foggy_beta_0.01.png
                    - image1_foggy_beta_0.02.png
                    - ...
                - city2
                - ...
            - val
            - test

然后根据cityscape2voc.py脚本将Cityscapes数据集转换为VOC数据集格式，最后根据开发需要修改cityscapes_dataset_dir、foggy_cityscapes_dataset_dir、foggy_image_dir和beta，其中beta控制雾浓度，候选值有0.005、0.01和0.02，cityscapes_dataset_dir为VOC数据集格式的Cityscapes数据集目录、foggy_cityscapes_dataset_dir为voc数据集格式的Foggy Cityscapes数据集目录、foggy_image_dir为Foggy Cityscapes图像数据集目录，然后运行如下代码即可生成VOC数据集格式的Foggy Cityscapes数据集。

pyhon cityscapes2foggy_cityscapes.py

BDD100k --> VOC

下载BDD100k数据集并完成解压，其文件结构如下所示：

bdd100k
    - images
        - 10k
        - 100k
            - train
                - image1.png
                - image2.png
                - ...
            - val
            - test
    - labels
        - 10k
        - 100k
            - train
                - label1.json
                - label2.json
                - ...
            - val
            - test

然后根据开发需要修改bdd100k_dataset_dir、voc_dataset_dir、class_names和dataset_type,其中bdd100k_dataset_dir代表原始BDD100k数据集目录，voc_dataset_dir代表VOC数据集格式的BDD100k数据集目录，class_names代表目标名称数组，该参数控制VOC数据集格式的BDD100k数据集包含的目标种类，dataset_type代表数据集类型，候选值有‘all’、‘daytime’和‘night’，‘all’代表转化全部数据，‘daytime’代表转化白天数据，‘night’代表转化夜晚数据。最后运行如下代码即可生成VOC数据集格式的BDD100k数据集。

python bdd100k2voc.py

KITTI --> VOC

首先下载KITTI数据集并完成解压，其文件结构如下所示：

kitti
    - train
        - image_2
            - name1.png
            - name2.png
            - ...
        - label_2
            - name1.txt
            - name2.txt
            - ...
    - test

然后根据开发需要自行修改kitti_dataset_dir、voc_dataset_dir、train_ratio和class_names，其中kitti_dataset_dir为原始KITTI数据集目录路径,voc_dataset_dir为VOC数据集格式的KITTI数据集目录路径,train_ratio为训练集比例，默认为0.8,用于随机划分训练集和验证集使用，class_names为目标名称数组，该参数控制VOC数据集格式的BDD100k数据集包含的目标种类，默认为['Person_sitting',"Pedestrian",'Cyclist',"Truck","Car","Tram","Van"]，最后运行如下命令即可生成VOC数据集格式的KITTI数据集。

python kitti2voc.py

COCO --> VOC

下载COCO数据集并完成解压，其文件结构如下：

coco
    - train
        - name1.jpg
        - name2.jpg
        - ...
    - val
    - annotations
        - instances_train_year.json
        - instances_val_year.json
        - ...

然后根据开发需要自行修改coco_dataset_dir、voc_dataset_dir和year，其中coco_dataset_dir代表原始COCO数据集目录,voc_dataset_dir代表VOC数据集格式的COCO数据集目录,year代表原始COCO数据集的年份, 最后运行如下命令即可生成VOC数据集格式的COCO数据集。

python coco2voc.py

MOT --> VOC

下载MOT数据集并完成解压，其文件结构如下：

MOT
    - train
        - subset_name1
            - det
                - det.txt
            - gt
                - gt.txt
            - img1
                - name1.jpg
                - name2.jpg
                - ...
        - subset_name2
        - ...
    - test
        - subset_name1
            - det
                - det.txt
            - img1
                - name1.jpg
                - name2.jpg
                - ...
        - subset_name2
        - ...

然后根据开发需要自行修改mot_dataste_dir、voc_dataset_dir和type，其中mot_dataset_dir代表原始MOT数据集目录，voc_dataset_dir代表VOC数据集格式的COCO数据集目录，type代表数据集类型，最后运行如下命令即可生成VOC数据集格式的MOT数据集。

python mot2voc.py

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
__init__.py		__init__.py
append_voc_dataset_prefix.py		append_voc_dataset_prefix.py
bdd100k2voc.py		bdd100k2voc.py
check_voc_dataset.py		check_voc_dataset.py
cityscape2voc.py		cityscape2voc.py
cityscapes2foggy_cityscapes.py		cityscapes2foggy_cityscapes.py
coco2voc.py		coco2voc.py
coco_names.txt		coco_names.txt
copy_voc_dataset.py		copy_voc_dataset.py
delete_voc_dataset_object.py		delete_voc_dataset_object.py
get_voc_classes.py		get_voc_classes.py
kitti2voc.py		kitti2voc.py
labelme2voc.py		labelme2voc.py
merge_voc_dataset_v1.py		merge_voc_dataset_v1.py
merge_voc_dataset_v2.py		merge_voc_dataset_v2.py
mot2voc.py		mot2voc.py
random_split_voc_dataset.py		random_split_voc_dataset.py
rename_voc_dataset_object_label.py		rename_voc_dataset_object_label.py
video2voc_dataset.py		video2voc_dataset.py
voc2coco.py		voc2coco.py
voc2labelme.py		voc2labelme.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Object_Detection_Dataset_Utils

环境配置

功能介绍

X2VOC

VOC相关预处理

How to Use

Cityscapes --> VOC

Foggy Cityscapes --> VOC

BDD100k --> VOC

KITTI --> VOC

COCO --> VOC

MOT --> VOC

About

Releases

Packages

Languages

License

Daipuwei/Object_Detection_Dataset_Utils

Folders and files

Latest commit

History

Repository files navigation

Object_Detection_Dataset_Utils

环境配置

功能介绍

X2VOC

VOC相关预处理

How to Use

Cityscapes --> VOC

Foggy Cityscapes --> VOC

BDD100k --> VOC

KITTI --> VOC

COCO --> VOC

MOT --> VOC

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages