qingliucs / datasets Goto Github PK

View Code? Open in Web Editor NEW

This project forked from zhaoyang97/datasets

0.0 1.0 0.0 27 KB

Python 100.00%

datasets's Introduction

简介

本项目旨在减少收集各种数据集的时间成本，提供各种数据集的配置文件及其获取方式，数据集已开放在Titan_Xp_4的目录/root/commonfile/data

可在mmlab系列框架上使用
如果用其他框架，任然可以使用本项目的提供的方式获取数据集

目前已支持以下数据集：

分类

imagenet

目标检测

语义分割

使用方法

以mmdetection为例，介绍配置coco数据集的方式：

1. 添加配置文件

将coco_detection.py放到目录pathto/mmdetection/configs/_base_/datasets/下

2. 在mmdetection的同级目录下创建data文件夹

pathto
├── data
├── mmdetection
│   ├── mmdet
│   ├── tools
│   ├── configs
│   │   ├── _base_
│   │   │   ├── datasets

3. 传数据集到data目录

从xp4上获取coco数据集

scp -P your_port -r [email protected]:/root/commonfile/data/coco pathto/data/

把your_port换成Titan_Xp_4账号对应的端口，pathto/data/换成第二步中新建的data文件夹目录。

获取数据集

除tct相关数据集外，其余数据集均可通过以下命令获取：

scp -P your_port -r [email protected]:/root/commonfile/data/dataset_floder pathto/data/

把your_port换成Titan_Xp_4账号对应的端口，pathto/data/换成第二步中新建的data文件夹目录，dataset_floder换成数据集的文件夹名，各个数据集对应的文件夹名如下：
数据集：对应的dataset_floder

imagenet: imagenet
coco: coco
voc: voc0712
tct 30000: TCT_30000
ade20k: ade20k
cityscapes：cityscapes
pascal context：voc0712
ddr：DDR
idrid: IDRID

获取tct数据集

实验室的tct数据集

tct的小数据集tct 30000可以通过上一节提供的方式获取，完整的tct数据集获取方式如下：

scp -P your_port -r [email protected]:/root/commonfile/data/TCTAnnotatedData pathto/data/

阿里天池tct数据集

scp -P 19230 -r [email protected]:/root/userfolder/tianchi/zipdata pathto/data/

天池数据集在rtx2080 03，@冯硕的个人账号中，密码请咨询冯硕。

说明

DDR&IDRiD

提供的DDR和IDRiD数据集是做过数据增广后的数据集，包括旋转90°、180°、270°、水平翻转、垂直翻转，算上原图一共是6倍。
这两个数据集是自定义的数据集，如使用mmlab系列框架，需要注册数据集，流程如下：
将lesion_dataset.py和custom.py添加到目录mmsegmentation/mmseg/datasets，并在该目录下的__init__.py文件中添加from .lesion_dataset import LesionDataset, __all__中添加'LesionDataset'.

imagenet

imagenet数据集默认的是8卡、每卡32图，学习率=0.01。使用不同的batchsize，学习率应该按照以下公式设置：
lr = 0.01 * [卡数] * [每卡图像] / (8*32).
例如用8卡、每卡64图，那么学习率应该设为0.01/2=0.005。

致谢

感谢@刘浩天提供的DDR和IDRiD数据集的注册文件
感谢@冯硕提供的阿里天池tct数据集和简化后的TCT_30000数据集

Recommend Projects

qingliucs / datasets Goto Github PK

datasets's Introduction

简介

使用方法

1. 添加配置文件

2. 在mmdetection的同级目录下创建data文件夹

3. 传数据集到data目录

获取数据集

获取tct数据集

实验室的tct数据集

阿里天池tct数据集

说明

DDR&IDRiD

imagenet

致谢

datasets's People

Contributors

Watchers

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent