Git Product home page Git Product logo

datasets's Introduction

简介

本项目旨在减少收集各种数据集的时间成本,提供各种数据集的配置文件及其获取方式,数据集已开放在Titan_Xp_4的目录/root/commonfile/data

  • 可在mmlab系列框架上使用
  • 如果用其他框架,任然可以使用本项目的提供的方式获取数据集

目前已支持以下数据集:

分类

  • imagenet

目标检测

  • coco
  • voc
  • tct 30000
  • tct
  • tianchi tct

语义分割

  • ade20k
  • cityscapes
  • pascal context
  • ddr
  • idrid

使用方法

以mmdetection为例,介绍配置coco数据集的方式:

1. 添加配置文件

coco_detection.py放到目录pathto/mmdetection/configs/_base_/datasets/下

2. 在mmdetection的同级目录下创建data文件夹

pathto
├── data
├── mmdetection
│   ├── mmdet
│   ├── tools
│   ├── configs
│   │   ├── _base_
│   │   │   ├── datasets

3. 传数据集到data目录

从xp4上获取coco数据集

scp -P your_port -r [email protected]:/root/commonfile/data/coco pathto/data/

把your_port换成Titan_Xp_4账号对应的端口,pathto/data/换成第二步中新建的data文件夹目录。

获取数据集

除tct相关数据集外,其余数据集均可通过以下命令获取:

scp -P your_port -r [email protected]:/root/commonfile/data/dataset_floder pathto/data/

把your_port换成Titan_Xp_4账号对应的端口,pathto/data/换成第二步中新建的data文件夹目录,dataset_floder换成数据集的文件夹名,各个数据集对应的文件夹名如下:
数据集:对应的dataset_floder

  • imagenet: imagenet
  • coco: coco
  • voc: voc0712
  • tct 30000: TCT_30000
  • ade20k: ade20k
  • cityscapes:cityscapes
  • pascal context:voc0712
  • ddr:DDR
  • idrid: IDRID

获取tct数据集

实验室的tct数据集

tct的小数据集tct 30000可以通过上一节提供的方式获取,完整的tct数据集获取方式如下:

scp -P your_port -r [email protected]:/root/commonfile/data/TCTAnnotatedData pathto/data/

阿里天池tct数据集

scp -P 19230 -r [email protected]:/root/userfolder/tianchi/zipdata pathto/data/

天池数据集在rtx2080 03,@冯硕的个人账号中,密码请咨询冯硕。

说明

DDR&IDRiD

提供的DDR和IDRiD数据集是做过数据增广后的数据集,包括旋转90°、180°、270°、水平翻转、垂直翻转,算上原图一共是6倍。
这两个数据集是自定义的数据集,如使用mmlab系列框架,需要注册数据集,流程如下:
lesion_dataset.pycustom.py添加到目录mmsegmentation/mmseg/datasets,并在该目录下的__init__.py文件中添加from .lesion_dataset import LesionDataset, __all__中添加'LesionDataset'.

imagenet

imagenet数据集默认的是8卡、每卡32图,学习率=0.01。 使用不同的batchsize,学习率应该按照以下公式设置:
lr = 0.01 * [卡数] * [每卡图像] / (8*32).
例如用8卡、每卡64图,那么学习率应该设为0.01/2=0.005。

致谢

感谢@刘浩天提供的DDR和IDRiD数据集的注册文件
感谢@冯硕提供的阿里天池tct数据集和简化后的TCT_30000数据集

datasets's People

Contributors

zhaoyang97 avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.