Git Product home page Git Product logo

china-geospatial-data's People

Contributors

core-man avatar covmat avatar liuzhumei avatar seisman avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

china-geospatial-data's Issues

Release v0.2.0

TODO:

  • #25
  • #26
  • Update the date in README
  • Document all the important changes in Changelog.md
  • Set the release date in Changelog.md
  • Set the current release version and date in README.md

包含完整信息的 CN-border 数据

目前的 CN-border 数据中只有单纯的线段数据,没有每个线段对应的元信息(比如属于哪个省的边界)。

@liuzhumei 曾经提供给我一套更完整的**边界数据(目测包含国界、省界、市界和区界),数据大小为 90 MB。以下是她提供的笔记:

**行政区划数据集

​ 本数据集原始来源为 全国地理信息资源目录服务系统,比例尺为1:100万,数据整体现势性为2015年。经过数据集要素的提取、合并及格式转化(详情见博文),集成为DCW数据格式???,包括:

  • 国界数据(含已定国界、未定国界、海岸线)

  • 国界及省界数据

  • 单独省界数据

  • 九段线数据

数据下载

https://github.com/gmt-china/china-geospatial-data ??

数据使用

数据使用方法类似原DCW数据使用规则,通过-Rcoast模块的-E选项,指定区域代码,调用绘图。

基本使用方法

???????????????????

由于DCW-China?数据只提供省级以上行政区划边界,社区另外提供同源OGR/GMT格式的市县级行政区划、行政地名、各级公路/铁路、湖泊水系等数据。

  • 市县级行政区划数据集 BOUA.gmt

县级行政区域提取

BOUA.gmt中的基本单位是三级行政区,即市辖区、县级市、县、自治县等行政区域。可利用convert模块,通过名称(Name属性)或行政区划代码(Pac属性)筛选,提取数据:

REM 提取武汉市武昌区边界
gmt begin
  gmt convert -S"Pac=420106" BOUA.gmt | gmt plot -Ba
gmt end

image

地级行政区域提取

6位区划代码的3~4位表示地级市、自治州等,可据此提取隶属同一地级行政区的区域范围。GMT6.1.0版本尚未完成多空间要素合并功能,因此利用ogr2ogr完成多边形的合并(Union)操作。

gmt begin
  REM 提取武汉市(PAC码以4201开头)边界
  REM sql语句中第一个%为转义符
  ogr2ogr -where "Pac like '4201%%'" wuhan.gmt BOUA.gmt

  REM 绘制武汉市区域(含各区边界)
    gmt plot wuhan.gmt -Wblue -Ba

    REM 利用ST_UNION函数合并各区
    ogr2ogr wuhan_union.gmt wuhan.gmt -dialect sqlite -sql "select ST_UNION(gcol,gcol) from (select ST_Collect(geometry) As gcol from wuhan)"

    REM 只绘制武汉市市界
    gmt plot wuhan_union.gmt -Wred
gmt end

结果如下:

image

行政区划名称等属性信息提取

BOUA.gmt数据中带有省名、区划代码、区(县)名、面积、区域中心坐标等属性信息。可通过ogr2ogr中的SQL语句查询,转化为CSV格式后利用text模块画出。如上图中添加武汉市各区名称,代码及结果如下:

gmt begin

  REM 上例中wuhan.gmt绘制各区边界
  gmt plot wuhan.gmt -Wblue -Ba

  REM 提取各区中心坐标及区县名称,利用text标记
  ogr2ogr -f CSV -sql "select Longitude, Latitude, Cou_Name from wuhan" wuhan.csv wuhan.gmt
    gmt text -F+f10p,STHeiti-Regular--GB-EUC-H wuhan.csv

gmt end

image

Release v0.3.0

We will make the v0.3.0 release when PR gmt-china/GMT_docs#364 is ready to merge.

  • Document all the important changes in Changelog.md
  • Set the release date in Changelog.md
  • Set the current release version and date in README.md

重建 git 历史

由于在 commit 0eb46b1 中错误加入了 GB2312 数据。是否要趁着整个repo刚开始的时候重建 git 历史,以使得 repo 更小。

迁移社区网站的地学数据

@CovMat#4 一次性迁移了社区网站的**地学数据。我觉得我们可以更平缓地迁移数据,最好是每个数据用一个或多个PR迁移,请看以下初步想法:

数据集目录

当前目录设置:

  • figures: 图片和脚本
  • 数据文件:如 CN_faults.gmt

我认为应该每一类数据放置在一个目录下,以下是初步目录设置想法:

**行政区:

  • **国界、省界、十段线以及南海诸岛
  • 国界、十段线以及南海诸岛数据(不含省界数据)
  • 仅包含十段线数据
  • **省会城市坐标

**地震区域:

  • **地震区域划分边界数据
  • **地震区域划分名称数据
  • **地震区域划分亚区边界数据
  • **地震区域划分亚区边界数据

**断层:

  • **断层数据

**铁路:

  • **铁路线

**河流:

  • **一级河流数据

**板块:

  • **大陆一级地块边界数据
  • **大陆一级地块推断边界数据
  • **大陆二级地块边界数据

此外,脚本和图片不建议放在本数据仓库中,建议放在中文手册中,图片由ci自动生成在手册中。本仓库只用于存放数据文件、构建流程等。

迁移过程

迁移以上每一个数据的时候,我们大约需要三步(参考 gmt-china/GMT_docs#301):

  • china-geospatial-data 仓库:新建该数据集(参考下一节新建数据集注意事项
  • 中文手册:添加数据集的说明、绘图脚本、图片(自动生成)等 (gmt-china/GMT_docs#302)
  • 社区网站:
    • 设置中文社区网站对应的图库/博客自动跳转至新链接
    • 地学数据中给出数据集的新链接
    • gmt-china.org/content/data中数据是否需要保留或者保留一段时间?

china-geospatial-data 仓库新建数据集注意事项

  • 构建流程
  • 文件格式:.gmt
  • 文件来源、引用

Release v0.3.1

Release: v0.3.1

Before release:

  • Document all the important changes in Changelog.md
  • Set the release date in Changelog.md
  • Set the current release version and date in README.md and README-en.md

Release:

  • Set the tag version to vX.Y.Z
  • Document all the important changes on the GitHub release page

是否有更详细的CRS信息?

老师您好:
我在文章【屈春燕. 2008. 《最新1/400万**活动构造空间数据库的建立》. 地震地质, 期 1: 298–304. 】了解到活动断层数据的相关信息:“在本数据库的建立过程中,我们使用了等面积圆锥投影,投影参数是:2条标准纬线分别为25°和47°,**经线110°,原点纬线30°”。
为了更准确的使用该数据集,想问下是否有更详细的可用于定义CRS的信息,如WKT格式或者对应EPSG编号等。

我根据上述文章中的描述构造了一个,但是信息应该是不够全:"+proj=aea +lat_1=25 +lat_2=47 +lat_0=30 +lon_0=110 +x_0=0 +y_0=0 +ellps=WGS84 +units=m"。

还请您多指教!

更新 CN-block 数据

CN-block 数据中目前只包含数据点信息,而无数据元信息。最好能够提供数据元信息,这样可以实现更多的功能。

**主要盆地空间位置

@SeisPider 有一份从 Shen W. 那里申请过来的**主要盆地空间位置文件,如下图所示:

Fig. 1b

  • Shen, W., Ritzwoller, M. H., Kang, D., Kim, Y., Lin, F. C., Ning, J., ... & Zhou, L. (2016). A seismic reference model for the crust and uppermost mantle beneath China from surface wave dispersion. Geophysical Journal International, 206(2), 954-979. https://doi.org/10.1093/gji/ggw175

About

China's Geospatial Data for GMT to Geospatial Data used in GMT for China?

更新日志

是否应该加一个 changelog.md 文件,并且也包含到下载的数据包里?

这样用户就知道每个版本之间新增或修正了哪些数据?

删除 GB2312 编码的文件?

为了使 GMT 能够显示中文,Linux 和 macOS 用户需要使用 UTF8 编码的中文数据文件,而 Windows + BAT 用户则需要使用 GB2312 编码的中文数据文件。

基于这个原因, @CovMat 添加了 CN_faults_GB2312.gmt 文件。考虑到这个数据库中大部分数据都包含中文,为每个数据都准备 UTF8 和 GB2312 编码的文件会产生如下问题:

  1. 整个 repo 中文件数目加倍
  2. 整个 repo 的大小加倍
  3. 用户在阅读这个 repo 时会出现两个版本的数据不知道该如何选择的问题
  4. 对于任一用户而言,如果使用 git clone 或者下载 master.zip 的方式,会得到冗余文件(例如,Linux用户不需要 GB2312 文件)

考虑到以上问题,我建议:

  1. 删除 GB2312 编码的文件
  2. repo 中所有文件均使用 UTF8 编码
  3. 当新增数据后,发布一个 release,并在 release 页面添加 UTF8 和 GB2312 两个版本的附件,供用户选择使用
  4. 在 README 中强调 repo 中所有文件都是 UTF8 编码,并给出 Windows 用户需要的额外操作

添加版本号信息?

把下面这段代码加到 README 里,

![GitHub release (latest by date)](https://img.shields.io/github/v/release/gmt-china/china-geospatial-data)

会生成如下 badge:
GitHub release (latest by date)

这样可以很容易知道 china-geospatial-data 的最新版本是多少。


另一方面,在 README.md 也加上

当前数据版本号: v0.1.0

这样当用户下载了 v0.1.0 而我们发布了 v0.2.0 的时候,用户会查看 README.md 时会看到:

  • 当前数据版本号: v0.1.0
  • 最新数据版本号: 由 badge 动态生成的版本号,例如 v0.2.0

这样似乎可以更好地提醒用户下载新版本?

Release v0.1.0

I think it's time to release v0.1.0.

TODO list before v0.1.0 release:

  • Update README

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.