Git Product home page Git Product logo

areacodes's Introduction

areacodes

这个项目收集并分析中华人民共和国县级以上行政区划代码自 1980 年至今的历史数据及新旧代码间的对应关系数据。

在线预览

由此进入在线预览

数据集情况

数据集名称 规范 目录 汇总 进度
历史行政区划代码 data SQL | JSON | CSV 已完成
新旧代码对应关系 diff 规范 diff 同上 基本完成*

* 代码变更的文本描述收集工作现已开始,欢迎各位参与,详情参见 Issue #6

CSV 汇总表说明

  • 启用 / 弃用时间只精确到年。

    注:自 2018 年起至 2020 年底,民政部发布的数据每月更新一次,但自 2021 年起又改为每年更新一次。为了维持一致性,汇总表中记录的时间只精确到年。

  • 一条记录若为省级,其“二级行政区”为空;若为地级,其“二级行政区”即为其名称;若为县级,其“二级行政区”为其启用时对应的上级行政区名称(若上级代码存在),或“直辖”(若上级代码不存在)。

    注:先前的版本中“直辖”原为“直管”。

  • 一条记录的“新代码”为代码变更、弃用或行政区域变更后,原行政区域所对应的代码(若该记录的状态为“启用”,则“新代码”不含其自身的代码)。

    注:“新代码”中代码以字符 ; 分隔。若一代码后接包含年份的方括号(如 [2010]),说明其对应的行政区域变更发生在指定的年份,否则默认为“变更(弃用)时间”。

  • 查询一条记录对应的最新代码的方法是,以该记录为根节点,按“新代码”字段展开树节点,直至所有叶节点的“新代码”字段均为空且状态均为“启用”为止。

  • 在行政区划合并后又拆分的情况(或其他类似情况)下,按上述方法或不能精确查询一条记录对应的最新代码。后续可通过扩展语法解决此问题。

许可协议

本项目适用 CC0 1.0 许可协议。

原始数据来源

areacodes's People

Contributors

yescallop avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar

areacodes's Issues

数据错误

谢谢作者,看到过一个数据平台也做过类似的工作,有一些条目错漏的举隅,注意到有些细节作者并未修改(因为民政部是存在错误的,比如“鼓楼区”和“古楼区”) 。感觉可以做一些修改补充。https://zhuanlan.zhihu.com/p/516869092

收集代码变更的文本描述

假定你已经读过 diff 规范,下列规则说明如何收集代码变更的文本描述(以下简称变更描述)。

  1. 变更描述收集在差异表中,每条变更描述由一行或多行连续的注释行组成,其所描述的是紧接其后的一行或多行连续的变更行。为了兼容差异表中旧的注释,只有当差异表第一行的内容为 #![described] 时,该表中其余的注释行才能被解析为变更描述。
  2. 对于一条变更描述,将组成其的注释行行首的 # 与其后的空白字符去除后,以 \n 连接各行即得到其内容。变更描述的内容使用 Markdown 语法,可使用标题分级,一级标题隐含在其描述的变更中,二级标题由单个 # 起始,以此类推(与 Rust 的文档注释类似)。
  3. 变更描述应尽可能详细,对于引用文本必须说明其来源,尽可能使用超链接。为防止链接失效,可采用自动化脚本将对应的网页或文件存档。例子参见 2022-2023.diff

Useful APIs: Wayback Machine APIs, Save Page Now 2 API.

Corner cases like 410611

410611 was 焦作市郊区 in 1981 but then 鹤壁市郊区 in 1982, which isn't detected by our current algorithms.

The other cases are 430311, 430411 and 430511.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.