Git Product home page Git Product logo

china_area_mysql's People

Contributors

guotie avatar kakuilan avatar menduo avatar youwen21 avatar zhcj avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

china_area_mysql's Issues

我也有,不过只到乡镇的

我的做法:利用高德地图开放平台,
1、node.js调用循环获取各级下的数据,
2、然后写到mongodb
3、用java读取数据写到mysql

数据少

我下载的是20160731这个包,导入数据之后之后5个省份的数据,总的只有100594条,这是什么原因?

项目官网

原先我还在议题里见到了这个项目的官网,现在不见了,是官网停服了吗?

cnarea20181031数据改动说明

cnarea20181031数据改动说明

  1. 数据表结构更改
    之前几个版本的数据更新后,经常有基友反馈,因为国内某些区域的新增或裁撤,可能造成同一个地址的id变化,导致出现与cnarea相关表的历史数据不匹配的情况。
    观察了近几年国内的官方数据,大陆地区的area_code(统计用区划代码)很少有改动,除非该地址在行政上做出了调整。因此决定将area_code作为唯一键使用,id只是一个辅助的排序字段。对应的,将parent_id改为parent_code,作为上下级查询字段。
  2. 港澳台area_code编码规则
    国家统计局目前尚未公布港澳台地区的数据,而且距离官方为它们进行统一编码应该还有一段时间。因此只能暂由个人对这些数据进行唯一编码。
    编码规则为:使用murmurhash3对完整地址(如**省云林县元长乡庄内路)进行编码,取一个11位整数值,再加上港澳台前缀码。
    前缀码:香港为70,澳门为71,**为72。
  3. 2018**数据比2017多7千多
    因为数据源中存在将大量同一道路但不同门牌号的地址,作为不同的单独地址,而且它们的邮编也可能不相同。例如,“福来路(双130巷以上)”、“福来路(单131号以上)”、“中山路(双160号以上)”、“中山路(单183号以上)”等。本次数据更新也遵循数据源的做法(因为没时间人工一个个去对这些地址做甄别和去重)。所以,比2017多了7千记录。
  4. 大陆地区村/社区数据变化
    • 2013年 694666
    • 2014年 670479
    • 2015年 667519
    • 2016年 666655
    • 2017年 672584
    • 2018年 665040
      估计2017年的数据有误差。整体上看,很多村庄在消失。感慨一下。

以上信息,请各位了解。

查询很费时阿?

PHP查询语句:SELECT id,level,name,short_name,merger_name,pinyin,lng,lat FROM map_cnarea_2018 WHERE short_name='$query' ORDER BY level
耗时5秒多,通过分析,Creating Sort Index 耗时就5秒。请问大神,如何解决?

关于数据中经纬度的问题

感谢提供的数据!! 有个疑问:
看到一个issue中提到,用的是百度API获取的地图坐标(#6)
但是实际从百度地图中查询的时候,发现还有很大的差距。是否还需要进行某种转换呢?
如以王府井社区居委会为例,给的地理坐标为116.402913,39.91402,而实际的应该是116.421223,39.920574
image

image

cnarea20191031数据改动说明

cnarea20191031数据改动说明

  1. 港澳台area_code编码规则
    感谢@hjk0820提出#37,现已将港澳台地区编码修改。
    前缀码:香港为81,澳门为82,**为71。

  2. 2019**数据继续增加
    **地区数据源开始启用6位邮编,相关地址也有变化。因此,比2018增加了1万4千多。

  3. 大陆地区村/社区数据变化

    • 2013年 694666
    • 2014年 670479
    • 2015年 667519
    • 2016年 666655
    • 2017年 672584
    • 2018年 665040
    • 2019年 656781
      村庄还在持续消失。也有市县、乡镇行政区的减少情况。
  4. 关于未来
    2020年是艰难未来的开始。本项目可能会停止维护。

以上信息,请各位了解。

催更~~~~

国家统计局数据已更新。
催更!催更!催更!

sql文件过大

建议吧sql语句拆分成多个insert into语句。这样哪条数据出错也好直接改

请问拼音您是用什么库或者接口之类的获取到的呢?

从cnarea20171031中抽样看了一下那些简称包括多音字都拼的很正确,70多万个名字用什么工具能拼得这么好呢?

另外建议一下insert那句每条数据应该可以换一下行,UltraEdit上打开来看都比较吃力,批量换行一下后好多了。

部分市下级区域,直接划分到乡镇,直接跳过了区县

Hi!
5 级区域应该是从: province > city> conty> town> village 吧。
不知道你在爬取数据的时候有没有发现,在广东 东莞等城市下面,直接由 city 直接变成了 town,期间少了 conty 区/县这一等级。
你是把这一部分乡镇地区,直接放入了 区县这一等级下面吧。
所以最终获取到的 区县 数据,并没有达到 3215, 只有 3133。

行政区域边界

这个数据是只有点的经纬度坐标信息吗?没有区域边界信息吗?

MySQL server has gone away

命令
mysql> source file_name.sql;

mysql -u root -p database_name < file_name.sql
都失败了
还有别的办法没有

创建表失败,提示如下

Database changed
mysql> CREATE TABLE cnarea_2017 (
-> id mediumint(7) unsigned NOT NULL AUTO_INCREMENT,
-> parent_id mediumint(7) unsigned NOT NULL DEFAULT '0' COMMENT '父级ID',
-> level tinyint(1) unsigned NOT NULL DEFAULT '0' COMMENT '层级',
-> area_code bigint(12) unsigned NOT NULL DEFAULT '0' COMMENT '行政代码',
-> zip_code mediumint(6) unsigned zerofill NOT NULL DEFAULT '000000' COMMENT '邮政编码',
-> city_code char(6) NOT NULL DEFAULT '' COMMENT '区号',
-> name varchar(50) NOT NULL DEFAULT '' COMMENT '名称',
-> short_name varchar(50) NOT NULL DEFAULT '' COMMENT '简称',
-> merger_name varchar(50) NOT NULL DEFAULT '' COMMENT '组合名',
-> pinyin varchar(30) NOT NULL DEFAULT '' COMMENT '拼音',
-> lng decimal(10,6) NOT NULL DEFAULT '0.000000' COMMENT '经度',
->  lat decimal(10,6) NOT NULL DEFAULT '0.000000' COMMENT '纬度',
-> PRIMARY KEY (id),
-> KEY idx_lev (level,parent_id) USING BTREE
-> ) ENGINE=MyISAM DEFAULT CHARSET=utf8 COMMENT='**行政地区表';
**ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'lat decimal(10,6) NOT NULL DEFAULT '0.000000' COMMENT '纬度',

PRIMARY KEY' at line 23**

表示感谢,非常棒

刚写完一个取经纬的正打算整合编码,然后看到你这个,相见恨晚,果然放弃轮子,你这个更优秀,留言感谢!!!

最新是2016的,请问最近可否有更新?

建议每次抓取发布到Releases中,并且标注下数据的具体月日

首先感谢分享,最近项目中正好用到。
如果将每次的结果发布到Release中的话,方便管理和下载,另外也不用将历次的版本都放到Repo中了。
另外可以使用数据发布的年月日来替代抓取的年月日来命名发布的文件,这样方便用户去国家统计局对应查找。
一点小小的建议,希望能采纳:smile:

表结构的字段类型有误

表结构的字段类型有误和数据文件中的字段不一致,导致建表后数据会导入失败需要手动调整。建议直接用工具生成可执行 SQL 文件存储。用起来会方便。

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.