【Github】项目名:wecatch/china_regions:最全最新中国省、市、地区json及sql数据
项目简介
该项目提供最全最新的中国省、市、地区的json及sql数据。数据自动抓取国标http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/的数据,并且自动生成JavaScript es6 module以及sql数据,最新国标行政区规划最低到居委会这一级别(不包含港澳台信息)。数据有json、es6module、sql三种存储格式,es6module和sql基于json自动生成,json数据依据最新国标生成。
项目使用方式
如果直接使用,可以拷贝json和es6文件。对于Village数据,其文件特别大,默认不包含在仓库中,若需要可clone仓库,在src中解压village的压缩文件,然后执行python makedata.py。若要更新到最新国标,仓库中的数据是根据最新国标生成的,在使用中发现国标有变动时,可以手动进行更新(需要有node8或更高环境),具体操作包括:git clone本仓库,yarn install或者npm install,移除src目录下的json文件(如city.json等),打开main.js文件,取消对main函数执行的注释开始执行node main.js,利用已爬取的province、city、country开始同步其他行政区域的信息,根据需要分别打开pullTownDataSync、pullVillageDataSync爬取其他行政区域的信息,最后执行python makedata.py生成各种格式文件。注意在根据town爬取village数据时由于数据量特别大,默认情况下不会自动生成village的信息,可以根据自己的需要clone仓库之后自己生成。行政级别顺序为province -> city -> country -> town -> village(对应省 -> 市(市辖区) -> 县(区、市) -> 镇(街道) -> 村(居委会)),爬取village时由于数据量大会导致nodejs出现内存泄漏情况,所以每次增量更新文件时会自动进行文件备份,生成src/village_backup.json备份文件(不进仓库,最后再手动干预偏移量),village的数据文件是压缩过的(解压执行tar xvfz village.tar.gz)。
项目总结
这个wecatch/china_regions项目为处理中国省、市、地区数据提供了丰富的数据资源和操作方式。如果您对这个项目有任何想法或者问题,欢迎在下方留言参与讨论。
项目地址
数据统计
数据评估
本站链氪巴士提供的wecatch/china_regions:最全最新中国省、市、地区json及sql数据都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由链氪巴士实际控制,在2024年12月6日 上午12:00收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,链氪巴士不承担任何责任。