-
全国省市地区的数据以 XML 和 Json 两种格式提供
资源介绍
最近的项目要用到全国省市数据,于是到网上找了一些。可是下载下来看一下,格式都不是我想要的。基本上都是分表的,省、市分开保存,有的还有地区表。而自己想要一个表的,或者是一个xml,或者是一个Json。
搜索过程中,找到了国家统计局的省市数据,看页面简单,正好最近在弄数据采集。以其下载别人的,还要扣金币、不如自己采集吧,一方面练习,另一方面也上传供下载,赚些金币,嘿嘿。
好了,牢骚说完了,说正事。
数据来源与国家统计局网站,网址是:http://www.stats.gov.cn/tjbz/xzqhdm/t20090626_402568086.htm
(这些数据还包含了行政区域代码,就是身份证号码前6位,可以用来查询身份证归属地^_^)
这个页面数据是有规律的,每个省份包含在 P 标签内,而城市和地区则用
分隔 这里有几个地方需要注意,其实是他们发布数据时的一点点不规则的地方: 1.宁夏回族自治区, 开始时多了个
。上面说了省份是包含在 P 标签内,所以这个情况如果想只找出省份的话,用 P 是匹配不到的 2.有些地方的空格是用 ,有的地方是全角空格,有的地方是用半角空格,如果有用到空格的地方就注意一下咯,我在保存 xml 和 Json 时,就用到了空格,所以我都做替换了 要注意的就这两点而已,好了,我会把这段文字和 xml、Json 一起打包上传。 谢谢大家支持。
分隔 这里有几个地方需要注意,其实是他们发布数据时的一点点不规则的地方: 1.宁夏回族自治区, 开始时多了个
。上面说了省份是包含在 P 标签内,所以这个情况如果想只找出省份的话,用 P 是匹配不到的 2.有些地方的空格是用 ,有的地方是全角空格,有的地方是用半角空格,如果有用到空格的地方就注意一下咯,我在保存 xml 和 Json 时,就用到了空格,所以我都做替换了 要注意的就这两点而已,好了,我会把这段文字和 xml、Json 一起打包上传。 谢谢大家支持。
- 上一篇: notepad++支持二进制显示的插件
- 下一篇: iris莺尾花标准数据集(Excel格式)