中国县域数据库3.2版-线性插值、ARIMA填补(平衡面板2000-2020年)

会员限领
| 来源:《中国区域经济统计年鉴》、《中国县域统计年鉴》

3.2版更新说明:

1.上版本基础上,进一步更新指标至2020年

2.减小剔除阈值,保留更多区县

3.0版更新说明:

1.数据更新至2020年

2.剔除缺失较多的区县,转为平衡面板

3.填补升级。内含原始版本、线性插值、ARIMA填补三个版本数据

更新!中国县域数据库3.2版-线性插值、ARIMA填补

一、数据介绍

数据名称:中国县域数据库

数据来源:《中国区域经济统计年鉴》、《中国县域统计年鉴》

数据范围:2000-2020年,包括2703个区县

样本数量:平衡面板56763条(2703*21=56763)

数据整理:马克数据网,各指标存在不同程度的缺失

更新时间:2022年12月,当前最新3.2版

二、整理方法

第一,识别年鉴。利用NLP算法识别《中国区域经济统计年鉴》、《中国县域统计年鉴》,并转为面板数据

第二,完善数据。对比主流数据库、地方统计局,进一步完善县域数据

第三,统一地区。匹配民政部编码,统一使用2019年编码和地区名称

第四,统一单位。对不同单位的情况,进行单位换算

第五,人工验证。得到指标的面板数据,并人工抽样验证

第六,平衡面板。将非平衡面板转为平衡面板数据

第七,线性插值。利用线性趋势对中间缺失进行填充,得到线性插值版

第八,ARIMA填补。利用时间趋势,对剩余缺失进行预测,得到ARIMA填补版

最终,保留原始版本、线性插值版、ARIMA填补版

三、数据指标

共计83个指标,部分如下:

年份宽带接入用户数农林牧渔业总产值
行政区划代码地区生产总值规模以上工业企业数
地区名称第一产业增加值规模以上工业总产值
经度第二产业增加值城镇固定资产投资完成额
纬度工业增加值全社会固定资产投资
所属城市第三产业增加值社会消费品零售总额
所属省份农业增加值房地产开发投资
长江经济带牧业增加值普通小学学校数
行政区域土地面积人均地区生产总值普通中学学校数
乡及镇个数城镇单位在岗职工平均工资普通小学专任教师数
乡个数城镇居民人均可支配收入普通中学专任教师数
镇个数农村居民人均可支配收入普通小学在校生数
街道办事处个数地方财政一般预算收入普通中学在校学生数
村民委员会个数各项税收中等职业教育学校在校学生数
年末总户数地方财政一般预算支出医院、卫生院床位数
乡村户数城乡居民储蓄存款余额医院和卫生院卫生人员数_卫生技术人员
年末总人口年末金融机构各项贷款余额医院和卫生院卫生人员数_执业医师
乡村人口出口额各种社会福利收养性单位数
户籍人口数实际利用外资金额各种社会福利收养性单位床位数
年末单位从业人员农作物总播种面积全社会用电量
城镇单位在岗职工人数常用耕地面积城乡居民生活用电量
乡村从业人员数机收面积废气中氮氧化物排放量
农林牧渔业从业人员数设施农业占地面积废气中烟尘排放量
年末第二产业单位从业人员农用机械总动力工业废气中二氧化硫排放量
年末第三产业单位从业人员粮食总产量艺术表演场馆数_剧场、影剧院
农业机械总动力棉花产量公共图书馆总藏量
固定电话用户油料产量体育场馆机构数
移动电话用户数肉类总产量

四、数据说明

赠送原始年鉴:

http://www.macrodatas.cn/article/1147466866

注:整理数据为社区中级会员-附赠数据

下载链接
需要登录后查看 点击登录
JV1O0O
aljszl
Daaaa
lgg247717
KfQh72
mwTFHz
天马行空
客服一:372574023(QQ)
客服二: macrodatas@163.com