【6月更新】环境相关词频统计-地级市、省级、中央(1954-2024年)

会员限领
| 来源:政府工作报告文本

本次数据为地级市、省级、中央三级环境规制15个词频、扩展词频,三类数据更新至2024年

2023年,马克团队参考《经济研究》陈诗一(2018)、《中国工业经济》邓慧慧(2019)、《中国软科学》尹礼汇(2021),统计了省级、地级市的环境规制相关词频,以衡量地区“环境规制力度”

2024年6月,团队对“环境规制”词频数据进行更新,分别统计中央、省级、地级市三个层面的环境规制词频明细数据,并将三个层面数据更新至2024年

相关数据:政府工作报告-原始全文

“环境规制”历年相关词频和-中央

环境相关词频统计-地级市、省级、中央

“环境规制”历年相关词频和-省级

环境相关词频统计-地级市、省级、中央

“环境规制”历年相关词频和-地级市

环境相关词频统计-地级市、省级、中央

一、数据介绍

数据名称:环境规制-15个相关词频统计

数据范围:地级市、省级、中央

数据年份:中央(1954-2024)、省级(2002-2024)、地级市(2002-2024)

数据来源:地方政府网站

数据整理:马克数据网

数据说明:内含环境规制相关的15个词频明细、扩展词频

更新时间:2024年6月

二、整理说明

➤从地方政府网爬取工作报告原始文件

➤将报告文本整理为面板数据

➤去除停顿词,利用python的jieba库进行精确模式和全模式分词,统计词频和

(精确:'推荐', '马克', '数据网')

(全:'推荐', '马克', '克数', '数据', '数据网')

➤保留中英文、数字、标点符号,利用正则表达式统计60个精确词频

➤利用正则表达式统计15个扩展词频

➤保留中英文、数字,统计全文文本总长度

➤保存文本词频总数、15个词频明细、文本长度

三、指标说明

一共24个指标,并额外统计扩展词频

年份地区文本总长度
仅中英文-文本总长度文本总词频-全模式文本总词频-精确模式
环境规制词频和环境保护环保
污染能耗减排
排污生态绿色
低碳空气化学需氧量
二氧化硫二氧化碳PM10
PM2.5

四、数据概览

时间序列-中央级:1954-2024年无缺失

平衡面板-省级(2002-2024年)

环境相关词频统计-地级市、省级、中央

非平衡面板-地级市

环境相关词频统计-地级市、省级、中央

数据概览-中央级

环境相关词频统计-地级市、省级、中央

数据概览-省级

环境相关词频统计-地级市、省级、中央

数据概览-地级市

环境相关词频统计-地级市、省级、中央

五、获取数据

注:该数据为马克社区高级会员-附赠数据

下载链接
需要登录后查看 点击登录
客服一:372574023(QQ)
客服二: macrodatas@163.com