本次数据为地级市、省级、中央三级环境规制15个词频、扩展词频,三类数据更新至2024年
2023年,马克团队参考《经济研究》陈诗一(2018)、《中国工业经济》邓慧慧(2019)、《中国软科学》尹礼汇(2021),统计了省级、地级市的环境规制相关词频,以衡量地区“环境规制力度”
2024年6月,团队对“环境规制”词频数据进行更新,分别统计中央、省级、地级市三个层面的环境规制词频明细数据,并将三个层面数据更新至2024年
相关数据:政府工作报告-原始全文
“环境规制”历年相关词频和-中央
“环境规制”历年相关词频和-省级
“环境规制”历年相关词频和-地级市
一、数据介绍数据名称:环境规制-15个相关词频统计
数据范围:地级市、省级、中央
数据年份:中央(1954-2024)、省级(2002-2024)、地级市(2002-2024)
数据来源:地方政府网站
数据整理:马克数据网
数据说明:内含环境规制相关的15个词频明细、扩展词频
更新时间:2024年6月
二、整理说明➤从地方政府网爬取工作报告原始文件
➤将报告文本整理为面板数据
➤去除停顿词,利用python的jieba库进行精确模式和全模式分词,统计词频和
(精确:'推荐', '马克', '数据网')
(全:'推荐', '马克', '克数', '数据', '数据网')
➤保留中英文、数字、标点符号,利用正则表达式统计60个精确词频
➤利用正则表达式统计15个扩展词频
➤保留中英文、数字,统计全文文本总长度
➤保存文本词频总数、15个词频明细、文本长度
三、指标说明一共24个指标,并额外统计扩展词频
年份 | 地区 | 文本总长度 |
仅中英文-文本总长度 | 文本总词频-全模式 | 文本总词频-精确模式 |
环境规制词频和 | 环境保护 | 环保 |
污染 | 能耗 | 减排 |
排污 | 生态 | 绿色 |
低碳 | 空气 | 化学需氧量 |
二氧化硫 | 二氧化碳 | PM10 |
PM2.5 |
时间序列-中央级:1954-2024年无缺失
平衡面板-省级(2002-2024年)
非平衡面板-地级市
数据概览-中央级
数据概览-省级
数据概览-地级市
五、获取数据注:该数据为马克社区高级会员-附赠数据