地级市环境规制力度15个文本词频数据更新至2026年!
政府工作报告是地方政府总结年度工作、部署政策重点的重要文本载体,其中关于环境治理、污染防治、生态保护和绿色发展的表述,能够在一定程度上反映地方政府对环境规制议题的政策关注和治理导向。近年来,利用政府工作报告文本构建政策关注度指标,已成为环境经济学、公共治理与区域发展研究中的重要文本量化方法之一
在既有研究中,陈诗一(2018)在《经济研究》发表的相关研究中,选取省级政府工作报告中与环境相关词汇的出现频数及其比重,用以度量政府环境治理政策,并将该变量作为雾霾污染研究中的工具变量之一
团队参考《经济研究》陈诗一(2018)、《中国工业经济》邓慧慧(2019)、《中国软科学》尹礼汇(2021)等研究中关于政府工作报告文本量化的处理思路,将研究对象扩展至地级市层面政府工作报告。通过Python对地级市政府工作报告文本进行清洗、分词和关键词识别,系统统计报告中与环境规制相关的15个关键词出现频次,并据此构建地级市层面的环境规制文本指标


图1 历年政府工作报告环境词频趋势
数据名称:地级市政府工作报告环境规制词频统计数据
数据范围:296个地级及以上城市
数据年份:1999-2026年
样本数量:6471条
数据来源:地方政府网
数据整理:马克数据网
数据说明:内含环境规制相关的15个词频明细、文本长度、文本词频总数
更新时间:2026年5月
二、整理说明➤从地方政府网获取政府工作报告原始文件
➤将报告文本整理为面板数据
➤去除停顿词,利用python的jieba库进行精确模式和全模式分词,统计词频和
(精确:'推荐', '马克', '数据网')
(全:'推荐', '马克', '克数', '数据', '数据网')
➤保留中英文、数字、标点符号,利用正则表达式统计15个词频
➤保留中英文、数字,统计全文文本总长度
➤保存文本词频总数、15个词频明细、文本长度
三、指标说明一共24个指标,如下
| 行政区划代码 | 年份 | 城市 |
| 所属省份 | 文本总长度 | 仅中英文-文本总长度 |
| 文本总词频-全模式 | 文本总词频-精确模式 | 环保词频和 |
| 环境保护 | 环保 | 污染 |
| 能耗 | 减排 | 排污 |
| 生态 | 绿色 | 低碳 |
| 空气 | 化学需氧量 | 二氧化硫 |
| 二氧化碳 | PM10 | PM2.5 |
1.各年份政府工作报告统计情况

2.地级市环境规制词频统计-excel版

地级市环境规制词频统计-Stata版

注:该数据为高级会员-附赠数据,可在底部自取数据