政府工作报告-原始文本面板、创新乡村环保等词频统计(2002-2020年)

会员限领
| 来源:政府工作报告
一、数据介绍

数据名称:政府工作报告-原始文本面板数据及词频统计

数据范围:全国31个省份

数据年份:2002-2020年(平衡面板为2007-2020年)

数据来源:地方政府网

数据整理:马克数据网

数据说明:内含原始文本面板,以及精确模式和全模式两种情况下的25个词频统计面板

更新时间:2021年12月(当前为1.0版)


二、整理说明

从地方政府网爬取工作报告原始文件

将报告文本整理为面板数据

利用python的jieba库进行精确模式分词

(即:'推荐', '马克', '数据网')

利用python的jieba库进行全模式分词

(即:'推荐', '马克', '克数', '数据', '数据网')

去除停顿词

保留两种模式下的词频统计


三、指标说明

原始文本农村节能
年份环境细颗粒物
地区代码环保氮氧化物
地区环境保护氨氮
词频总量绿色尾气
创新雾霾扬尘
创业能耗PM10
技术减排PM2.5
高质量低碳二氧化硫
乡村空气二氧化碳


四、数据概览

面板结构

政府工作报告-原始文本面板、创新乡村环保等词频统计

数据概览

政府工作报告-原始文本面板、创新乡村环保等词频统计


五、获取数据

注:该数据为马克社区高级会员-附赠数据

下载链接
需要登录后查看 点击登录
2022xiaochengzi
天马行空
rw3515
2Srup6
APLeM5
NVkP9r
客服一:372574023(QQ)
客服二: macrodatas@163.com