政府工作报告-原始全文(中央、省、市级)1954-2023年

会员限领
| 来源:政府工作报告

注:该数据是赠送给长期会员的福利数据,仅用于学术研究

政府工作报告文本数据覆盖国务院、省级政府、市级政府在内的三级政府部门,代表了政府在各个阶段的工作情况和成果,是极有价值的文本分析数据

马克团队将报告原始文本整理成了面板数据,时间跨度为中央(1954-2023)、省级(2002-2023)、市级(2002-2023),希望对大家有所帮助

一、数据介绍

数据名称:政府工作报告-文本数据

数据范围:中央、省级、市级

数据年份:中央(1954-2023)、省级(2002-2023)、市级(2002-2023)

数据来源:地方政府网

数据格式:面板数据,包括原始全文

数据整理:马克数据网

更新时间:2023年12月

二、整理说明

从地方政府网爬取工作报告原始文件

将报告文本整理为面板数据

去除停顿词,利用python的jieba库进行精确模式和全模式分词,统计词频和

(精确:'推荐', '马克', '数据网')

(全:'推荐', '马克', '克数', '数据', '数据网')

保留中英文、数字,统计全文文本总长度

保存原始文本、文本长度、词频总数

三、指标说明

一共8个指标,如下

年份地区等级地区
报告全文文本总长度(字)仅中英文-文本总长度(字)
文本总词频-全模式(个)文本总词频-精确模式(个)

四、数据概览

时间序列-中央级:1954-2023年无缺失

平衡面板-省级

政府工作报告-原始全文

非平衡面板-地级市

政府工作报告-原始全文

图1:政府工作报告-中央级

政府工作报告-原始全文

图2:政府工作报告-省级

政府工作报告-原始全文

图3:政府工作报告-地级市

政府工作报告-原始全文

五、获取数据

注:该数据仅对长期会员赠送

下载链接
需要登录后查看 点击登录
hahafeixiu
adaada2023
f7JUdC
客服一:372574023(QQ)
客服二: macrodatas@163.com