政府工作报告-原始全文(中央、省、市级)1954-2024年

会员限领
| 来源:政府工作报告

注:该数据限长期会员领取,仅用于学术研究

更新说明:地级市更新至2024年,新增txt版文件。政府工作报告文本数据覆盖国务院、省级政府、市级政府在内的三级政府部门,代表了政府在各个阶段的工作情况和成果,是极有价值的文本分析数据

马克团队将报告原始文本整理成了面板数据,在旧版的基础上更新了所有2024年的最新报告,同时保留txt版文件。时间跨度为中央(1954-2024)、省级(2002-2024)、地级市级(2002-2024),希望对大家有所帮助

一、数据介绍

数据名称:政府工作报告-文本数据

数据范围:中央、省级、市级

数据年份:中央(1954-2024)、省级(2002-2024)、地级市级(2002-2024)

数据来源:地方政府网

数据格式:面板数据,包括原始文本、文本面板数据

数据整理:马克数据网

更新时间:2024年5月

二、整理说明

➤从地方政府网爬取工作报告原始文件

➤将报告文本整理为面板数据

➤去除停顿词,利用python的jieba库进行精确模式和全模式分词,统计词频和

  (精确模式:'推荐', '马克', '数据网')

  (全模式:'推荐', '马克', '克数', '数据', '数据网')

➤保留中英文、数字,统计全文文本总长度

➤保存原始文本、txt文件、文本长度、词频总数

三、指标说明

一共8个指标,如下

年份地区等级地区
报告全文文本总长度(字)仅中英文-文本总长度(字)
文本总词频-全模式(个)文本总词频-精确模式(个)

四、数据概览

原始报告txt文本

政府工作报告-原始全文数据2024.5更新

时间序列-中央级:1954-2024年无缺失

平衡面板-省级:2002-2024年无缺失

非平衡面板-地级市

政府工作报告-原始全文数据2024.5更新

图1:政府工作报告-中央级

政府工作报告-原始全文数据2024.5更新

图2:政府工作报告-省级

政府工作报告-原始全文数据2024.5更新

图3:政府工作报告-地级市

政府工作报告-原始全文数据2024.5更新

五、获取数据

注:中央级、省级、地级市政府工作报告已更新至2024年,限长期会员领取

下载链接
需要登录后查看 点击登录
hahafeixiu
谢谢分享
adaada2023
谢谢分享~
f7JUdC
谢谢分享
马克数据网
目前中央级、省级报告已更新至2024年,地级市报告更新至2023年
hrizonlee
为何打开是乱码啊
马克数据网
编码是默认的utf-8格式,没有设置为excel可打开的utf_8_sig格式,因为文本过长,excel打开会显示不全。该数据可以用python或者其他软件打开
rosemary
感谢分享
13693377217
为什么导入stata只有一段文本,怎么处理呢
马克数据网
由于stata软件分列的原因,stata打开可能会存在分列错误,建议使用python其他软件打开
hh7927
链接已失效,请更新
马克数据网
之前的链接被和谐掉了,已重新分享,领取后可直接下载
18270563882
又失效了,可以更新一下嘛
马克数据网
6月4日重新分享,如果又被和谐掉了,可联系企业微信客服,或者QQ客服领取372574023
ixURf4
谢谢分享
eH4Wb8
发现有不少的txt大小为1kb,打开是空白。还有一些txt还不到20kb,打开后发现只有部分工作报告。请问可否更新一下?
马克数据网
绝大部分城市的年报都保存的有;少部分城市的少部分年份的工作报告是没有公开的,这部分报告无法获取的就是空白
sdnulyq
下载以后没有txt版本呀,请问txt版本在哪里?
马克数据网
3个文件夹里面分别有中央、省份、城市的txt版本
13625824965
里面有一般公共预算收入增长任务的数据汇总吗
马克数据网
只有政府工作报告原文,没有单独提取某个指标
dSSAYY
我是中级会员,有没有高级会员可以帮忙下载一下这份数据,可有偿,邮箱:99491031@qq.com
客服一:372574023(QQ)
客服二: macrodatas@163.com