地级市政府工作报告是我国地级市一级人民政府,在每年年初的地方人民代表大会会议上,由市长或代理市长向大会作的工作报告。代表了各地方政府在各个阶段的工作情况和成果,是极有价值的文本分析数据
马克团队整理了地级市2002-2024年的政府工作报告,将原始文本保存为txt格式,同时也整理了csv格式的面板数据,便于研究人员使用
相关数据:中央、省、市级政府工作报告
一、数据介绍数据名称:地级市-政府工作报告文本数据
数据范围:地级市以上城市
数据年份:2002-2024年
数据来源:地方政府网
数据格式:包括txt文件、文本面板数据
数据整理:马克数据网
更新时间:2024年5月
二、整理说明➤从地方政府网爬取工作报告,保存txt版
➤将报告文本整理为一张表格,保存csv版
➤去除停顿词,利用python的jieba库进行精确模式和全模式分词,统计词频和
(精确:'推荐', '马克', '数据网')
(全:'推荐', '马克', '克数', '数据', '数据网')
➤保留中英文、数字,统计全文文本总长度
➤保存原始文本、文本长度、词频总数
三、指标说明一共8个指标,如下
年份 | 地区等级 | 地区 |
报告全文 | 文本总长度(字) | 仅中英文-文本总长度(字) |
文本总词频-全模式(个) | 文本总词频-精确模式(个) |
非平衡面板-地级市
原始报告txt文本
政府工作报告-地级市层面
五、获取数据注:该数据为高级会员-附赠数据