数字经济政策 | 政府工作报告-60个文本词频(各地区2002-2023年)

会员限领
| 来源:政府工作报告文本

马克团队根据各省份政府工作报告,参考金灿阳(2022)和陶长琪(2022)的做法,借助Python软件对政府工作报告进行分词处理,分别统计了省级政府工作报告中与数字经济相关的关键词词频,分别记为数字经济政策词频A、数字经济政策词频B

A文献参考

数字经济政策 | 政府工作报告-60个文本词频

B文献参考

数字经济政策 | 政府工作报告-60个文本词频

年度趋势

数字经济政策 | 政府工作报告-60个文本词频

一、数据介绍

数据名称: 政府工作报告-数字经济政策词频

数据范围:全国31个省份

数据年份:2002-2023年(平衡面板为2007-2023年)

数据来源:地方政府网

数据整理:马克数据网

数据说明:内含数字经济相关的60个词频明细、文本长度、文本词频总数

更新时间:2023年2月

二、整理说明

从地方政府网爬取工作报告原始文件

将报告文本整理为面板数据

去除停顿词,利用python的jieba库进行精确模式和全模式分词,统计词频和

(精确:'推荐', '马克', '数据网')

(全:'推荐', '马克', '克数', '数据', '数据网')

保留中英文、数字、标点符号,利用正则表达式统计60个词频

保留中英文、数字,统计全文文本总长度

保存文本词频总数、60个词频明细、文本长度

三、指标说明

一共71个指标,如下

行政区划代码年份地区
所属地域长江经济带文本总长度
仅中英文-文本总长度文本总词频-全模式文本总词频-精确模式
数字经济政策词频和-A数字经济政策词频和-B数字经济_A
智能经济_A信息经济_A知识经济_A
智慧经济_A数字化信息_A现代信息网络_A
信息和通信技术_AICT_A通信基础设施_A
互联网_A云计算_A区块链_A
物联网_A数字化_A数字乡村_A
数字产业_A电子商务_A5G_A
数字基础设施_A人工智能_A电商_A
大数据_A数据化_A产业数字化_A
数字产业化_A数据资产化_A智慧城市_A
云服务_A云技术_A云端_A
电子政务_A移动支付_A线上_A
信息产业_A软件_A信息基础设施_A
信息技术_A数字生活_A智能制造_B
智能化_B智慧化_B智慧城市_B
云计算_B上云_B云平台_B
云服务_B大数据_B数据安全_B
数据服务_B数据治理_B数据共享_B
工业互联网_B物联网_B区块链_B
机器人_B5G_B数字技术_B
数字化_B数字经济_B

四、数据概览

面板形态

数字经济政策 | 政府工作报告-60个文本词频

数据概览

数字经济政策 | 政府工作报告-60个文本词频

五、获取数据

注:该数据为马克社区高级会员-附赠数据

下载链接
需要登录后查看 点击登录
yusiyu_zju16
马克数据网
xiangqianchong
马克数据网
客服一:372574023(QQ)
客服二: macrodatas@163.com