地级市-数字经济政策|60个文本词频统计数据(1999-2026年)

高级会员
| 来源:地方政府网站

数字经济已成为推动城市高质量发展、产业转型升级和治理能力现代化的重要政策议题。地方政府围绕数字基础设施、数据要素、产业数字化、数字治理、平台经济、智慧城市等方面持续出台相关政策,形成了研究城市数字经济政策关注度和政策导向的重要文本基础

本数据以中国地级市政府工作报告为基础,利用文本分析方法对数字经济相关词汇进行识别和统计,构建地级市层面的数字经济政策词频指标

通过收集整理296个地级及以上城市的政府工作报告原始文件,参考金灿阳(2022)和陶长琪(2022)的研究思路和方法,确定数字经济60个文本词频,采用python软件对政府工作报告文本进行分词、清洗和词频统计处理,分别统计数字经济政策词频A、数字经济词频B,并分别统计数字经济词频数量以量化政府数字经济政策支持力度,形成地级市-年份层面的数字经济政策关注度数据

该数据可广泛应用于数字经济发展、城市产业转型、政府政策注意力、数字基础设施建设、企业数字化转型、数据要素市场化配置、城市创新能力、区域经济增长、营商环境优化等相关研究

地级市-数字经济政策|60个文本词频统计数据(1999-2026年)

图3 历年地级市“数字经济”历年词频均值情况

一、数据介绍

数据名称:地级市-数字经济政策|60个文本词频统计数据

数据范围:296个地级及以上城市

时间范围:1999-2026年

样本数量:6472条

数据来源:地方政府网站

数据整理:马克数据网

更新时间:2026年6月

数据说明:内含数字经济相关的60个词频明细、扩展词频


二、整理说明

从地方政府网获取工作报告原始文件

将报告文本整理为面板数据

去除停顿词,利用python的jieba库进行精确模式和全模式分词,统计词频和

(精确:'推荐', '马克', '数据网')

(全:'推荐', '马克', '克数', '数据', '数据网')

保留中英文、数字、标点符号,利用正则表达式统计60个精确词频

利用正则表达式统计60个扩展词频

保留中英文、数字,统计全文文本总长度

保存文本词频总数、60个词频明细、文本长度

三、数据指标
行政区划代码年份地区
所属省份文本总长度仅中英文-文本总长度
文本总词频-全模式文本总词频-精确模式数字经济政策词频和-A
数字经济政策词频和-B数字经济_A智能经济_A
信息经济_A知识经济_A智慧经济_A
数字化信息_A现代信息网络_A信息和通信技术_A
ICT_A通信基础设施_A互联网_A
云计算_A区块链_A物联网_A
数字化_A数字乡村_A数字产业_A
电子商务_A5G_A数字基础设施_A
人工智能_A电商_A大数据_A
数据化_A产业数字化_A数字产业化_A
数据资产化_A智慧城市_A云服务_A
云技术_A云端_A电子政务_A
移动支付_A线上_A信息产业_A
软件_A信息基础设施_A信息技术_A
数字生活_A智能制造_B智能化_B
智慧化_B智慧城市_B云计算_B
上云_B云平台_B云服务_B
大数据_B数据安全_B数据服务_B
数据治理_B数据共享_B工业互联网_B
物联网_B区块链_B机器人_B
5G_B数字技术_B数字化_B
数字经济_B

四、数据概览

各年份统计情况

各年份统计情况

地级市数字经济 政策词频统计数据_excel格式

地级市数字经济 政策词频统计数据_excel格式

地级市数字经济政策词频统计数据(精确词汇)_stata格式

地级市数字经济政策词频统计数据(精确词汇)_stata格式

地级市数字经济政策词频统计数据(扩展词汇)_stata格式

地级市数字经济政策词频统计数据(扩展词汇)_stata格式

五、下载数据

会员登陆后,可在文章底部直接下载对应数据

全部下载
该数据需要高级会员以上的权限, 请先登录您的账号: 点击登录