数字经济已成为推动城市高质量发展、产业转型升级和治理能力现代化的重要政策议题。地方政府围绕数字基础设施、数据要素、产业数字化、数字治理、平台经济、智慧城市等方面持续出台相关政策,形成了研究城市数字经济政策关注度和政策导向的重要文本基础
本数据以中国地级市政府工作报告为基础,利用文本分析方法对数字经济相关词汇进行识别和统计,构建地级市层面的数字经济政策词频指标
通过收集整理296个地级及以上城市的政府工作报告原始文件,参考金灿阳(2022)和陶长琪(2022)的研究思路和方法,确定数字经济60个文本词频,采用python软件对政府工作报告文本进行分词、清洗和词频统计处理,分别统计数字经济政策词频A、数字经济词频B,并分别统计数字经济词频数量以量化政府数字经济政策支持力度,形成地级市-年份层面的数字经济政策关注度数据
该数据可广泛应用于数字经济发展、城市产业转型、政府政策注意力、数字基础设施建设、企业数字化转型、数据要素市场化配置、城市创新能力、区域经济增长、营商环境优化等相关研究

图3 历年地级市“数字经济”历年词频均值情况
数据名称:地级市-数字经济政策|60个文本词频统计数据
数据范围:296个地级及以上城市
时间范围:1999-2026年
样本数量:6472条
数据来源:地方政府网站
数据整理:马克数据网
更新时间:2026年6月
数据说明:内含数字经济相关的60个词频明细、扩展词频
二、整理说明
从地方政府网获取工作报告原始文件
将报告文本整理为面板数据
去除停顿词,利用python的jieba库进行精确模式和全模式分词,统计词频和
(精确:'推荐', '马克', '数据网')
(全:'推荐', '马克', '克数', '数据', '数据网')
保留中英文、数字、标点符号,利用正则表达式统计60个精确词频
利用正则表达式统计60个扩展词频
保留中英文、数字,统计全文文本总长度
保存文本词频总数、60个词频明细、文本长度
| 行政区划代码 | 年份 | 地区 |
| 所属省份 | 文本总长度 | 仅中英文-文本总长度 |
| 文本总词频-全模式 | 文本总词频-精确模式 | 数字经济政策词频和-A |
| 数字经济政策词频和-B | 数字经济_A | 智能经济_A |
| 信息经济_A | 知识经济_A | 智慧经济_A |
| 数字化信息_A | 现代信息网络_A | 信息和通信技术_A |
| ICT_A | 通信基础设施_A | 互联网_A |
| 云计算_A | 区块链_A | 物联网_A |
| 数字化_A | 数字乡村_A | 数字产业_A |
| 电子商务_A | 5G_A | 数字基础设施_A |
| 人工智能_A | 电商_A | 大数据_A |
| 数据化_A | 产业数字化_A | 数字产业化_A |
| 数据资产化_A | 智慧城市_A | 云服务_A |
| 云技术_A | 云端_A | 电子政务_A |
| 移动支付_A | 线上_A | 信息产业_A |
| 软件_A | 信息基础设施_A | 信息技术_A |
| 数字生活_A | 智能制造_B | 智能化_B |
| 智慧化_B | 智慧城市_B | 云计算_B |
| 上云_B | 云平台_B | 云服务_B |
| 大数据_B | 数据安全_B | 数据服务_B |
| 数据治理_B | 数据共享_B | 工业互联网_B |
| 物联网_B | 区块链_B | 机器人_B |
| 5G_B | 数字技术_B | 数字化_B |
| 数字经济_B |
各年份统计情况

地级市数字经济 政策词频统计数据_excel格式

地级市数字经济政策词频统计数据(精确词汇)_stata格式

地级市数字经济政策词频统计数据(扩展词汇)_stata格式

会员登陆后,可在文章底部直接下载对应数据