如何衡量地级市新质生产力水平?基于百度新闻数据

会员限领
| 来源:百度新闻

新质生产力是一个相对较新的概念,它是在当前科技革命和产业变革背景下提出的,用以描述和指导当前及未来一段时期内生产力发展的新形态。新质生产力标志着生产力发展的一个新阶段,不仅仅是量的扩张,更重要的是质的飞跃

马克团队参考《中国工业经济》中李春涛(2020)的思路,通过百度新闻的高级检索,利用“新质生产力”的46个关键词,创新性地构建地级市“新质生产力发展水平”,希望对大家的研究有所启发

如何衡量地级市新质生产力水平?基于百度新闻数据

目录

➤整理过程

➤定义“新质生产力”关键词

➤构建地级市+关键词

➤进行高级检索

➤爬取新闻数据

➤构建地级市“新质生产力发展水平”

➤数据下载

第一步,定义关键词

根据新质生产力的内涵,定义“新质生产力“46个相关关键词,具体如下

新质生产力人工智能科技创新
技术革新科学发展创新动能
颠覆性技术突破性技术革命性创新
新技术前沿技术高新技术
尖端技术新能源新经济
数字经济创新经济未来经济
新业态数字化转型产业升级
新模式战略性新兴产业未来产业
高科技产业新动能产业创新驱动
技术驱动创新引领重大突破
提高生产力质的转变提升生产力
高效能高性能高效率
高产出高质量发展质量优先
效益提升高标准发展主导技术
创新领先科技引领关键突破
核心技术突破

第二步,构建地级市+关键词

根据《中国城市统计年鉴》获取历年300个地级市/直辖市的名单,并与“新质生产力”的关键词进行交叉匹配,获取百度新闻的检索关键词,比如:北京+新质生产力、北京+人工智能、七台河+新质生产力、七台河+人工智能等

如何衡量地级市新质生产力水平?基于百度新闻数据

第三步,百度新闻高级检索

根据第二步构建的[地级市+新质生产力关键词],共计14288个检索关键词,运用网络爬虫技术,进行百度新闻检索,并保存新闻标题、公布日期、摘要文本、详情链接等内容

如何衡量地级市新质生产力水平?基于百度新闻数据

第四步,爬取新闻数据

检索日期为2024年5月17日,爬虫历时数周,将所有检索结果保存到本地数据库,其中2011-2023年间新闻数据共计29.7万余条

如何衡量地级市新质生产力水平?基于百度新闻数据

第五步,构建地级市新质生产力水平

参考李春涛学者的做法,统计2011-2023年间,各地级市的”新质生产力“相关新闻数量,由于这一指标分布存在显著的右偏性,对这一指标加1做对数变换,作为衡量该地级市新质生产力水平的指标

如何衡量地级市新质生产力水平?基于百度新闻数据

该数据为马克数据网-高级会员数据,将于2024年6月19日上线

参考文献:李春涛,闫续文,宋敏,等.金融科技与企业创新——新三板上市公司的证据[J].中国工业经济,2020,(01):81-98.

shangduixiagen
客服一:372574023(QQ)
客服二: macrodatas@163.com