企业人工智能-年报73个词频、文本统计(2000-2022年)

会员限领
| 来源:巨潮资讯网、上市公司年报

参考《管理世界》中姚加权(2024)的做法,团队根据上市年报文本内容,对73个人工智能的相关词频进行统计,并计算上市公司-人工智能水平,包括精确词汇、扩展词汇两种方式

相关数据:上市公司年报原文数据数字化转型词频数据MD&A数字化词频数据

企业人工智能-年报73个词频、文本统计

一、数据介绍

数据名称:企业人工智能-年报73个词频、文本统计

数据范围:5331家上市公司

数据年份:2000-2022年

样本数量:55613条,84个变量

年报来源:巨潮资讯网

数据整理:马克数据网

数据说明:内含人工智能73个词频、精确和扩展词汇两种方式

更新时间:2024年3月

二、整理说明

➤从巨潮资讯网下载2000-2022年上市公司年报

➤将原始报告文本整理为面板数据

➤统计年报全文的文本长度

➤统计全文中,中英文部分的文本长度

➤构建人工智能术语词典,将词汇扩充到python的jieba库

➤去除停顿词,统计精确词汇、扩展词汇数目

➤计算两种方式下的人工智能水平

企业人工智能-年报73个词频、文本统计

三、指标说明

股票代码股票简称年份
行业名称行业代码人工智能水平_精确词汇
人工智能水平_扩展词汇人工智能词频和_精确词汇人工智能词频和_扩展词汇
人工智能计算机视觉图像识别
知识图谱智能教育增强现实
智能政务特征提取商业智能
智能养老支持向量机(SVM)知识表示
模式识别物联网人机对话
AI产品人机交互数据挖掘
智慧银行智能客服虚拟现实
自动驾驶无人驾驶智慧金融
大数据营销长短期记忆(LSTM)智能芯片
边缘计算云计算深度神经网络
AI芯片深度学习特征识别
智能保险智能零售智能医疗
智能运输智能家居循环神经网络
大数据风控机器人流程自动化可穿戴产品
大数据平台增强智能大数据运营
机器翻译神经网络语音合成
人机协同智能农业智能音箱
卷积神经网络问答系统强化学习
大数据分析自然语言处理大数据管理
智能计算语音交互机器学习
生物识别语音识别智能监管
智能投顾智能语音声纹识别
人脸识别智能体大数据处理
分布式计算智能传感器智能搜索
智能环保

四、数据概览

企业数目

企业人工智能-年报73个词频、文本统计

数据概览-excel明细

企业人工智能-年报73个词频、文本统计

数据概览-stata统计

企业人工智能-年报73个词频、文本统计

五、获取数据

注:该数据为马克社区高级会员-附赠数据

下载链接
需要登录后查看 点击登录
35Tt8r
扩展词汇是哪些?
35Tt8r
人工智能水平怎么计算的?比如两个公司的词频都是2,但年报文本总长度不一样,为什么计算出来的人工智能水平是相等的?
马克数据网
1、人工智能水平 = ln(人工智能词频和+1);2、两种方式的年报文本总长度是一样的,只是扩展词汇计算时,统计的词频更多;3、扩展词汇只显示精确的词语,没有额外具体扩展的词,是条件下的模糊匹配、语料库的同义词
fEKFw2
扩展词汇是用jieba的全模式获取的吗
马克数据网
扩展词汇不是用jieba的全模式获取。需要建立一个语料库,是一定条件下的模糊匹配、语料库的同义词
maoshy6
请问这里面包括代码的吗
马克数据网
里面包括每个词频的统计明细。不包括代码
客服一:372574023(QQ)
客服二: macrodatas@163.com