参考《管理世界》中姚加权(2024)的做法,团队根据上市年报文本内容,对73个人工智能的相关词频进行统计,并计算上市公司-人工智能水平,包括精确词汇、扩展词汇两种方式
在前文,马克团队利用上市公司年报文本全文数据,对“人工智能”73个相关词频进行了统计,衡量上市公司人工智能水平,本次团队继续更新数据至2023年
相关数据:人工智能企业数据库,上市公司年报原文数据,数字化转型词频数据,MD&A数字化词频数据
数据名称:企业人工智能-年报73个词频、文本统计
数据范围:A股上市公司
数据年份:1999-2023年
样本数量:63052条,84个变量
年报来源:巨潮资讯网
数据整理:马克数据网
数据说明:内含人工智能73个词频、精确和扩展词汇两种方式
更新时间:2024年7月
二、整理说明➤从巨潮资讯网下载1999-2023年上市公司年报
➤将原始报告文本整理为面板数据
➤统计年报全文的文本长度
➤统计全文中,中英文部分的文本长度
➤构建人工智能术语词典,将词汇扩充到python的jieba库
➤去除停顿词,统计精确词汇、扩展词汇数目
➤计算两种方式下的人工智能水平
| 股票代码 | 股票简称 | 年份 | 
| 行业名称 | 行业代码 | 人工智能水平_精确词汇 | 
| 人工智能水平_扩展词汇 | 人工智能词频和_精确词汇 | 人工智能词频和_扩展词汇 | 
| 人工智能 | 计算机视觉 | 图像识别 | 
| 知识图谱 | 智能教育 | 增强现实 | 
| 智能政务 | 特征提取 | 商业智能 | 
| 智能养老 | 支持向量机(SVM) | 知识表示 | 
| 模式识别 | 物联网 | 人机对话 | 
| AI产品 | 人机交互 | 数据挖掘 | 
| 智慧银行 | 智能客服 | 虚拟现实 | 
| 自动驾驶 | 无人驾驶 | 智慧金融 | 
| 大数据营销 | 长短期记忆(LSTM) | 智能芯片 | 
| 边缘计算 | 云计算 | 深度神经网络 | 
| AI芯片 | 深度学习 | 特征识别 | 
| 智能保险 | 智能零售 | 智能医疗 | 
| 智能运输 | 智能家居 | 循环神经网络 | 
| 大数据风控 | 机器人流程自动化 | 可穿戴产品 | 
| 大数据平台 | 增强智能 | 大数据运营 | 
| 机器翻译 | 神经网络 | 语音合成 | 
| 人机协同 | 智能农业 | 智能音箱 | 
| 卷积神经网络 | 问答系统 | 强化学习 | 
| 大数据分析 | 自然语言处理 | 大数据管理 | 
| 智能计算 | 语音交互 | 机器学习 | 
| 生物识别 | 语音识别 | 智能监管 | 
| 智能投顾 | 智能语音 | 声纹识别 | 
| 人脸识别 | 智能体 | 大数据处理 | 
| 分布式计算 | 智能传感器 | 智能搜索 | 
| 智能环保 | 
企业数目
数据概览-excel明细
数据概览-stata统计
注:该数据为马克社区高级会员-附赠数据