企业数字化转型-年度报告175个词频、文本统计(2000-2022年)

会员限领
| 来源:巨潮资讯网、上市公司年报

2022年8月,马克团队参考吴非、赵宸宇两位老师做法,根据上市公司年报文本,整理了数字化转型词频数据(详见前文),以及MD&A数字化词频(详见前文),受到了广大研究人员的欢迎

2023年6月,马克团队对前者进行了更新:1、新增部分上市公司,2、将词频数据更新至2022年

数据已上线,希望对大家有所帮助

即将上线 | 企业数字化转型-年度报告175个词频、文本统计

参考管理世界中吴非(2021)的做法,马克团队对人工智能技术、大数据技术、云计算技术、区块链技术、数字技术运用五个维度76个数字化相关词频进行统计。

即将上线 | 企业数字化转型-年度报告175个词频、文本统计

参考财贸经济中赵宸宇(2021)的做法,对数字技术应用、互联网商业模式、智能制造、现代信息系统四个维度99个数字化相关词频进行统计。

即将上线 | 企业数字化转型-年度报告175个词频、文本统计

统计上市公司年报全文、以及中英文部分的文本长度。

一、数据介绍

数据名称:企业数字化转型-年度报告词频、文本统计

数据范围:5331家上市公司

数据年份:2000-2022年

样本数量:55652条,193变量

年报来源:巨潮资讯网

数据整理:马克数据网

数据说明:内含数字化转型175个词频、各维度水平、文本统计面板

更新时间:2023年6月

二、整理说明

➤从巨潮资讯网下载2000-2022年上市公司年报

➤将原始报告文本整理为面板数据

➤统计年报全文的文本长度

➤统计全文中,中英文部分的文本长度

➤构建企业数字化术语词典,将词汇扩充到python的jieba库

➤去除停顿词,统计上述词汇在年报全文中出现的次数

➤计算数字化转型程度、各维度水平

三、指标说明

吴非(2021)的五个维度

人工智能技术
人工智能商业智能图像理解
投资决策辅助系统智能数据分析智能机器人
机器学习深度学习语义搜索
生物识别技术人脸识别语音识别
身份验证自动驾驶自然语言处理
大数据技术
大数据数据挖掘文本挖掘
数据可视化异构数据征信
增强现实混合现实虚拟现实
云计算技术
云计算流计算图计算
内存计算多方安全计算类脑计算
绿色计算认知计算融合架构
亿级并发EB级存储物联网
信息物理系统
区块链技术
区块链数字货币
差分隐私技术智能金融合约
数字技术运用
移动互联网工业互联网移动互联
互联网医疗电子商务移动支付
第三方支付NFC支付智能能源
B2BB2CC2B
C2CO2O网联
智能穿戴智慧农业智能交通
智能医疗智能客服智能家居
智能投顾智能文旅智能环保
智能电网智能营销数字营销
无人零售互联网金融数字金融
Fintech金融科技量化金融
开放银行

赵宸宇(2021)的四个维度

数字技术应用
数据管理数据挖掘数据网络
数据平台数据中心数据科学
数字控制数字技术数字通信
数字网络数字智能数字终端
数字营销数字化大数据
云计算云IT云生态
云服务云平台区块链
物联网机器学习
互联网商业模式
移动互联网工业互联网产业互联网
互联网解决方案互联网技术互联网思维
互联网行动互联网业务互联网移动
互联网应用互联网营销互联网战略
互联网平台互联网模式互联网商业模式
互联网生态电商电子商务
Internet互联网+线上线下
线上到线下线上和线下O2O
B2BC2CB2C
C2B
智能制造
人工智能高端智能工业智能
移动智能智能控制智能终端
智能移动智能管理智能工厂
智能物流智能制造智能仓储
智能技术智能设备智能生产
智能网联智能系统智能化
自动控制自动监测自动监控
自动检测自动生产数控
一体化集成化集成解决方案
集成控制集成系统工业云
未来工厂智能故障诊断生命周期管理
生产制造执行系统虚拟化虚拟制造
现代信息系统
信息共享信息管理信息集成
信息软件信息系统信息网络
信息终端信息中心信息化
网络化工业信息工业通信

四、数据概览

企业数目

即将上线 | 企业数字化转型-年度报告175个词频、文本统计

数据概览

即将上线 | 企业数字化转型-年度报告175个词频、文本统计

五、获取数据

注:该数据为马克社区高级会员-附赠数据

下载链接
需要登录后查看 点击登录
wmy1995
期待,这份数据终于要更新了
dxy11
有偿求这份数据q1135504135
d6HDV6
有偿求q958374047
1315234873
有偿求q1315234873
QLzbC3
每个关键词词频都能看到吗
z8GaUr
有偿求q2926263453
马克数据网
能看到,里面包含每个关键词的词频统计
gsfgsf
有偿求q1637749993
mnhll
我分享朋友圈联系客服,可以得到这个数据库吗?
tqtqtq
有偿求 q2536745458
2219631385
有偿求这份数据q2219631385
fufu
有偿求这份数据q2506403302
hisn1105
要数据,可+Q 2998362287
3CLCPS
有偿求这份数据q767591406
sCfufR
想要数据,请加Q1872616502
sCfufR
更正,要数据,加q1872616202,便宜
azKtbM
有偿求这份数据q2584577419
16655220163
我有这份数据,需要的可以加q1473993206
1KNyhU
我有这份数据,需要可以+Q 2998362287 便宜优惠
2nrOKg
有偿求数据!q:2386929072
hisn1105
要数据的同学,请+Q 2998362287 优惠
RtNGTI
有偿求这份数据,q:2811438839
hisn1105
需要最新版数字化转型数据的同学,请+Q 2998362287 优惠
aXscx5
请问这个有单独制造业企业的嘛?
马克数据网
这个包括制造业的,可以根据股票代码匹配企业的行业属性,然后筛选制造业
马克数据网
高级会员以上,可以直接在帖子底部下载该数据
lwJg70
求该数据,q3513977563
17853127168
有偿求q2497766765
fza67A
有偿求q3112465118
13995323449
有偿求数据 q 1040274691
atzYG6
有偿求数据q 1416260724
Z1QJHm
有偿求2845499931
Hickmy
请问为何部分企业缺少2021年的年报词频统计?
Jinmengran
有偿求q1538401882
马克数据网
该数据为非平衡面板,每年的企业数目都有说明的。如果缺失年报或者无法解析的情况下,也可能存在缺失
yaofengyang
有偿求Q1025227614
H6wolz
有偿求q2682965278
xihuan
有偿求数据qq 2181773883
cwq123
请问更新后的数据包含北交所的A股上市公司吗
jz123789
345348563🤑
13073099142
有偿求q251016242
Iayd4r
有偿求q 2976629303
13986679943
有偿求 q:595524721
in2cvf
有偿求 加Q 1992733241
free10
有偿求Q 842903720
iqbyXx
有偿求Q 1071606130
styr45
请核实数据,有些上市公司同一年份有两份数据
ujWRks
为什么南方汇通缺少2014年的数据
马克数据网
1、少部分企业在同一年发布两份了年度报告,初始年报、修正后年报,大部分我们都处理过了,可能存在少量没有处理到的情况,可以自己去重处理掉,下个版本我们也会进一步核查。2、可能存在极少部分企业,存在年报PDF缺失或者无法解析的情况,不过这种情况较少,几乎不影响研究
shenhaimeizi
有偿求Q 1106731978
benben123
请问剔除关键词前存在“没”“无”“不”等否定词语的表述,非本公司(包括公司的股东、客户、供应商、公司高管简介介绍在内)的“数字化转型”关键词了吗?
马克数据网
没有剔除过,关键词前存在“没”“无”“不”等否定词语的表述,非本公司(包括公司的股东、客户、供应商、公司高管简介介绍在内)的“数字化转型”关键词
sunny520
有偿求!Q1905540976@qq.com
o8jXJL
请问这个最终的数字化转型程度是怎么测算的,是词频加总吗,取对数了吗,下载文件包括处理过程吗还是只有数据
天马行空
最终的数字化转型程度,需要根据具体研究,部分文献是直接词频总和,部分文献是加总后+1取对数;下载文件后的文件只有各个词频的明细统计数据,不包括过程
3044312851
有偿求Q3044312851
15623105651
A是吴非老师的,对吗?
马克数据网
A和B分别代表的是吴和赵的词频
客服一:372574023(QQ)
客服二: macrodatas@163.com