中国上市公司财经新闻数据库(CFND)由哈尔滨工业大学经济与管理学院开发,国内首个采用人工智能算法来采集、整理和分析上市公司财经新闻的大数据平台。​数据来源涵盖近500家网络媒体和400多家报纸刊物,提供上市公司财经新闻基本信息、量化统计信息以及新闻相似度分析等
一、上市公司财经新闻库数据的介绍1.数据内容及年份
(1)网络财经新闻基本信息:2001-2023年
(2)网络新闻量化统计(按自然日):2001-2023年
(3)网络新闻量化统计(按交易时间):2008-2023年
(4)网络财经新闻相似度:按新闻事件区分,无时间区间
(5)报刊财经新闻基本信息:1994-2024年
(6)报刊财经新闻量化统计:1994-2024年
(7)报刊财经新闻相似度:按新闻事件区分,无时间区间
2.数据下载时间:2025年2月12日
3.数据范围:上市公司
4.数据格式:xlsx
5.数据来源:马克社区用户
二、数据指标字段 | 字段名称 | 描述 |
Scode | 股票代码 | 上市公司股票代码 |
Coname | 公司简称 | 上市公司的简称 |
Industry | 行业名称 | 上市公司所属2012年证监会行业分类名称 |
Indcode | 行业代码 | 上市公司所属2012年证监会行业分类代码 |
Newsid | 新闻ID | 标识新闻报道的唯一ID |
Reptime | 报道时间 | 新闻报道的时间 |
Repmedia | 报道媒体 | 新闻报道的媒体名称 |
Mediarea | 报道媒体所在地区 | 报道媒体所在省份和城市 |
Sourcemed | 来源媒体 | 新闻转载自的媒体名称 |
Newsemot | 新闻情感 | 新闻的语气,1代表正面,0代表中性,-1代表负面 |
Orirep_Dum | 是否原创 | 新闻是否属于原创性新闻 |
URL | 采集网址 | 新闻来自的网址 |
senten_Num | 正文句子数 | 新闻正文中的全部句子数 |
titlementioned | 标题是否提及 | 在标题中是否提及了该上市公司 |
codesentNum | 正文提及句子数 | 正文提到该上市公司的句子数 |
codecontentNum | 正文提及次数 | 正文提到该上市公司的次数 |
companyNum | 提及全部公司数 | 该新闻提及的全部上市公司数,例如,一篇财经新闻中,A公司出现4次,B公司出现3次,则提及全部公司数为2 |
allcodesentNum | 提及全部公司句子数 | 该新闻提及的全部上市公司的句子数 |
allcodecontentNum | 全部公司提及次数 | 该新闻提及的全部上市公司的次数,例如,一篇财经新闻中,A公司出现4次,B公司出现3次,则全部公司提及次数为7 |
上市公司报刊财经新闻库数据概览
上市公司网络财经新闻库数据概览:
报刊财经新闻相似度数据概览