5000万+中国专利数据库(1985-2025.2)

会员限领
| 来源:国家知识产权局

注:该数据限长期会员领取,仅用于学术研究

中国专利数据库收录了1985年以来在中国申请的发明专利、外观设计专利、实用新型专利,目前收录专利5000余万项,每年新增专利约250万项

专利明细数量超过5000万,时间范围为1985-2025.2,并持续更新。专利明细包括专利名称、地址、摘要、IPC号、专利引用等信息。是非常具有价值的研究资料!

中国专利数据库

一、数据介绍

数据名称:中国专利数据库

时间范围:1985-2025.2

样本数量:5135.8万+

数据来源:国家知识产权局

数据整理:马克数据网

更新时间:2025年2月,持续更新

二、数据指标
专利名称专利类型申请人
申请人类型申请人地址申请人地区
申请人城市申请人区县申请号
申请日申请年份公开公告号
公开公告日公开公告年份授权公告号
授权公告日授权公告年份IPC分类号
IPC主分类号发明人摘要文本
主权项内容当前权利人当前专利权人地址
专利权人类型统一社会信用代码引证次数
被引证次数自引次数他引次数
被自引次数被他引次数家族引证次数
家族被引证次数

三、数据概览

中国专利数据库-分年份数据

中国专利数据库-分年份数据

中国专利数据库-数据概览

中国专利数据库-数据概览

四、下载数据

注:该数据为长期会员-附赠数据,仅用于学术研究,可在底部领取数据

最新数据查看:5600万+中国专利数据库(1985-2025.5)

下载链接
需要登录后查看 点击登录
5E6PrV
数据这里的公开公告号是否和之前的数据中专利公开号相同
biton
谢谢分享!
larote
想请问数据是获取后有匹配还是怎么样的处理吗?为什么国家知识产权局1985年大约能搜到一万多条专利,看其他的帖子和柱状图,马克1985年大概只有500多条
xi127
为什么会有几千个重复值
马克数据网
如果按照专利申请的年份分类,这份数据有1万多条;按照专利公开的年份分类,是500多条;如果有重复值,可以直接去重
20140606
老板好,感谢分享。我在用python读取2012年之后的数据时,总是报错“ParserError: Error tokenizing data.” 如果设置on_bad_lines='skip'选项则会导致样本量明显不对,比如2012年只有151151条数据,请问该怎么处理呢?老板,您是否可以考虑提供excel格式或者其他格式呢?
cysmark
20140606你的问题解决了吗
cysmark
合并版本的数据是采用什么方式合并的?
20140606
cysmark:我还没解决。在尝试分块读取大文件,拆分成excel,但excel写入读出速度较慢。后续尝试自己拆分成csv文件看看是否可以用。
20140606
老板,我将90多G那个大文件按照申请年度拆分成多个csv文件后,观测值变成了48302490,不知为何少了几百万条观测值。
马克数据网
回答20140606,请用这个代码打开:pd.read_csv(path,names=['专利名称', '专利类型', '申请人', '申请人类型', '申请人地址', '申请人地区', '申请人城市', '申请人区县','申请号', '申请日', '申请年份', '公开公告号', '公开公告日', '公开公告年份', '授权公告号', '授权公告日', '授权公告年份', 'IPC分类号', 'IPC主分类号', '发明人', '摘要文本', '主权项内容', '当前权利人', '当前专利权人地址', '专利权人类型', '统一社会信用代码', '引证次数', '被引证次数', '自引次数', '他引次数','被自引次数', '被他引次数', '家族引证次数', '家族被引证次数', '其他'])
马克数据网
专利总量是5135.8万+,python的话,请用上面的代码打开,否则会显示不全
1234j
老板,引用次数是截止什么时候的
17312756626
这个数据在哪爬的啊,“中国专利数据库”到底是哪个数据库?有没有具体的网址呢?知识产权局的“专利检索及分析平台”吗?
马克数据网
数据来源为国家知识产权局
18970815906
是怎么在国家知识产权局爬取的
yuanhy
请问每一年统计时间是根据专利申请年份统计的吗?因为有些专利授权时间有一定的滞后性,不知道是不是这样
QwK6H2
有专利转移的数据吗
马克数据网
统计数据是以专利公开年份统计。从专利的申请到授权会有一定的滞后性,比如2024年申请的专利数据,部分可能在2025、2026年才会公开
马克数据网
专利转移数据,过段时间会整理
LEM1fg
好好好
ZnHLkK
好太感谢了
CDH8bn
这个里面的引用量是不是不精确?
wycf5011
为什么下载的没有2017-2024年的数据?
EricJacobJoshua
这些数据是否包含联合专利申请?
马克数据网
专利申请时间为1985-2025.2,包括联合专利申请
AkanishiKizuna
谢谢分享
huzihao
法律状态信息还是没有呢,希望能更新
adzrq7
引证次数 ;被引证次数;自引次数;他引次数;被自引次数;被他引次数这几个指标能不能出一个数据指标的说明出来,不出说明,有时候无法理解其具体指代什么数据,这样数据的有效性不高。
Wangwenfu
家族引证次数和家族被引证次数只指的什么,集团公司?母公司与子公司家族吗?
nzRHDK
请问这个是不是也包括了他们上市之前的专利情况?
马克数据网
1、家族引证与集团公司是不同的概念,一项发明在不同国家或通过不同类型的专利申请途径(例如,PCT、国内直接申请等)对应的一组专利,就构成一个“家族”。这些专利虽在地域或申请方式上有所差异,但它们的技术内容或权益是一致的。2、这份专利数据的范围是所有公司,不只是上市公司,与是否上市无关。3、上市公司的专利数据详见:www.macrodatas.cn/article/1147473361。
2h6Hoa
请问是怎么在国家知识产权局爬取的 知识产权局的“专利检索及分析平台”吗?
客服一:372574023(QQ)
客服二: macrodatas@163.com