-
题名基于机器学习分类算法的高质量专利成果筛选研究
- 1
-
-
作者
周一夫
谭春辉
江婷
李玥澎
毕慧婷
汪红信
-
机构
华中师范大学信息管理学院
湖北技术交易所
武汉大学信息管理学院
-
出处
《现代情报》
北大核心
2024年第2期81-91,共11页
-
基金
2022年度华中师范大学基本科研业务费(人文社科类)交叉科学研究项目“基于大数据的科教智能评价与智慧服务模式研究”(项目编号:CCNU22JC031)。
-
文摘
[目的/意义]基于客观数据形成一套自动筛选方法,对专利成果质量进行快速识别,为推动专利成果转化工作提供决策支持。[方法/过程]首先,以专利成果的发明人数量、IPC号数量等形式特征结合语义向量匹配度特征、专利成果质量标注结果,构建高质量专利成果筛选指标体系;其次,以“先进制造与自动化”领域为例,在专利之星平台检索该领域的发明专利作为专利文本数据来源,并以湖北省需求为例,将其相关的产业发展规划(宏观)和市场技术需求(微观)作为需求文本数据来源;随后,采用分词、去停、文本向量化等步骤对专利文本和需求文本进行处理,并整理形成训练集和测试集;最后,调用8种机器学习分类算法模型进行训练与评估,并对训练效果最优的算法展开应用测试,以验证筛选方法的可行性。[结果/结论]结果显示,随机森林算法模型在选取的8类算法模型中整体表现最优,被用为高质量专利成果筛选方法中的内核分类算法。此外,本文提出的筛选方法对专利成果质量识别具备较强的可行性,能够结合不同省(市)的特定专利需求,快速地进行大批量专利成果的筛选,在一定程度上可有效降低人力、物力和财力成本的消耗。
-
关键词
专利成果筛选
高质量专利成果
机器学习
Doc2vec
-
Keywords
screening of patent results
high-quality patent results
machine learning
Doc2vec
-
分类号
G255
[文化科学—图书馆学]
-