-
题名一种基于集成学习的科研合作者潜力预测分类方法
被引量:10
- 1
-
-
作者
艾科
马国帅
杨凯凯
钱宇华
-
机构
山西大学大数据科学与产业研究院
计算智能与中文信息处理教育部重点实验室(山西大学)
山西大学计算机与信息技术学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2019年第7期1383-1395,共13页
-
基金
国家自然科学基金项目(61672332,61432011,U1435212)
山西省海外归国人员研究项目(2017023)~~
-
文摘
科研合作是学术成果非常重要的实现形式,很多高水平的研究成果通过合作实现.研究合作潜力可以为学者选择合作者提供指导,最大化科研效率.然而当前大数据爆发阻碍了合作者的有效选择.为了解决这个问题,基于学者文章大数据,经过特征分析和优化,综合考虑学者的文章、机构、研究兴趣等个人属性和相关属性,分别从文章标题、文章等级、文章数量、时间及署名序多维度构造样本特征,以文章所发表的期刊会议等级作为合作者序列对的样本标签,表示当前合作者的潜力高低,利用集成方法的强学习特性,提出了基于集成学习分类方法的科研合作者潜力预测模型.分析并构造对应于科研合作者潜力预测问题的特征集后,采用分类方法解决这一问题.实验中准确率、召回率、F1分数都远高于传统机器学习方法,并能以较少的样本和时间收敛于较高值(80%以上),说明了模型的优越性.
-
关键词
科研合作
潜力预测
特征构造
学术大数据
集成学习
-
Keywords
scientific cooperation
potential prediction
feature construction
big scholar data
ensemble learning
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
TP391
[自动化与计算机技术—控制科学与工程]
-