基于机器阅读理解模型与众包验证的属性值抽取方法被引量：1

Attribute Value Extraction Method Based on Machine Reading Comprehension Model and Crowdsourcing Verification

下载PDF

导出

摘要由于互联网语料的高噪音特性,传统的属性值抽取方法存在人工成本增加及训练集缺乏等问题。提出一种新的实体属性值抽取方法。利用机器阅读理解模型,从互联网语料中抽取出高质量的候选属性值,通过高效的众包验证机制调整各候选属性值的权重,得到最终抽取结果。实验结果表明,与OpenTag、QANET等模型相比,该机器阅读理解模型有效提升了候选属性值抽取的准确性,抽取准确率提升10%左右,同时通过众包验证方法,能够以较低的众包成本提高属性值抽取的整体性能。 Due to the high noise characteristics of Internet corpus,traditional extraction methods based on attribute values suffer from increased labor costs and lack of training sets.This paper proposes an entity attribute value extraction method based on machine reading comprehension model and crowdsourcing verification.The new machine reading comprehension model is used to extract high-quality candidate attribute values from the Internet corpus,and the weight of each candidate attribute value is adjusted through an efficient crowdsourcing verification mechanism to obtain the final extraction result.Experimental results show that compared with OpenTag,QANET and other models,the machine reading comprehension model effectively improves the accuracy of candidate attribute value extraction,and the extraction accuracy is increased by about 10%.At the same time,it can improve the overall performance of attribute value extraction at a low crowdsourcing cost by using crowdsourcing verification.

作者冯桫刘井平蒋海云肖仰华 FENG Suo;LIU Jingping;JIANG Haiyun;XIAO Yanghua(School of Computer Science,Fudan University,Shanghai 200433,China)

机构地区复旦大学计算机科学技术学院

出处《计算机工程》 CAS CSCD 北大核心 2021年第5期97-103,共7页 Computer Engineering

基金上海市科技创新行动计划(19511120400)。

关键词属性值抽取机器阅读理解模型知识图谱众包序列标注 attribute value extraction machine reading comprehension model knowledge graph crowdsourcing sequence labeling

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1吴玺煜,陈启买,刘海,贺超波.基于知识图谱表示学习的协同过滤推荐算法[J].计算机工程,2018,44(2):226-232. 被引量：43
2张应成,杨洋,蒋瑞,全兵,张利君,任晓雷.基于BiLSTM-CRF的商情实体识别模型[J].计算机工程,2019,45(5):308-314. 被引量：37

二级参考文献7

1肖明,邱小花,黄界,李国俊,冯召辉.知识图谱工具比较研究[J].图书馆杂志,2013,32(3):61-69. 被引量：123
2杨兴耀,于炯,吐尔根.依布拉音,廖彬,钱育蓉.融合奇异性和扩散过程的协同过滤模型[J].软件学报,2013,24(8):1868-1884. 被引量：30
3李文海,许舒人.基于Hadoop的电子商务推荐系统的设计与实现[J].计算机工程与设计,2014,35(1):130-136. 被引量：44
4张蕾,章毅.大数据分析的无限深度神经网络方法[J].计算机研究与发展,2016,53(1):68-79. 被引量：79
5杨武,唐瑞,卢玲.基于内容的推荐与协同过滤融合的新闻推荐方法[J].计算机应用,2016,36(2):414-418. 被引量：69
6刘康,张元哲,纪国良,来斯惟,赵军.基于表示学习的知识库问答研究进展与展望[J].自动化学报,2016,42(6):807-818. 被引量：27
7文俊浩,袁培雷,曾骏,王喜宾,周魏.基于标签主题的协同过滤推荐算法研究[J].计算机工程,2017,43(1):247-252. 被引量：23

共引文献78

1匡容,杨振国,刘文印.基于多重因素的个性化学习推荐系统[J].计算机应用研究,2020,37(1):183-187. 被引量：7
2乔秀珍.基于智能推荐的图书馆管理系统设计[J].微型电脑应用,2018,34(12):76-78. 被引量：3
3陈平华,朱禹.融合知识图谱表示学习和矩阵分解的推荐算法[J].计算机工程与设计,2018,39(10):3137-3142. 被引量：6
4李梅珍.大数据环境下高校图书馆建立科研数据知识库智能推荐系统的思考[J].图书馆学刊,2019,41(3):102-105. 被引量：8
5孙雨生,祝博,朱礼军.国内基于知识图谱的信息推荐研究进展[J].情报理论与实践,2019,42(12):163-169. 被引量：12
6李浩,张亚钏,康雁,杨兵,卜荣景,李晋源.融合循环知识图谱和协同过滤电影推荐算法[J].计算机工程与应用,2020,56(2):106-114. 被引量：28
7王海宁,周菊香,徐天伟.融合深度学习与规则的民族工艺品领域命名实体识别[J].云南师范大学学报（自然科学版）,2020,40(2):48-54. 被引量：3
8许智宏,赵杏,董永峰,闫文杰.基于知识图谱知识推理的视频推荐算法[J].计算机工程与设计,2020,41(3):710-715. 被引量：11
9王栋,李业刚,张晓.基于多神经网络协同训练的命名实体识别[J].智能计算机与应用,2020,10(2):123-127. 被引量：1
10程名,于红,冯艳红,任媛,付博,刘巨升,杨鹤.融合注意力机制和BiLSTM+CRF的渔业标准命名实体识别[J].大连海洋大学学报,2020,35(2):296-301. 被引量：17

同被引文献13

1石豪,李红娟,赖雯,赵英.基于folksonomy标签的用户分类研究[J].图书情报工作,2011,55(2):117-120. 被引量：14
2尤天慧,高美丽.一种基于误差分析的区间数多属性决策方法[J].系统管理学报,2014,23(2):224-228. 被引量：18
3刘红岩,陈剑,陈国青.数据挖掘中的数据分类算法综述[J].清华大学学报（自然科学版）,2002,42(6):727-730. 被引量：168
4朱红灿,胡新,李顺利.基于Kano模型的政府数据开放平台用户体验要素分类研究[J].现代情报,2018,38(12):13-21. 被引量：37
5卢恒,张向先,张莉曼,陶兴.会话分析视角下虚拟学术社区用户交互行为特征研究[J].图书情报工作,2020,64(13):80-89. 被引量：15
6冀慧杰,倪枫,刘姜,赵燚.基于灰色关联度和K-Means++的电子商务客户价值分类[J].计算机系统应用,2020,29(9):249-254. 被引量：12
7张振刚,罗泰晔.基于RFM模型和随机行动者导向模型的技术机会识别[J].情报学报,2021,40(1):53-61. 被引量：17
8胡至洵,杜宇,刘潇月.基于用户兴趣分类的书籍自动推荐系统设计[J].现代电子技术,2021,44(6):58-62. 被引量：5
9尚晖.基于改进SVM的互联网用户分类[J].计算机系统应用,2021,30(4):266-270. 被引量：3
10林杰,杨兆洁.用户网络行为特征与专业知识水平——基于“汽车之家”注册用户的实证研究[J].管理评论,2021,33(5):331-340. 被引量：2

引证文献1

1陈丹红,彭张林,万德全,杨善林.众包平台用户价值识别与细分:基于改进的RFM模型[J].计算机科学,2022,49(4):37-42. 被引量：6

二级引证文献6

1曾子纯.浅谈会员制体系如何助力商业银行精细化运营[J].现代经济信息,2023(8):149-151.
2张睿轩,张佳璇,李顺勇.基于改进RFM模型的客户筛选及协同过滤推荐算法[J].网络安全技术与应用,2023(7):42-45. 被引量：1
3邓任锋.基于RFMRQ模型的协同过滤推荐算法研究——以服装电商平台为例[J].纺织报告,2023,42(12):18-21.
4崔雯,李剑锋.基于K-means算法的跨国零售商客户细分研究[J].中国商论,2024(9):37-40.
5侯石鹏,唐艺楠,宋红文,马文彪,赵斌,张卫东.基于DEA的消费者价值模型研究[J].商展经济,2024(9):115-118.
6张利斌.改进的RFM模型和K-means算法在会员分类中的应用研究[J].常州信息职业技术学院学报,2024,23(3):47-51.

1程祥威,谢文亮,杨朝,朱业超.取向硅钢涂层对噪音特性的影响[J].电工钢,2019,1(2):29-32. 被引量：2
2于明月,李磊.应用型本科旅游管理专业人才培养机制研究[J].旅游与摄影,2021(2):106-107.
3张炜,施展.新基建背景下的咨询服务转型思考[J].中国工程咨询,2021(4):65-68.
4张向英.低噪音润滑脂展望[J].合成润滑材料,2021,48(1):35-37. 被引量：3
5丁玲,向阳.基于分层次多粒度语义融合的中文事件检测[J].计算机科学,2021,48(5):202-208. 被引量：9

计算机工程

2021年第5期

浏览历史

内容加载中请稍等...

基于机器阅读理解模型与众包验证的属性值抽取方法被引量：1

参考文献2

二级参考文献7

共引文献78

同被引文献13

引证文献1

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于机器阅读理解模型与众包验证的属性值抽取方法 被引量：1

参考文献2

二级参考文献7

共引文献78

同被引文献13

引证文献1

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于机器阅读理解模型与众包验证的属性值抽取方法被引量：1