-
题名成本约束下自适应众包标注的用户观点抽取
被引量:3
- 1
-
-
作者
赵威
林煜明
黄涛贻
李优
-
机构
广西可信软件重点实验室(桂林电子科技大学)
广西自动检测技术与仪器重点实验室(桂林电子科技大学)
-
出处
《计算机应用》
CSCD
北大核心
2019年第5期1351-1356,共6页
-
基金
国家自然科学基金资助项目(61562014
U1711263)
+3 种基金
广西自然科学基金重点项目(2018GXNSFDA281049)
桂林电子科技大学研究生优秀学位论文培育项目(16YJPYSS15)
桂林电子科技大学研究生教育创新计划项目(2018YJCX48)
广西可信软件重点实验室研究课题(kx201916)~~
-
文摘
用户评论包含了丰富的用户观点信息,对潜在的顾客和商家具有重要的参考价值。观点目标和观点词作为用户评论中的核心对象,它们的自动抽取是用户评论智能化应用的一项核心工作。目前主要采用有监督的抽取方法解决该问题,这些方法依赖于利用高质量的标注样本进行模型训练,而传统人工标注样本的方法不仅耗时费力,且标注成本高。众包计算为构建高质量训练样本集提供了一种有效途径,然而,众包工作者由于知识背景等因素使得标注结果的质量参差不齐。为了在有限的成本下获取高质量的标注样本,提出一种基于工作者专业水平评估的自适应众包标注方法,构建可靠的观点目标-观点词数据集。首先,通过小成本挖掘出高专业水平的工作者;然后,设计一种基于工作者可靠性的任务分发机制;最后,利用观点目标和观点词间的依赖关系设计了一种有效的标注结果融合算法,通过整合不同工作者的标注结果生成最终可靠的结果。在真实数据集上进行了一系列实验表明,与GLAD模型和多数投票(MV)算法方法相比,所提方法能够在成本预算较小的情况下将构建出的高质量观点目标-观点词数据集的可靠性提高10%左右。
-
关键词
观点挖掘
众包计算
成本约束
工作者检测
数据整合
-
Keywords
opinion mining
crowdsourcing calculation
cost constraint
worker measurement
data integration
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名大规模商品知识的组织和查询优化
被引量:2
- 2
-
-
作者
黄涛贻
李优
宋浩
林煜明
-
机构
桂林电子科技大学广西可信软件重点实验室
桂林电子科技大学广西自动检测技术与仪器重点实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2020年第21期154-163,共10页
-
基金
国家自然科学基金(No.61562014,No.U1811264)
广西自然科学基金重点项目(No.2018GXNSFDA281049)
+2 种基金
广西自动检测技术与仪器重点实验室研究课题(No.YQ17111)
广西可信软件重点实验室研究课题(No.kx201916)
桂林电子科技大学研究生教育创新计划(No.2018YJCX48)。
-
文摘
互联网正面向知识互联的Web3.0时代,其目标是实现人和机器都可以理解的更智能化的网络。在此环境下,各种类型的知识图谱应运而生。商品知识由于知识的异质性,使其管理更具挑战性。设计一种融合了客观性商品分类知识和主观性用户观点的大规模商品知识组织框架;提出了一种基于神经网络的学习索引技术,以此提升查询效率;针对商品知识结构的特性和查询需求的特点,实现了一种基于子变量组合的连接策略。实验结果表明,提出的方法相对于现有的知识管理系统,在大规模商品知识的检索效率上有较大幅度的提升。
-
关键词
商品知识图谱
知识组织
学习索引
查询优化
-
Keywords
product knowledge graph
knowledge organization
learned index
query optimization
-
分类号
TP392
[自动化与计算机技术—计算机应用技术]
-