摘要
线上商品评论有效性分类领域知识模型的构建是商品评论有效性分类的一个重要基础性工作,其直接影响分类器的精度与召回率。以往的研究大多集中于情感词典的构建以及领域术语抽取工作,对于一种专门针对线上商品有效性分类的领域知识库的构建研究较少。本文提出了一种基于信息增益技术进行文本有效性分类领域知识模型构建的半监督方法,同时构建了商品领域停用词表。通过对Amason、淘宝和京东商城iPhone系列手机评论数据利用Python语言进行有效性领域知识抽取和分类预测,实验结果发现该方法显著提高了评论有效性预测的精度。
Domain knowledge construction is anfundamentalwork for the classification of online review effectiveness, which directly affect the precision and recall of the classifier. Previous studies mostly focus on the construction of emotional dictionary and feature extraction work and research on the domain knowledge based online products reviews is rarely encountered. Based on the IG Technology, this paper put forward a semi-supervised domain knowledge construct method and builds the product stop list. Utilizing the Python language to analysis experimental data of iphone6s from Amazon, JD and Taobao, the result shows the referred method significantly improves the effectiveness prediction accuracy.
作者
夏火松
甄化春
张颖烨
杨培
Xia Huosong Zhen Huachun Zhang Yingye Yang Pei(School of Management, Wuhan Textile University, Wuhan 430073 School of Economics, Fudan University, Shanghai 200433 School of Management, Southwest University of Finance and Economics, Chengdu 611130)
出处
《情报学报》
CSSCI
北大核心
2016年第9期946-954,共9页
Journal of the China Society for Scientific and Technical Information
基金
国家自然科学基金项目"大数据情景的outlier分析与异类知识管理研究"(71571139)和"24小时知识工厂的知识共享活动模型与服务支持系统研究"(71171153)
湖北省高等学校人文社会科学重点研究基地-企业决策支持研究中心项目(DSS20150215&DSS20150108)的资助
关键词
信息增益
商品评论
有效性分类
领域知识模型
information gain, product reviews, classification effectives, domain knowledge model