期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于随机森林的产品垃圾评论识别 被引量:12
1
作者 何珑 《中文信息学报》 CSCD 北大核心 2015年第3期150-154,161,共6页
目前的产品垃圾评论识别方法只考虑评论特征的选取,忽略了评论数据集的不平衡性。因此该文提出基于随机森林的产品垃圾评论识别方法,即对样本中的大、小类有放回的重复抽取同样数量样本或者给大、小类总体样本赋予同样的权重以建立随机... 目前的产品垃圾评论识别方法只考虑评论特征的选取,忽略了评论数据集的不平衡性。因此该文提出基于随机森林的产品垃圾评论识别方法,即对样本中的大、小类有放回的重复抽取同样数量样本或者给大、小类总体样本赋予同样的权重以建立随机森林模型。通过对亚马逊数据集的实验结果表明,基于随机森林的产品评论识别方法优于其他基线方法。 展开更多
关键词 产品垃圾评论 不平衡问题 随机森林
下载PDF
融合多特征的产品垃圾评论识别 被引量:4
2
作者 吴敏 何珑 《微型机与应用》 2012年第22期85-87,90,共4页
针对JINDALN等人新近提出的利用逻辑回归模型识别产品垃圾评论的检测方法中使用过多产品评论特征这一问题,分析了解决方法,并提出对特征进行显著性检验。通过对亚马逊数据集的实验结果表明,采用显著性特征建立的回归模型优于所有特征建... 针对JINDALN等人新近提出的利用逻辑回归模型识别产品垃圾评论的检测方法中使用过多产品评论特征这一问题,分析了解决方法,并提出对特征进行显著性检验。通过对亚马逊数据集的实验结果表明,采用显著性特征建立的回归模型优于所有特征建立的模型。新模型不仅解决了上述问题,减少了计算量,而且整体性能不变,这表明以显著性特征建模有助于提高模型的检测质量。 展开更多
关键词 逻辑回归 产品垃圾评论 显著性检验
下载PDF
面向产品垃圾评论识别的特征工程 被引量:1
3
作者 曾德胜 黄发良 潘传迪 《福建师范大学学报(自然科学版)》 CAS CSCD 北大核心 2017年第2期25-31,共7页
特征工程是产品垃圾评论识别研究中的关键技术之一,绝大多数现有的垃圾评论检测方法都是根据先验知识进行特征选择与指标定义,这类方法主观性过强从而难以应用推广.以电子商务平台"天猫"热销产品评论为研究对象,提出基于评论... 特征工程是产品垃圾评论识别研究中的关键技术之一,绝大多数现有的垃圾评论检测方法都是根据先验知识进行特征选择与指标定义,这类方法主观性过强从而难以应用推广.以电子商务平台"天猫"热销产品评论为研究对象,提出基于评论数据预分析的垃圾评论识别特征工程,然后运用决策树进行垃圾评论检测.实验表明,与其它基于先验的特征工程相比较,该方法能有效提升垃圾评论分类的效果. 展开更多
关键词 产品垃圾评论 特征工程 决策树
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部