期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于随机森林的产品垃圾评论识别
被引量:
12
1
作者
何珑
《中文信息学报》
CSCD
北大核心
2015年第3期150-154,161,共6页
目前的产品垃圾评论识别方法只考虑评论特征的选取,忽略了评论数据集的不平衡性。因此该文提出基于随机森林的产品垃圾评论识别方法,即对样本中的大、小类有放回的重复抽取同样数量样本或者给大、小类总体样本赋予同样的权重以建立随机...
目前的产品垃圾评论识别方法只考虑评论特征的选取,忽略了评论数据集的不平衡性。因此该文提出基于随机森林的产品垃圾评论识别方法,即对样本中的大、小类有放回的重复抽取同样数量样本或者给大、小类总体样本赋予同样的权重以建立随机森林模型。通过对亚马逊数据集的实验结果表明,基于随机森林的产品评论识别方法优于其他基线方法。
展开更多
关键词
产品
垃圾
评论
不平衡问题
随机森林
下载PDF
职称材料
融合多特征的产品垃圾评论识别
被引量:
4
2
作者
吴敏
何珑
《微型机与应用》
2012年第22期85-87,90,共4页
针对JINDALN等人新近提出的利用逻辑回归模型识别产品垃圾评论的检测方法中使用过多产品评论特征这一问题,分析了解决方法,并提出对特征进行显著性检验。通过对亚马逊数据集的实验结果表明,采用显著性特征建立的回归模型优于所有特征建...
针对JINDALN等人新近提出的利用逻辑回归模型识别产品垃圾评论的检测方法中使用过多产品评论特征这一问题,分析了解决方法,并提出对特征进行显著性检验。通过对亚马逊数据集的实验结果表明,采用显著性特征建立的回归模型优于所有特征建立的模型。新模型不仅解决了上述问题,减少了计算量,而且整体性能不变,这表明以显著性特征建模有助于提高模型的检测质量。
展开更多
关键词
逻辑回归
产品
垃圾
评论
显著性检验
下载PDF
职称材料
面向产品垃圾评论识别的特征工程
被引量:
1
3
作者
曾德胜
黄发良
潘传迪
《福建师范大学学报(自然科学版)》
CAS
CSCD
北大核心
2017年第2期25-31,共7页
特征工程是产品垃圾评论识别研究中的关键技术之一,绝大多数现有的垃圾评论检测方法都是根据先验知识进行特征选择与指标定义,这类方法主观性过强从而难以应用推广.以电子商务平台"天猫"热销产品评论为研究对象,提出基于评论...
特征工程是产品垃圾评论识别研究中的关键技术之一,绝大多数现有的垃圾评论检测方法都是根据先验知识进行特征选择与指标定义,这类方法主观性过强从而难以应用推广.以电子商务平台"天猫"热销产品评论为研究对象,提出基于评论数据预分析的垃圾评论识别特征工程,然后运用决策树进行垃圾评论检测.实验表明,与其它基于先验的特征工程相比较,该方法能有效提升垃圾评论分类的效果.
展开更多
关键词
产品
垃圾
评论
特征工程
决策树
原文传递
题名
基于随机森林的产品垃圾评论识别
被引量:
12
1
作者
何珑
机构
福州大学信息化建设办公室
福建省超级计算中心
出处
《中文信息学报》
CSCD
北大核心
2015年第3期150-154,161,共6页
基金
福建省自然科学基金(2010J05133)
文摘
目前的产品垃圾评论识别方法只考虑评论特征的选取,忽略了评论数据集的不平衡性。因此该文提出基于随机森林的产品垃圾评论识别方法,即对样本中的大、小类有放回的重复抽取同样数量样本或者给大、小类总体样本赋予同样的权重以建立随机森林模型。通过对亚马逊数据集的实验结果表明,基于随机森林的产品评论识别方法优于其他基线方法。
关键词
产品
垃圾
评论
不平衡问题
随机森林
Keywords
product review spare
imbalance problem
random forest
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
融合多特征的产品垃圾评论识别
被引量:
4
2
作者
吴敏
何珑
机构
福州大学数学与计算机学院
福州大学信息化建设办公室
出处
《微型机与应用》
2012年第22期85-87,90,共4页
文摘
针对JINDALN等人新近提出的利用逻辑回归模型识别产品垃圾评论的检测方法中使用过多产品评论特征这一问题,分析了解决方法,并提出对特征进行显著性检验。通过对亚马逊数据集的实验结果表明,采用显著性特征建立的回归模型优于所有特征建立的模型。新模型不仅解决了上述问题,减少了计算量,而且整体性能不变,这表明以显著性特征建模有助于提高模型的检测质量。
关键词
逻辑回归
产品
垃圾
评论
显著性检验
Keywords
logistic regression(LR)
product review spam
significance testing
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
面向产品垃圾评论识别的特征工程
被引量:
1
3
作者
曾德胜
黄发良
潘传迪
机构
罗定职业技术学院电子信息系
福建师范大学软件学院
温州医科大学附属第一医院浙江省智慧医疗工程技术研究中心
出处
《福建师范大学学报(自然科学版)》
CAS
CSCD
北大核心
2017年第2期25-31,共7页
基金
浙江省智慧医疗工程技术研究中心开放基金(ZH2016004)
福建省教育厅资助项目(JA13077)
文摘
特征工程是产品垃圾评论识别研究中的关键技术之一,绝大多数现有的垃圾评论检测方法都是根据先验知识进行特征选择与指标定义,这类方法主观性过强从而难以应用推广.以电子商务平台"天猫"热销产品评论为研究对象,提出基于评论数据预分析的垃圾评论识别特征工程,然后运用决策树进行垃圾评论检测.实验表明,与其它基于先验的特征工程相比较,该方法能有效提升垃圾评论分类的效果.
关键词
产品
垃圾
评论
特征工程
决策树
Keywords
product review spam
feature engineering
decision tree
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于随机森林的产品垃圾评论识别
何珑
《中文信息学报》
CSCD
北大核心
2015
12
下载PDF
职称材料
2
融合多特征的产品垃圾评论识别
吴敏
何珑
《微型机与应用》
2012
4
下载PDF
职称材料
3
面向产品垃圾评论识别的特征工程
曾德胜
黄发良
潘传迪
《福建师范大学学报(自然科学版)》
CAS
CSCD
北大核心
2017
1
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部