期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
二次剪枝算法在评论特征提取中的应用
被引量:
2
1
作者
吴含前
周立凤
谢珏
《东南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2016年第3期513-517,共5页
针对序列模式挖掘(GSP)算法在中文产品评论特征提取中准确率不够高的问题,提出了一种二次剪枝算法,即利用GSP算法产生候选特征集,然后采用词对共现度作为阈值对其进行进一步筛选,从而达到提高准确率的目的.利用定制化的爬虫工具从京东...
针对序列模式挖掘(GSP)算法在中文产品评论特征提取中准确率不够高的问题,提出了一种二次剪枝算法,即利用GSP算法产生候选特征集,然后采用词对共现度作为阈值对其进行进一步筛选,从而达到提高准确率的目的.利用定制化的爬虫工具从京东网站上抓取摄像头产品的中文评论,选取其中1 000条作为试验数据,采用分词工具ICTCLAS对评论进行分词和数据预处理,并将所提算法与GSP算法、交叉语言模型(CLM)和似然比检验(LRT)进行对比试验.结果表明,利用所提算法获得的中文产品评论特征提取准确率达到76.37%,较GSP算法、CLM和LRT的准确率分别提高2.94%,5.77%和7.57%.
展开更多
关键词
特征提取
二次剪枝
词
对
共
现
度
似然比检验
交叉语言模型
下载PDF
职称材料
题名
二次剪枝算法在评论特征提取中的应用
被引量:
2
1
作者
吴含前
周立凤
谢珏
机构
东南大学计算机科学与工程学院
东南大学蒙纳士大学苏州联合研究生院
出处
《东南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2016年第3期513-517,共5页
基金
中央高校基本科研业务费专项资金资助项目
国家高技术研究发展计划(863计划)资助项目(2015AA015904)
文摘
针对序列模式挖掘(GSP)算法在中文产品评论特征提取中准确率不够高的问题,提出了一种二次剪枝算法,即利用GSP算法产生候选特征集,然后采用词对共现度作为阈值对其进行进一步筛选,从而达到提高准确率的目的.利用定制化的爬虫工具从京东网站上抓取摄像头产品的中文评论,选取其中1 000条作为试验数据,采用分词工具ICTCLAS对评论进行分词和数据预处理,并将所提算法与GSP算法、交叉语言模型(CLM)和似然比检验(LRT)进行对比试验.结果表明,利用所提算法获得的中文产品评论特征提取准确率达到76.37%,较GSP算法、CLM和LRT的准确率分别提高2.94%,5.77%和7.57%.
关键词
特征提取
二次剪枝
词
对
共
现
度
似然比检验
交叉语言模型
Keywords
feature extraction
secondary pruning
term pair co-occurrence weight
likelihood ratio test
cross language model
分类号
TP315.69 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
二次剪枝算法在评论特征提取中的应用
吴含前
周立凤
谢珏
《东南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2016
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部