期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
二次剪枝算法在评论特征提取中的应用 被引量:2
1
作者 吴含前 周立凤 谢珏 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第3期513-517,共5页
针对序列模式挖掘(GSP)算法在中文产品评论特征提取中准确率不够高的问题,提出了一种二次剪枝算法,即利用GSP算法产生候选特征集,然后采用词对共现度作为阈值对其进行进一步筛选,从而达到提高准确率的目的.利用定制化的爬虫工具从京东... 针对序列模式挖掘(GSP)算法在中文产品评论特征提取中准确率不够高的问题,提出了一种二次剪枝算法,即利用GSP算法产生候选特征集,然后采用词对共现度作为阈值对其进行进一步筛选,从而达到提高准确率的目的.利用定制化的爬虫工具从京东网站上抓取摄像头产品的中文评论,选取其中1 000条作为试验数据,采用分词工具ICTCLAS对评论进行分词和数据预处理,并将所提算法与GSP算法、交叉语言模型(CLM)和似然比检验(LRT)进行对比试验.结果表明,利用所提算法获得的中文产品评论特征提取准确率达到76.37%,较GSP算法、CLM和LRT的准确率分别提高2.94%,5.77%和7.57%. 展开更多
关键词 特征提取 二次剪枝 似然比检验 交叉语言模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部