期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
不可靠语料库的提纯及词权度量指标IDF的改进 被引量:1
1
作者 徐山 杜卫锋 《微型机与应用》 2013年第4期61-63,66,共4页
不良短信的泛滥严重影响了社会风气,干扰了人们正常的生活秩序,研发不良短信过滤技术具有相当高的实用价值。研究了文本分类中的两个问题,可应用于不良短信过滤。其一是应用聚类方法进行不可靠语料集的提纯,实验表明,该方法对不可靠数... 不良短信的泛滥严重影响了社会风气,干扰了人们正常的生活秩序,研发不良短信过滤技术具有相当高的实用价值。研究了文本分类中的两个问题,可应用于不良短信过滤。其一是应用聚类方法进行不可靠语料集的提纯,实验表明,该方法对不可靠数据的提纯效果比较明显;其二是关于IDF词权度量指标的一点改进。 展开更多
关键词 短信过滤 不可语料库 向量空间模型 IDF 聚类
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部