期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种增量式文本软聚类算法
被引量:
3
1
作者
冯中慧
鲍军鹏
沈钧毅
《西安交通大学学报》
EI
CAS
CSCD
北大核心
2007年第4期398-401,411,共5页
针对传统文本聚类算法时间复杂度较高,而与距离无关的算法又不适用于动态、变化的文本集等问题,提出了一种基于语义序列的增量式文本软聚类算法.该算法考虑了长文本的多主题特性,并利用语义序列相似关系计算相似语义序列集合的覆盖度,...
针对传统文本聚类算法时间复杂度较高,而与距离无关的算法又不适用于动态、变化的文本集等问题,提出了一种基于语义序列的增量式文本软聚类算法.该算法考虑了长文本的多主题特性,并利用语义序列相似关系计算相似语义序列集合的覆盖度,同时将每次选择的具有最小熵重叠值的候选类作为一个结果聚类,这样在整个聚类的过程中大大减小了文本向量空间的维数,缩短了计算时间.由于所提算法的语义序列只与文本自身相关,所以它适用于增量式聚类.实验结果表明,算法的聚类精度高于同条件下的其他聚类算法,尤其适合于长文本集的软聚类.
展开更多
关键词
语义序列
增量式聚类
软聚类
文本聚类
下载PDF
职称材料
敏感话题发现中的增量型文本聚类模型
被引量:
6
2
作者
张越今
丁丁
《信息网络安全》
2015年第9期170-174,共5页
面对网络上更新快速的海量新闻,如何快速、有效地从中自动发现敏感话题并进行持续跟踪是当下研究的热点。文章以网络舆情分析系统为应用背景,针对其敏感话题发现过程,通过对TDT领域应用较多的Single-pass算法进行改进,提出了一种基于相...
面对网络上更新快速的海量新闻,如何快速、有效地从中自动发现敏感话题并进行持续跟踪是当下研究的热点。文章以网络舆情分析系统为应用背景,针对其敏感话题发现过程,通过对TDT领域应用较多的Single-pass算法进行改进,提出了一种基于相似哈希的增量型文本聚类算法。基于实际应用中抓取到的新闻文本数据,实验结果表明,文章提出的算法相比于原Single-pass算法在聚类效率方面具有明显提升。从实际应用的效果来看,该算法达到了实时话题发现的预期需求,具有较高的实用价值。
展开更多
关键词
敏感话题发现
相似哈希
增量文本聚类
Single—pass
下载PDF
职称材料
增量文本软聚类速度改善算法设计及仿真
被引量:
1
3
作者
刘艳
周斌
《计算机仿真》
北大核心
2022年第8期524-528,共5页
为全面展示文本信息并清晰划分文本主题类别,提出基于群体智能的增量文本软聚类算法,提升聚类速度并改善聚类效果。计算增量文本中不同主题文本的相似语义序列集合覆盖度,将覆盖度计算过程中的最小熵重叠值的候选类作为下一步聚类的内容...
为全面展示文本信息并清晰划分文本主题类别,提出基于群体智能的增量文本软聚类算法,提升聚类速度并改善聚类效果。计算增量文本中不同主题文本的相似语义序列集合覆盖度,将覆盖度计算过程中的最小熵重叠值的候选类作为下一步聚类的内容,降低软聚类过程中的文本向量空间维数;并通过基于群体智能的蚁群算法让蚂蚁随机选择增量文本,计算增量文本在现阶段局部区域内的群体相似性,得到蚂蚁抓取或丢弃文本的概率,以决定蚂蚁是否抓取、丢弃或移动增量文本,之后采用Python语言构建SCAST程序实现算法迭代训练,使增量文本能够按照其群体相似性聚集至一处,得到文本聚类结果。经仿真验证,上述算法计算语义序列相似度值较高,对异常文本较为敏感,聚类时间较低,能够快速实现增量文本聚类。
展开更多
关键词
群体智能
增量文本
软聚类
蚁群算法
群体相似性
下载PDF
职称材料
题名
一种增量式文本软聚类算法
被引量:
3
1
作者
冯中慧
鲍军鹏
沈钧毅
机构
西安交通大学电子与信息工程学院
出处
《西安交通大学学报》
EI
CAS
CSCD
北大核心
2007年第4期398-401,411,共5页
基金
国家自然科学基金资助项目(60673087)
文摘
针对传统文本聚类算法时间复杂度较高,而与距离无关的算法又不适用于动态、变化的文本集等问题,提出了一种基于语义序列的增量式文本软聚类算法.该算法考虑了长文本的多主题特性,并利用语义序列相似关系计算相似语义序列集合的覆盖度,同时将每次选择的具有最小熵重叠值的候选类作为一个结果聚类,这样在整个聚类的过程中大大减小了文本向量空间的维数,缩短了计算时间.由于所提算法的语义序列只与文本自身相关,所以它适用于增量式聚类.实验结果表明,算法的聚类精度高于同条件下的其他聚类算法,尤其适合于长文本集的软聚类.
关键词
语义序列
增量式聚类
软聚类
文本聚类
Keywords
semantic
sequence
incremental
clustering
soft
clustering
text
clustering
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
敏感话题发现中的增量型文本聚类模型
被引量:
6
2
作者
张越今
丁丁
机构
北京市互联网信息办公室
武汉大学计算机学院
出处
《信息网络安全》
2015年第9期170-174,共5页
文摘
面对网络上更新快速的海量新闻,如何快速、有效地从中自动发现敏感话题并进行持续跟踪是当下研究的热点。文章以网络舆情分析系统为应用背景,针对其敏感话题发现过程,通过对TDT领域应用较多的Single-pass算法进行改进,提出了一种基于相似哈希的增量型文本聚类算法。基于实际应用中抓取到的新闻文本数据,实验结果表明,文章提出的算法相比于原Single-pass算法在聚类效率方面具有明显提升。从实际应用的效果来看,该算法达到了实时话题发现的预期需求,具有较高的实用价值。
关键词
敏感话题发现
相似哈希
增量文本聚类
Single—pass
Keywords
sensitive
topic
detection
Simhash
incremental
text
clustering
Single-pass
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
增量文本软聚类速度改善算法设计及仿真
被引量:
1
3
作者
刘艳
周斌
机构
武汉工程科技学院信息工程学院
华中科技大学软件学院
出处
《计算机仿真》
北大核心
2022年第8期524-528,共5页
基金
2020年度湖北省教育厅科学研究计划指导性项目(B2020291)。
文摘
为全面展示文本信息并清晰划分文本主题类别,提出基于群体智能的增量文本软聚类算法,提升聚类速度并改善聚类效果。计算增量文本中不同主题文本的相似语义序列集合覆盖度,将覆盖度计算过程中的最小熵重叠值的候选类作为下一步聚类的内容,降低软聚类过程中的文本向量空间维数;并通过基于群体智能的蚁群算法让蚂蚁随机选择增量文本,计算增量文本在现阶段局部区域内的群体相似性,得到蚂蚁抓取或丢弃文本的概率,以决定蚂蚁是否抓取、丢弃或移动增量文本,之后采用Python语言构建SCAST程序实现算法迭代训练,使增量文本能够按照其群体相似性聚集至一处,得到文本聚类结果。经仿真验证,上述算法计算语义序列相似度值较高,对异常文本较为敏感,聚类时间较低,能够快速实现增量文本聚类。
关键词
群体智能
增量文本
软聚类
蚁群算法
群体相似性
Keywords
Swarm
intelligence
incremental
text
Soft
clustering
Ant
colony
algorithm
Python
language
Colony
similarity
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一种增量式文本软聚类算法
冯中慧
鲍军鹏
沈钧毅
《西安交通大学学报》
EI
CAS
CSCD
北大核心
2007
3
下载PDF
职称材料
2
敏感话题发现中的增量型文本聚类模型
张越今
丁丁
《信息网络安全》
2015
6
下载PDF
职称材料
3
增量文本软聚类速度改善算法设计及仿真
刘艳
周斌
《计算机仿真》
北大核心
2022
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部