期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
一种层次化的检索结果聚类方法 被引量:15
1
作者 张刚 刘悦 +1 位作者 郭嘉丰 程学旗 《计算机研究与发展》 EI CSCD 北大核心 2008年第3期542-547,共6页
检索结果聚类能够帮助用户快速地浏览搜索引擎返回的结果.传统的聚类方法由于不能生成有意义的类别标签因此是不适合的,为了改善检索结果层次化聚类的效果,采用了基于标签的聚类算法,提出了将DF、查询日志、查询词上下文特征融合的类别... 检索结果聚类能够帮助用户快速地浏览搜索引擎返回的结果.传统的聚类方法由于不能生成有意义的类别标签因此是不适合的,为了改善检索结果层次化聚类的效果,采用了基于标签的聚类算法,提出了将DF、查询日志、查询词上下文特征融合的类别标签抽取算法,并以抽取的标签构造基础类别图,通过GBCA算法构建层次化聚类结果.实验证明了多特征融合模型的有效性;GBCA算法在类别标签抽取和F-Measure两个评价指标上都比STC和Snaket算法有很大的提高. 展开更多
关键词 信息检索 检索结果 层次化 文本
下载PDF
一种基于遗传算法的分裂式层次化聚类算法 被引量:8
2
作者 任江涛 吴海建 +2 位作者 吴向军 印鉴 张毅 《计算机应用》 CSCD 北大核心 2005年第11期2618-2620,2629,共4页
针对聚类中自适应确定聚类个数、目标函数灵活定义及优化的近似计算等问题,综合了分裂式层次化聚类算法能根据相似度阈值自适应地确定聚类个数的特点及二进制遗传聚类算法具有较强的搜索近似最优解能力及目标函数定义灵活的特点,提出了... 针对聚类中自适应确定聚类个数、目标函数灵活定义及优化的近似计算等问题,综合了分裂式层次化聚类算法能根据相似度阈值自适应地确定聚类个数的特点及二进制遗传聚类算法具有较强的搜索近似最优解能力及目标函数定义灵活的特点,提出了一种基于遗传算法的分裂式层次化聚类方法。实验结果表明,该算法具有较好的聚类性能。 展开更多
关键词 遗传算法 层次化 目标函数
下载PDF
利用标签的层次化搜索结果聚类方法 被引量:5
3
作者 张云 冯博琴 《西安交通大学学报》 EI CAS CSCD 北大核心 2009年第4期18-21,38,共5页
为了提高搜索引擎返回结果的可浏览性,满足用户对查询质量的要求,提出了一种层次化搜索结果聚类方法.首先,从搜索引擎的返回结果提取出文档集,并对每一个文档进行词干化、去除停用词等操作.然后,根据词共现信息来发现文档集中的频繁2元... 为了提高搜索引擎返回结果的可浏览性,满足用户对查询质量的要求,提出了一种层次化搜索结果聚类方法.首先,从搜索引擎的返回结果提取出文档集,并对每一个文档进行词干化、去除停用词等操作.然后,根据词共现信息来发现文档集中的频繁2元组,再将2元组扩展为n元组,对所有元组进行去冗余、重要性排序,从而获得候选聚类标签.最后,基于该标签对返回结果中的文档进行分配与聚集,形成层次化聚类结果.实验结果表明,所提方法可以通过获得的准确、可读性较好的聚类标签,帮助用户有效地浏览搜索引擎返回的结果.与Vivisimo、STC、Lingo算法比较,以及在多个评价指标上的综合实验结果也表明,该方法是有效的. 展开更多
关键词 搜索结果 词共现 候选标签 层次化
下载PDF
基于标签聚类的中文重叠命名实体识别方法 被引量:6
4
作者 温秀秀 马超 +1 位作者 高原原 康子路 《计算机工程》 CAS CSCD 北大核心 2020年第5期41-46,共6页
为解决命名实体之间的复杂嵌套以及语料库中标注误差导致的相邻命名实体边界重叠问题,提出一种中文重叠命名实体识别方法。利用基于随机合并与拆分的层次化聚类算法将重叠命名实体标签划分到不同的聚类簇中,建立文字到实体标签之间的一... 为解决命名实体之间的复杂嵌套以及语料库中标注误差导致的相邻命名实体边界重叠问题,提出一种中文重叠命名实体识别方法。利用基于随机合并与拆分的层次化聚类算法将重叠命名实体标签划分到不同的聚类簇中,建立文字到实体标签之间的一对一关联关系,解决了实体标签聚类陷入局部最优的问题,并在每个标签聚类簇中采用融合中文部首的BiLSTM-CRF模型提高重叠命名实体的识别稳定性。实验结果表明,该方法通过标签聚类的方式有效避免标注误差对识别过程的干扰,F1值相比现有识别方法平均提高了0.05。 展开更多
关键词 命名实体识别 实体重叠 中文命名实体 标签 层次化
下载PDF
雷达辐射源信号聚类分选算法 被引量:4
5
作者 陈韬伟 金炜东 李杰 《电路与系统学报》 CSCD 北大核心 2011年第3期56-61,共6页
基于脉内特征参数的聚类是实现雷达辐射源信号分选的一种重要途径。本文在小波域滤波算法的基础上提出一种新的雷达辐射源信号脉内特征提取和聚类分选方法,将小波变换后的低频逼近小波系数的能量分布熵与经过尺度相关去噪计算后反映信... 基于脉内特征参数的聚类是实现雷达辐射源信号分选的一种重要途径。本文在小波域滤波算法的基础上提出一种新的雷达辐射源信号脉内特征提取和聚类分选方法,将小波变换后的低频逼近小波系数的能量分布熵与经过尺度相关去噪计算后反映信号边缘的高频细节小波系数能量分布熵作为分选的脉内特征向量,并引入灰关联测度来衡量脉内特征样本之间的相似程度,实现雷达辐射源信号的聚类分选。通过对10种不同雷达辐射源信号的仿真实验分析表明:提取的样本特征在低信噪比(0dB)下具有很好的抗噪性。同时与FCM聚类相比,基于灰关联测度的层次聚类算法具有更高的分类正确率。 展开更多
关键词 雷达辐射源信号分选 小波变换 尺度间相关去噪 灰关联分析 层次化
下载PDF
基于灰关联分析的雷达辐射源信号盲分类 被引量:3
6
作者 陈韬伟 金炜东 陈振兴 《计算机工程与设计》 CSCD 北大核心 2009年第20期4686-4689,共4页
提出了一种基于灰关联测度的分裂式层次聚类算法来实现雷达辐射源信号的盲分类。目前广泛使用的许多聚类算法中都需要预先确定类的数目,该算法能很好的解决这个问题。通过提取雷达辐射源信号在频域内的小波系数作为聚类的样本空间,用灰... 提出了一种基于灰关联测度的分裂式层次聚类算法来实现雷达辐射源信号的盲分类。目前广泛使用的许多聚类算法中都需要预先确定类的数目,该算法能很好的解决这个问题。通过提取雷达辐射源信号在频域内的小波系数作为聚类的样本空间,用灰关联测度来衡量数据样本之间的相似程度,采用自顶向下基于密度扩展的分裂式层次化聚类策略,生成不同层次的划分,然后根据提出的聚类有效性指标估计类的数目。仿真实验结果表明,该算法能够获得较好的分类结果。 展开更多
关键词 雷达辐射源信号 灰关联分析 层次化 有效性指标
下载PDF
面向排序学习的层次聚类特征选择算法 被引量:3
7
作者 孟昱煜 陈绍立 刘兴长 《计算机工程与科学》 CSCD 北大核心 2019年第12期2211-2216,共6页
大型搜索系统对用户查询的快速响应尤为必要,同时在计算候选文档的特征相关性时,必须遵守严格的后端延迟约束。通过特征选择,提高了机器学习的效率。针对排序学习中快速特征选择的起点多为单一排序效果最好的特征的特点,首先提出了一种... 大型搜索系统对用户查询的快速响应尤为必要,同时在计算候选文档的特征相关性时,必须遵守严格的后端延迟约束。通过特征选择,提高了机器学习的效率。针对排序学习中快速特征选择的起点多为单一排序效果最好的特征的特点,首先提出了一种用层次聚类法生成特征选择起点的算法,并将该算法应用于已有的2种快速特征选择中。除此之外,还提出了一种充分利用聚类特征的新方法来处理特征选择。在2个标准数据集上的实验表明,该算法既可以在不影响精度的情况下获得较小的特征子集,也可以在中等子集上获得最佳的排序精度。 展开更多
关键词 特征选择 排序学习 层次化 贪婪搜索
下载PDF
一种结合K-Means的层次化的搜索结果聚类方法
8
作者 于洪 谌强 《重庆邮电大学学报(自然科学版)》 北大核心 2010年第3期355-359,共5页
针对用户在搜索结果列表中寻找所需信息困难的问题,在分析了Web搜索结果的特点的基础上,提出了一种结合K-Means的层次化方法对搜索结果进行聚类,并通过向用户提供查询结果的类别标签分类显示结果,从而大大提高可浏览性。同时,在该方法... 针对用户在搜索结果列表中寻找所需信息困难的问题,在分析了Web搜索结果的特点的基础上,提出了一种结合K-Means的层次化方法对搜索结果进行聚类,并通过向用户提供查询结果的类别标签分类显示结果,从而大大提高可浏览性。同时,在该方法的基础上设计并实现了一个搜索结果聚类原型系统,实验结果表明新方法是可行的。 展开更多
关键词 搜索结果 层次化 标签
下载PDF
反舰导弹目标分群的层次化聚类算法研究 被引量:1
9
作者 徐建志 《战术导弹技术》 北大核心 2008年第3期76-79,共4页
合理的目标分群是反舰导弹对海上目标进行正确判别、选择和攻击的重要前提.为有效运用层次化聚类方法进行海上目标分群,介绍了层次化聚类的两种实现方法、五种联接规则和六种距离尺度,提出了基于学生残差的聚类效果检验方法,结合反舰导... 合理的目标分群是反舰导弹对海上目标进行正确判别、选择和攻击的重要前提.为有效运用层次化聚类方法进行海上目标分群,介绍了层次化聚类的两种实现方法、五种联接规则和六种距离尺度,提出了基于学生残差的聚类效果检验方法,结合反舰导弹末制导雷达对海上双环形编队和双线形编队的目标分群实例进行了计算和分析.结果表明,学生残差检验法是有效的,并且在W ard方法和欧几里德平方距离尺度下可以得到较好的聚类效果,针对具体应用选择合适的联接规则和距离尺度将有效提高层次化聚类效果. 展开更多
关键词 目标分群 层次化 联接规则 距离尺度 学生残差检验法
下载PDF
基于遗传算法的混合类型数据聚类分析
10
作者 董健康 吴启明 《电脑知识与技术(过刊)》 2009年第11X期8875-8876,共2页
针对聚类分析算法在数据挖掘应用中存在的问题,该文结合遗传算法,对传统K均值聚类算法进行了改进,提出了混合类型数据聚类新算法,扩展了聚类分析的应用范围。实验结果表明,该算法具有较好的聚类性能。
关键词 遗传算法 层次化 目标函数
下载PDF
基于自适应层次化聚类算法的应用层多播协议
11
作者 程鹏 吴秋峰 戴琼海 《计算机工程》 CAS CSCD 北大核心 2007年第8期97-99,102,共4页
自适应层次化聚类算法将单层拓扑映射为一个层次化结构,改善了应用层多播算法的可扩展性。但它也引入了较高的根节点度数,无法有效控制多播树的形态,不适合用于多媒体等内容的多播通信。通过“剪枝重置”和“构建顶层拓扑”操作,可以弥... 自适应层次化聚类算法将单层拓扑映射为一个层次化结构,改善了应用层多播算法的可扩展性。但它也引入了较高的根节点度数,无法有效控制多播树的形态,不适合用于多媒体等内容的多播通信。通过“剪枝重置”和“构建顶层拓扑”操作,可以弥补自适应层次化聚类算法的缺陷。仿真试验表明,前者可以减少树的层数和同一个聚类中的节点密度;后者可以减轻多播树根节点的负担。相对于采用传统路由算法得到的单层拓扑多播树,该文得到的多播树在开销、时延和度数方面都有显著的优化。 展开更多
关键词 多播 应用层多播 自适应 自适应层次化
下载PDF
层次化聚类在分布式计算环境中的剪枝策略 被引量:1
12
作者 丁晓阳 罗阳 王建新 《计算机应用与软件》 2017年第5期261-267,共7页
基于树结构中结点覆盖关系的一类层次化聚类算法可以对海量数据生成有意义的摘要。然而,该算法已被证明是NP-完全问题,求解其精确解需要庞大的计算量。虽然它在单机计算环境中存在有效的剪枝方法,但在分布式计算环境中这种剪枝算法并不... 基于树结构中结点覆盖关系的一类层次化聚类算法可以对海量数据生成有意义的摘要。然而,该算法已被证明是NP-完全问题,求解其精确解需要庞大的计算量。虽然它在单机计算环境中存在有效的剪枝方法,但在分布式计算环境中这种剪枝算法并不可行。相应地提出了该层次聚类算法在分布式环境中的剪枝新策略,通过绑定结点与其覆盖的基本事件构成的有序数组,使穷举查询转换为有序数组的求交集运算,并能够在合并过程中执行大量剪枝,从而在有限的额外空间消耗的基础上显著减少计算时间。在2组公开基准数据集上进行了测试,结果表明,相比朴素的分布式计算策略,新的层次化聚类算法在时间效率上平均有30~40倍左右的提升。 展开更多
关键词 层次化算法 分布式计算环境 剪枝操作
下载PDF
基于层次化聚类的稀疏谓词语义角色标注方法 被引量:1
13
作者 杨海彤 《计算机工程与设计》 北大核心 2018年第11期3384-3388,3407,共6页
中文语义角色标注中,稀疏谓词的标注性能要远远低于其它谓词,而在实际应用中,标注系统经常需要处理大量的稀疏谓词,因此,稀疏谓词问题大大限制了语义角色标注系统的应用效果。为解决上述问题,提出一种基于聚合层次化聚类的方法。通过聚... 中文语义角色标注中,稀疏谓词的标注性能要远远低于其它谓词,而在实际应用中,标注系统经常需要处理大量的稀疏谓词,因此,稀疏谓词问题大大限制了语义角色标注系统的应用效果。为解决上述问题,提出一种基于聚合层次化聚类的方法。通过聚合层次化聚类建立起稀疏谓词与常见谓词的联系,稀疏谓词可以泛化为与之语义相近的常用谓词,缓和语义角色标注系统中的稀疏谓词问题。在中文命题库上的实验结果表明,该方法可有效处理中文语义角色标注中的稀疏谓词问题。 展开更多
关键词 语义角色标注 稀疏谓词 层次化 常见谓词 语义
下载PDF
Renyi信息熵指导下的聚合层次化聚类
14
作者 白雪 罗四维 黄雅平 《北京交通大学学报》 CAS CSCD 北大核心 2011年第5期78-83,共6页
聚合层次化聚类是聚类分析中发现数据集潜在结构的一类重要方法.在这类方法中,影响聚类质量的一个关键问题是如何度量子类之间的距离.作为子类间的相似性度量,不但可以通过非参数估计的方式进行计算,还可有效地利用子类数据集中所有样... 聚合层次化聚类是聚类分析中发现数据集潜在结构的一类重要方法.在这类方法中,影响聚类质量的一个关键问题是如何度量子类之间的距离.作为子类间的相似性度量,不但可以通过非参数估计的方式进行计算,还可有效地利用子类数据集中所有样本提供的信息,对子类中数据分布的描述更加充分.实验结果显示,在两种具有代表性的人造数据集上,基于Renyi熵的类间距离度量比3种传统度量方法有更好的层次化聚类效果.并且,在图像过分割的情况下,通过Renyi熵距离对子分割区域进行合并可以找到合理的分割目标. 展开更多
关键词 层次化 图像过分割 RENYI熵
下载PDF
基于稀疏连接的层次化多核K-Means算法 被引量:2
15
作者 王雷 杜亮 周芃 《计算机科学》 CSCD 北大核心 2023年第2期138-145,共8页
多核学习(Multiple Kernel Learning,MKL)的目标是寻找一个最优的一致性核函数。在层次化多核聚类算法(HMKC)中,通过从高维空间中对样本特征进行逐层提取的方式来实现最大化地保留有效信息,但是却忽略了层与层之间的信息交互。该模型中... 多核学习(Multiple Kernel Learning,MKL)的目标是寻找一个最优的一致性核函数。在层次化多核聚类算法(HMKC)中,通过从高维空间中对样本特征进行逐层提取的方式来实现最大化地保留有效信息,但是却忽略了层与层之间的信息交互。该模型中只有相邻层中对应的结点会进行信息交互,对于其他结点来说是孤立的,而采用全连接的方式又会削弱最终一致性矩阵的多样性。因此,文中提出了一种基于稀疏连接的层次化多核K-Means算法(Sparse Connectivity Hierarchical Multiple Kernel K-Means,SCHMKKM)。该算法通过稀疏率来控制分配矩阵以达到稀疏连接的效果,从而将层与层之间信息蒸馏得到的特征进行局部融合。最后,在多个数据集上进行聚类分析,并在实验中与全连接的层次化多核K-Means算法(FCHMKKM)进行实验对比,证明了具有更多差异性的信息融合有利于学习更好的一致性划分矩阵,并且稀疏连接的融合策略优于全连接的策略。 展开更多
关键词 多核学习 层次化多核 稀疏连接 全连接 信息蒸馏 局部融合
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部