期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
基于主题模型的检索结果聚类应用研究 被引量:14
1
作者 阮光册 夏磊 《情报杂志》 CSSCI 北大核心 2017年第3期179-184,共6页
[目的/意义]检索结果聚类能够帮助用户快速地浏览系统返回的检索结果。传统的基于向量空间的检索结果聚类缺乏对文本深层次的语义联系的挖掘,使得聚类结果的可读性、可理解性存在不足。因此,对检索结果进行语义层面的分析,并实现基于语... [目的/意义]检索结果聚类能够帮助用户快速地浏览系统返回的检索结果。传统的基于向量空间的检索结果聚类缺乏对文本深层次的语义联系的挖掘,使得聚类结果的可读性、可理解性存在不足。因此,对检索结果进行语义层面的分析,并实现基于语义的检索结果聚类研究,具有重要的理论和实践意义。[方法/过程]将LDA主题模型与K-means算法相结合,利用LDA模型实现文本潜在语义的识别,将"文本-潜在主题"概率分布作为Kmeans聚类依据进行聚类分析,最后提取与聚类中心最近的主题的描述词作为检索结果聚类的标签。[结果/结论]实验表明,该方法在检索结果聚类以及聚类标签识别上具有很好的效果。 展开更多
关键词 LDA 检索结果 标签 概率分布 语义挖掘 K-MEANS
下载PDF
基于N元语法的英文学术文献聚类标签抽取算法 被引量:3
2
作者 吴夙慧 成颖 +1 位作者 郑彦宁 潘云涛 《现代图书情报技术》 CSSCI 北大核心 2011年第7期68-75,共8页
提出一种基于N元语法的英文学术文献聚类标签抽取算法,该算法利用N元语法在大规模语料库上进行先期学习生成领域短语词表,再通过K-means算法进行聚类,从聚簇中抽取N元语法项计算TFIDF值,对出现在词表中的特征项赋以更高的权值,以得分最... 提出一种基于N元语法的英文学术文献聚类标签抽取算法,该算法利用N元语法在大规模语料库上进行先期学习生成领域短语词表,再通过K-means算法进行聚类,从聚簇中抽取N元语法项计算TFIDF值,对出现在词表中的特征项赋以更高的权值,以得分最高的特征项作为聚类标签。实验结果表明,该算法能获得更好的实验效果。同时,在抽取聚类标签时提出一种改进的TFIDF权重计算,在评价标签质量时提出一种新的标签评价方法R@N方法。 展开更多
关键词 标签 N元语法 学术文献
原文传递
改进后缀树的中文检索结果聚类研究 被引量:1
3
作者 袁津生 荣元媛 《计算机工程与应用》 CSCD 2014年第21期143-146,共4页
检索结果聚类能够帮助用户快速定位需要查找的信息。注重进行中文文本聚类的同时生成高质量的标签,获取搜索引擎返回的网页标题和摘要,利用分词工具对文本分词,去除停用词;统一构建一棵后缀树,以词语为单位插入后缀树各节点,通过词频、... 检索结果聚类能够帮助用户快速定位需要查找的信息。注重进行中文文本聚类的同时生成高质量的标签,获取搜索引擎返回的网页标题和摘要,利用分词工具对文本分词,去除停用词;统一构建一棵后缀树,以词语为单位插入后缀树各节点,通过词频、词长、词性和位置几项约束条件计算各节点词语得分;合并基类取得分高的节点词作标签。实验结果显示该方法的聚类簇纯度较高,提取的标签准确且区分性较强,方便用户使用。 展开更多
关键词 检索结果 后缀树 标签 中文检索
下载PDF
联合国可持续发展目标的研究方向正在调整 被引量:1
4
作者 Masafumi Nakamura David Pendlebury +1 位作者 Joshua Schnell Martin Szomszor 《科学观察》 2020年第1期38-47,共10页
"要意识到,万物相连"——达·芬奇引言联合国可持续发展目标(SDG)是对美好未来的共同愿望,也是协调投入和共同努力的重要议程。2015年9月联合国大会通过了可持续发展议程(A/RES/70/1),其进展可以通过包括17个主要目标的23... "要意识到,万物相连"——达·芬奇引言联合国可持续发展目标(SDG)是对美好未来的共同愿望,也是协调投入和共同努力的重要议程。2015年9月联合国大会通过了可持续发展议程(A/RES/70/1),其进展可以通过包括17个主要目标的232个具体指标进行追踪。可持续发展的推进离不开各个国家和地区政府利用现有资源和知识,组织和推动相关重要工作,许多项目需要在现有的科学知识和新的尝试基础上,开展多学科的研究和创新。 展开更多
关键词 可持续发展目标 专题地图 联合国 标签
原文传递
基于后缀树的Web检索结果聚类标签生成方法 被引量:9
5
作者 骆雄武 万小军 +1 位作者 杨建武 吴於茜 《中文信息学报》 CSCD 北大核心 2009年第2期83-88,共6页
对检索结果进行聚类能够方便用户从搜索结果中快速地找到自己需要的信息,当前已有各种聚类方法和系统被广泛使用,但是,现有大部分方法由于聚类标签的可读性和描述性较差,难以达到预期效果。该文提出了一种新的思路,注重于如何在聚类之... 对检索结果进行聚类能够方便用户从搜索结果中快速地找到自己需要的信息,当前已有各种聚类方法和系统被广泛使用,但是,现有大部分方法由于聚类标签的可读性和描述性较差,难以达到预期效果。该文提出了一种新的思路,注重于如何在聚类之前就产生好的标签,在生成了标签的基础上,再进行检索结果聚类。对于搜索引擎返回的结果,我们先统一建立一棵后缀树,然后计算后缀树中各个短语的得分,选取得分最高的若干短语作为候选标签。得到标签后,将搜索引擎返回的各个结果项分配到它所包含的标签对应的分类中,形成最后的聚类。实验表明,我们的方法是比较有效的。 展开更多
关键词 计算机应用 中文信息处理 检索结果 标签生成 后缀树
下载PDF
利用标签的层次化搜索结果聚类方法 被引量:5
6
作者 张云 冯博琴 《西安交通大学学报》 EI CAS CSCD 北大核心 2009年第4期18-21,38,共5页
为了提高搜索引擎返回结果的可浏览性,满足用户对查询质量的要求,提出了一种层次化搜索结果聚类方法.首先,从搜索引擎的返回结果提取出文档集,并对每一个文档进行词干化、去除停用词等操作.然后,根据词共现信息来发现文档集中的频繁2元... 为了提高搜索引擎返回结果的可浏览性,满足用户对查询质量的要求,提出了一种层次化搜索结果聚类方法.首先,从搜索引擎的返回结果提取出文档集,并对每一个文档进行词干化、去除停用词等操作.然后,根据词共现信息来发现文档集中的频繁2元组,再将2元组扩展为n元组,对所有元组进行去冗余、重要性排序,从而获得候选聚类标签.最后,基于该标签对返回结果中的文档进行分配与聚集,形成层次化聚类结果.实验结果表明,所提方法可以通过获得的准确、可读性较好的聚类标签,帮助用户有效地浏览搜索引擎返回的结果.与Vivisimo、STC、Lingo算法比较,以及在多个评价指标上的综合实验结果也表明,该方法是有效的. 展开更多
关键词 搜索结果 词共现 候选标签 层次化
下载PDF
基于聚类标签均值的半监督支持向量机 被引量:3
7
作者 田勋 汪西莉 《计算机工程与科学》 CSCD 北大核心 2018年第12期2265-2272,共8页
针对标签均值半监督支持向量机在图像分类中随机选取无标记样本会导致分类正确率不高,以及算法的稳定性较低的问题,提出了基于聚类标签均值的半监督支持向量机算法。该算法修改了原算法对于无标记样本的惩罚项,对选取的无标记样本聚类,... 针对标签均值半监督支持向量机在图像分类中随机选取无标记样本会导致分类正确率不高,以及算法的稳定性较低的问题,提出了基于聚类标签均值的半监督支持向量机算法。该算法修改了原算法对于无标记样本的惩罚项,对选取的无标记样本聚类,使用聚类标签均值替换标签均值。实验结果表明,使用聚类标签均值训练的分类器大大减少了背景与目标的错分情况,提高了分类的正确率以及算法的稳定性,适合用于图像分类。 展开更多
关键词 半监督支持向量机 标签均值 标签均值 图像分
下载PDF
基于改进谱聚类的合成孔径雷达溢油图像分割算法 被引量:2
8
作者 张君 薄华 王晓峰 《上海海事大学学报》 北大核心 2011年第3期68-73,共6页
为了解决传统谱聚类算法对大尺寸海洋图像难以进行有效计算的问题,提出一种改进的谱聚类算法.采用分块方法将原始图像分割成多个子图,同时结合随机采样算法利用采集的样本估计全局样本,在保证分割精度基础上大大降低计算复杂度,有效地... 为了解决传统谱聚类算法对大尺寸海洋图像难以进行有效计算的问题,提出一种改进的谱聚类算法.采用分块方法将原始图像分割成多个子图,同时结合随机采样算法利用采集的样本估计全局样本,在保证分割精度基础上大大降低计算复杂度,有效地处理高维图像.针对随机采样的不稳定性,采用多次采样聚类并结合大多数投票的方法,得出最终的分割结果.仿真结果显示,改进算法可以有效降低计算复杂度,并保证聚类算法计算复杂度的减少与图像大小成正比,分块方法和多次聚类结果的融合可以大大提高溢油目标分割的精度. 展开更多
关键词 合成孔径雷达 溢油 图像分割 计算复杂度 分块方法 随机采样算法 标签统一 大多数投票
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部