期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
8
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于主题模型的检索结果聚类应用研究
被引量:
14
1
作者
阮光册
夏磊
《情报杂志》
CSSCI
北大核心
2017年第3期179-184,共6页
[目的/意义]检索结果聚类能够帮助用户快速地浏览系统返回的检索结果。传统的基于向量空间的检索结果聚类缺乏对文本深层次的语义联系的挖掘,使得聚类结果的可读性、可理解性存在不足。因此,对检索结果进行语义层面的分析,并实现基于语...
[目的/意义]检索结果聚类能够帮助用户快速地浏览系统返回的检索结果。传统的基于向量空间的检索结果聚类缺乏对文本深层次的语义联系的挖掘,使得聚类结果的可读性、可理解性存在不足。因此,对检索结果进行语义层面的分析,并实现基于语义的检索结果聚类研究,具有重要的理论和实践意义。[方法/过程]将LDA主题模型与K-means算法相结合,利用LDA模型实现文本潜在语义的识别,将"文本-潜在主题"概率分布作为Kmeans聚类依据进行聚类分析,最后提取与聚类中心最近的主题的描述词作为检索结果聚类的标签。[结果/结论]实验表明,该方法在检索结果聚类以及聚类标签识别上具有很好的效果。
展开更多
关键词
LDA
检索结果
聚
类
聚
类
标签
概率分布
语义挖掘
K-MEANS
下载PDF
职称材料
基于N元语法的英文学术文献聚类标签抽取算法
被引量:
3
2
作者
吴夙慧
成颖
+1 位作者
郑彦宁
潘云涛
《现代图书情报技术》
CSSCI
北大核心
2011年第7期68-75,共8页
提出一种基于N元语法的英文学术文献聚类标签抽取算法,该算法利用N元语法在大规模语料库上进行先期学习生成领域短语词表,再通过K-means算法进行聚类,从聚簇中抽取N元语法项计算TFIDF值,对出现在词表中的特征项赋以更高的权值,以得分最...
提出一种基于N元语法的英文学术文献聚类标签抽取算法,该算法利用N元语法在大规模语料库上进行先期学习生成领域短语词表,再通过K-means算法进行聚类,从聚簇中抽取N元语法项计算TFIDF值,对出现在词表中的特征项赋以更高的权值,以得分最高的特征项作为聚类标签。实验结果表明,该算法能获得更好的实验效果。同时,在抽取聚类标签时提出一种改进的TFIDF权重计算,在评价标签质量时提出一种新的标签评价方法R@N方法。
展开更多
关键词
聚
类
标签
N元语法
学术文献
聚
类
原文传递
改进后缀树的中文检索结果聚类研究
被引量:
1
3
作者
袁津生
荣元媛
《计算机工程与应用》
CSCD
2014年第21期143-146,共4页
检索结果聚类能够帮助用户快速定位需要查找的信息。注重进行中文文本聚类的同时生成高质量的标签,获取搜索引擎返回的网页标题和摘要,利用分词工具对文本分词,去除停用词;统一构建一棵后缀树,以词语为单位插入后缀树各节点,通过词频、...
检索结果聚类能够帮助用户快速定位需要查找的信息。注重进行中文文本聚类的同时生成高质量的标签,获取搜索引擎返回的网页标题和摘要,利用分词工具对文本分词,去除停用词;统一构建一棵后缀树,以词语为单位插入后缀树各节点,通过词频、词长、词性和位置几项约束条件计算各节点词语得分;合并基类取得分高的节点词作标签。实验结果显示该方法的聚类簇纯度较高,提取的标签准确且区分性较强,方便用户使用。
展开更多
关键词
检索结果
聚
类
后缀树
聚
类
标签
中文检索
聚
类
下载PDF
职称材料
联合国可持续发展目标的研究方向正在调整
被引量:
1
4
作者
Masafumi Nakamura
David Pendlebury
+1 位作者
Joshua Schnell
Martin Szomszor
《科学观察》
2020年第1期38-47,共10页
"要意识到,万物相连"——达·芬奇引言联合国可持续发展目标(SDG)是对美好未来的共同愿望,也是协调投入和共同努力的重要议程。2015年9月联合国大会通过了可持续发展议程(A/RES/70/1),其进展可以通过包括17个主要目标的23...
"要意识到,万物相连"——达·芬奇引言联合国可持续发展目标(SDG)是对美好未来的共同愿望,也是协调投入和共同努力的重要议程。2015年9月联合国大会通过了可持续发展议程(A/RES/70/1),其进展可以通过包括17个主要目标的232个具体指标进行追踪。可持续发展的推进离不开各个国家和地区政府利用现有资源和知识,组织和推动相关重要工作,许多项目需要在现有的科学知识和新的尝试基础上,开展多学科的研究和创新。
展开更多
关键词
可持续发展目标
专题地图
联合国
聚
类
标签
原文传递
基于后缀树的Web检索结果聚类标签生成方法
被引量:
9
5
作者
骆雄武
万小军
+1 位作者
杨建武
吴於茜
《中文信息学报》
CSCD
北大核心
2009年第2期83-88,共6页
对检索结果进行聚类能够方便用户从搜索结果中快速地找到自己需要的信息,当前已有各种聚类方法和系统被广泛使用,但是,现有大部分方法由于聚类标签的可读性和描述性较差,难以达到预期效果。该文提出了一种新的思路,注重于如何在聚类之...
对检索结果进行聚类能够方便用户从搜索结果中快速地找到自己需要的信息,当前已有各种聚类方法和系统被广泛使用,但是,现有大部分方法由于聚类标签的可读性和描述性较差,难以达到预期效果。该文提出了一种新的思路,注重于如何在聚类之前就产生好的标签,在生成了标签的基础上,再进行检索结果聚类。对于搜索引擎返回的结果,我们先统一建立一棵后缀树,然后计算后缀树中各个短语的得分,选取得分最高的若干短语作为候选标签。得到标签后,将搜索引擎返回的各个结果项分配到它所包含的标签对应的分类中,形成最后的聚类。实验表明,我们的方法是比较有效的。
展开更多
关键词
计算机应用
中文信息处理
检索结果
聚
类
聚
类
标签
生成
后缀树
下载PDF
职称材料
利用标签的层次化搜索结果聚类方法
被引量:
5
6
作者
张云
冯博琴
《西安交通大学学报》
EI
CAS
CSCD
北大核心
2009年第4期18-21,38,共5页
为了提高搜索引擎返回结果的可浏览性,满足用户对查询质量的要求,提出了一种层次化搜索结果聚类方法.首先,从搜索引擎的返回结果提取出文档集,并对每一个文档进行词干化、去除停用词等操作.然后,根据词共现信息来发现文档集中的频繁2元...
为了提高搜索引擎返回结果的可浏览性,满足用户对查询质量的要求,提出了一种层次化搜索结果聚类方法.首先,从搜索引擎的返回结果提取出文档集,并对每一个文档进行词干化、去除停用词等操作.然后,根据词共现信息来发现文档集中的频繁2元组,再将2元组扩展为n元组,对所有元组进行去冗余、重要性排序,从而获得候选聚类标签.最后,基于该标签对返回结果中的文档进行分配与聚集,形成层次化聚类结果.实验结果表明,所提方法可以通过获得的准确、可读性较好的聚类标签,帮助用户有效地浏览搜索引擎返回的结果.与Vivisimo、STC、Lingo算法比较,以及在多个评价指标上的综合实验结果也表明,该方法是有效的.
展开更多
关键词
搜索结果
聚
类
词共现
候选
聚
类
标签
层次化
聚
类
下载PDF
职称材料
基于聚类标签均值的半监督支持向量机
被引量:
3
7
作者
田勋
汪西莉
《计算机工程与科学》
CSCD
北大核心
2018年第12期2265-2272,共8页
针对标签均值半监督支持向量机在图像分类中随机选取无标记样本会导致分类正确率不高,以及算法的稳定性较低的问题,提出了基于聚类标签均值的半监督支持向量机算法。该算法修改了原算法对于无标记样本的惩罚项,对选取的无标记样本聚类,...
针对标签均值半监督支持向量机在图像分类中随机选取无标记样本会导致分类正确率不高,以及算法的稳定性较低的问题,提出了基于聚类标签均值的半监督支持向量机算法。该算法修改了原算法对于无标记样本的惩罚项,对选取的无标记样本聚类,使用聚类标签均值替换标签均值。实验结果表明,使用聚类标签均值训练的分类器大大减少了背景与目标的错分情况,提高了分类的正确率以及算法的稳定性,适合用于图像分类。
展开更多
关键词
半监督支持向量机
标签
均值
聚
类
标签
均值
图像分
类
下载PDF
职称材料
基于改进谱聚类的合成孔径雷达溢油图像分割算法
被引量:
2
8
作者
张君
薄华
王晓峰
《上海海事大学学报》
北大核心
2011年第3期68-73,共6页
为了解决传统谱聚类算法对大尺寸海洋图像难以进行有效计算的问题,提出一种改进的谱聚类算法.采用分块方法将原始图像分割成多个子图,同时结合随机采样算法利用采集的样本估计全局样本,在保证分割精度基础上大大降低计算复杂度,有效地...
为了解决传统谱聚类算法对大尺寸海洋图像难以进行有效计算的问题,提出一种改进的谱聚类算法.采用分块方法将原始图像分割成多个子图,同时结合随机采样算法利用采集的样本估计全局样本,在保证分割精度基础上大大降低计算复杂度,有效地处理高维图像.针对随机采样的不稳定性,采用多次采样聚类并结合大多数投票的方法,得出最终的分割结果.仿真结果显示,改进算法可以有效降低计算复杂度,并保证聚类算法计算复杂度的减少与图像大小成正比,分块方法和多次聚类结果的融合可以大大提高溢油目标分割的精度.
展开更多
关键词
合成孔径雷达
溢油
图像分割
计算复杂度
分块方法
随机采样算法
聚
类
标签
统一
大多数投票
下载PDF
职称材料
题名
基于主题模型的检索结果聚类应用研究
被引量:
14
1
作者
阮光册
夏磊
机构
华东师范大学经济与管理学部信息管理系
上海图书馆会展中心
出处
《情报杂志》
CSSCI
北大核心
2017年第3期179-184,共6页
基金
上海哲学社会科学一般项目"基于主题模型的学科交叉知识发现研究"(编号:2016BTQ002)的研究成果之一
文摘
[目的/意义]检索结果聚类能够帮助用户快速地浏览系统返回的检索结果。传统的基于向量空间的检索结果聚类缺乏对文本深层次的语义联系的挖掘,使得聚类结果的可读性、可理解性存在不足。因此,对检索结果进行语义层面的分析,并实现基于语义的检索结果聚类研究,具有重要的理论和实践意义。[方法/过程]将LDA主题模型与K-means算法相结合,利用LDA模型实现文本潜在语义的识别,将"文本-潜在主题"概率分布作为Kmeans聚类依据进行聚类分析,最后提取与聚类中心最近的主题的描述词作为检索结果聚类的标签。[结果/结论]实验表明,该方法在检索结果聚类以及聚类标签识别上具有很好的效果。
关键词
LDA
检索结果
聚
类
聚
类
标签
概率分布
语义挖掘
K-MEANS
Keywords
LDA retrieval results clustering cluster label probability distribution semantic mining K-means
分类号
G353 [文化科学—情报学]
下载PDF
职称材料
题名
基于N元语法的英文学术文献聚类标签抽取算法
被引量:
3
2
作者
吴夙慧
成颖
郑彦宁
潘云涛
机构
南京大学信息管理系
中国科学技术信息研究所
出处
《现代图书情报技术》
CSSCI
北大核心
2011年第7期68-75,共8页
基金
国家社会科学基金项目“中文学术信息检索系统相关性集成研究”(项目编号:10CTQ027)
教育部人文社会科学研究规划基金项目“面向用户的相关性标准及其应用研究”(项目编号:07JA870006)
中国科学技术信息研究所合作研究项目的研究成果之一
文摘
提出一种基于N元语法的英文学术文献聚类标签抽取算法,该算法利用N元语法在大规模语料库上进行先期学习生成领域短语词表,再通过K-means算法进行聚类,从聚簇中抽取N元语法项计算TFIDF值,对出现在词表中的特征项赋以更高的权值,以得分最高的特征项作为聚类标签。实验结果表明,该算法能获得更好的实验效果。同时,在抽取聚类标签时提出一种改进的TFIDF权重计算,在评价标签质量时提出一种新的标签评价方法R@N方法。
关键词
聚
类
标签
N元语法
学术文献
聚
类
Keywords
Cluster label N - gram Paper clustering
分类号
G353 [文化科学—情报学]
原文传递
题名
改进后缀树的中文检索结果聚类研究
被引量:
1
3
作者
袁津生
荣元媛
机构
北京林业大学信息学院
出处
《计算机工程与应用》
CSCD
2014年第21期143-146,共4页
文摘
检索结果聚类能够帮助用户快速定位需要查找的信息。注重进行中文文本聚类的同时生成高质量的标签,获取搜索引擎返回的网页标题和摘要,利用分词工具对文本分词,去除停用词;统一构建一棵后缀树,以词语为单位插入后缀树各节点,通过词频、词长、词性和位置几项约束条件计算各节点词语得分;合并基类取得分高的节点词作标签。实验结果显示该方法的聚类簇纯度较高,提取的标签准确且区分性较强,方便用户使用。
关键词
检索结果
聚
类
后缀树
聚
类
标签
中文检索
聚
类
Keywords
search results clustering
suffix tree
cluster label
Chinese search
clustering
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
联合国可持续发展目标的研究方向正在调整
被引量:
1
4
作者
Masafumi Nakamura
David Pendlebury
Joshua Schnell
Martin Szomszor
机构
科睿唯安日本学术研究事业部
科睿唯安科学信息研究所
出处
《科学观察》
2020年第1期38-47,共10页
文摘
"要意识到,万物相连"——达·芬奇引言联合国可持续发展目标(SDG)是对美好未来的共同愿望,也是协调投入和共同努力的重要议程。2015年9月联合国大会通过了可持续发展议程(A/RES/70/1),其进展可以通过包括17个主要目标的232个具体指标进行追踪。可持续发展的推进离不开各个国家和地区政府利用现有资源和知识,组织和推动相关重要工作,许多项目需要在现有的科学知识和新的尝试基础上,开展多学科的研究和创新。
关键词
可持续发展目标
专题地图
联合国
聚
类
标签
分类号
D813.2 [政治法律—国际关系]
F113 [政治法律—政治学]
原文传递
题名
基于后缀树的Web检索结果聚类标签生成方法
被引量:
9
5
作者
骆雄武
万小军
杨建武
吴於茜
机构
北京大学计算机科学技术研究所
出处
《中文信息学报》
CSCD
北大核心
2009年第2期83-88,共6页
基金
国家十一五资助项目(2006BAH02A10)
国家863计划资助项目(2008AA01Z421)
文摘
对检索结果进行聚类能够方便用户从搜索结果中快速地找到自己需要的信息,当前已有各种聚类方法和系统被广泛使用,但是,现有大部分方法由于聚类标签的可读性和描述性较差,难以达到预期效果。该文提出了一种新的思路,注重于如何在聚类之前就产生好的标签,在生成了标签的基础上,再进行检索结果聚类。对于搜索引擎返回的结果,我们先统一建立一棵后缀树,然后计算后缀树中各个短语的得分,选取得分最高的若干短语作为候选标签。得到标签后,将搜索引擎返回的各个结果项分配到它所包含的标签对应的分类中,形成最后的聚类。实验表明,我们的方法是比较有效的。
关键词
计算机应用
中文信息处理
检索结果
聚
类
聚
类
标签
生成
后缀树
Keywords
computer application
Chinese information processing
search results clustering
cluster label generation
suffix tree
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
利用标签的层次化搜索结果聚类方法
被引量:
5
6
作者
张云
冯博琴
机构
西安交通大学电子与信息工程学院
出处
《西安交通大学学报》
EI
CAS
CSCD
北大核心
2009年第4期18-21,38,共5页
基金
国家高技术研究发展计划资助项目(2006AA01Z210)
文摘
为了提高搜索引擎返回结果的可浏览性,满足用户对查询质量的要求,提出了一种层次化搜索结果聚类方法.首先,从搜索引擎的返回结果提取出文档集,并对每一个文档进行词干化、去除停用词等操作.然后,根据词共现信息来发现文档集中的频繁2元组,再将2元组扩展为n元组,对所有元组进行去冗余、重要性排序,从而获得候选聚类标签.最后,基于该标签对返回结果中的文档进行分配与聚集,形成层次化聚类结果.实验结果表明,所提方法可以通过获得的准确、可读性较好的聚类标签,帮助用户有效地浏览搜索引擎返回的结果.与Vivisimo、STC、Lingo算法比较,以及在多个评价指标上的综合实验结果也表明,该方法是有效的.
关键词
搜索结果
聚
类
词共现
候选
聚
类
标签
层次化
聚
类
Keywords
search results clustering
term co-occurrence
clustering candidate cluster label
hierarchical
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于聚类标签均值的半监督支持向量机
被引量:
3
7
作者
田勋
汪西莉
机构
陕西师范大学计算机科学学院
出处
《计算机工程与科学》
CSCD
北大核心
2018年第12期2265-2272,共8页
基金
国家自然科学基金(41171338
41471280)
文摘
针对标签均值半监督支持向量机在图像分类中随机选取无标记样本会导致分类正确率不高,以及算法的稳定性较低的问题,提出了基于聚类标签均值的半监督支持向量机算法。该算法修改了原算法对于无标记样本的惩罚项,对选取的无标记样本聚类,使用聚类标签均值替换标签均值。实验结果表明,使用聚类标签均值训练的分类器大大减少了背景与目标的错分情况,提高了分类的正确率以及算法的稳定性,适合用于图像分类。
关键词
半监督支持向量机
标签
均值
聚
类
标签
均值
图像分
类
Keywords
semi-supervised support vector machine(S3VM)
label mean
clustering label mean
image classification
分类号
TP391.42 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于改进谱聚类的合成孔径雷达溢油图像分割算法
被引量:
2
8
作者
张君
薄华
王晓峰
机构
上海海事大学信息工程学院
出处
《上海海事大学学报》
北大核心
2011年第3期68-73,共6页
基金
上海市科学技术委员会重点课题(08240510800)
文摘
为了解决传统谱聚类算法对大尺寸海洋图像难以进行有效计算的问题,提出一种改进的谱聚类算法.采用分块方法将原始图像分割成多个子图,同时结合随机采样算法利用采集的样本估计全局样本,在保证分割精度基础上大大降低计算复杂度,有效地处理高维图像.针对随机采样的不稳定性,采用多次采样聚类并结合大多数投票的方法,得出最终的分割结果.仿真结果显示,改进算法可以有效降低计算复杂度,并保证聚类算法计算复杂度的减少与图像大小成正比,分块方法和多次聚类结果的融合可以大大提高溢油目标分割的精度.
关键词
合成孔径雷达
溢油
图像分割
计算复杂度
分块方法
随机采样算法
聚
类
标签
统一
大多数投票
Keywords
synthetic aperture radar
oil spill
image segmentation
computational complexity
partition method
random sampling algorithm
clustering label merging
majority voting
分类号
X55 [环境科学与工程—环境工程]
TP391.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于主题模型的检索结果聚类应用研究
阮光册
夏磊
《情报杂志》
CSSCI
北大核心
2017
14
下载PDF
职称材料
2
基于N元语法的英文学术文献聚类标签抽取算法
吴夙慧
成颖
郑彦宁
潘云涛
《现代图书情报技术》
CSSCI
北大核心
2011
3
原文传递
3
改进后缀树的中文检索结果聚类研究
袁津生
荣元媛
《计算机工程与应用》
CSCD
2014
1
下载PDF
职称材料
4
联合国可持续发展目标的研究方向正在调整
Masafumi Nakamura
David Pendlebury
Joshua Schnell
Martin Szomszor
《科学观察》
2020
1
原文传递
5
基于后缀树的Web检索结果聚类标签生成方法
骆雄武
万小军
杨建武
吴於茜
《中文信息学报》
CSCD
北大核心
2009
9
下载PDF
职称材料
6
利用标签的层次化搜索结果聚类方法
张云
冯博琴
《西安交通大学学报》
EI
CAS
CSCD
北大核心
2009
5
下载PDF
职称材料
7
基于聚类标签均值的半监督支持向量机
田勋
汪西莉
《计算机工程与科学》
CSCD
北大核心
2018
3
下载PDF
职称材料
8
基于改进谱聚类的合成孔径雷达溢油图像分割算法
张君
薄华
王晓峰
《上海海事大学学报》
北大核心
2011
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部