期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
几种文本特征降维方法的比较分析 被引量:16
1
作者 高茂庭 王正欧 《计算机工程与应用》 CSCD 北大核心 2006年第30期157-159,共3页
文本挖掘中采用向量空间模型(VSM)来表达文本特征,表现出巨大的维数,从而导致处理过程计算复杂,为此,需要先对文本特征矩阵进行合理的降维处理。隐含语义分析(LSA)、概念索引(CI)、非负矩阵分解(NMF)和随机映射(RP)是几种有效的降维方法... 文本挖掘中采用向量空间模型(VSM)来表达文本特征,表现出巨大的维数,从而导致处理过程计算复杂,为此,需要先对文本特征矩阵进行合理的降维处理。隐含语义分析(LSA)、概念索引(CI)、非负矩阵分解(NMF)和随机映射(RP)是几种有效的降维方法,在分析降维空间的含义和计算复杂度后,通过文本聚类实验比较和分析了这几种降维方法的差异,实验表明,这些方法不仅可以对文本特征空间作有效的降维处理,还能在不同程度上凸现文本和词条之间的语义关系,从而提高文本挖掘的效率和准确率。 展开更多
关键词 文本挖掘 降维 随机映射 非负矩阵分解 概念索引 隐含语义分析
下载PDF
索引图像的几个问题(续)
2
作者 冷伏海 《情报科学》 CSSCI 北大核心 2002年第4期405-409,共5页
关键词 图像索引 概念索引 受控词表 自然语言图像索引 图像检索系统
下载PDF
MapReduce环境下支持大规模文本检索的概念索引 被引量:1
3
作者 张生 胡加靖 《计算机工程》 CAS CSCD 北大核心 2015年第7期48-54,共7页
随着信息化技术飞速发展,爆炸性数据的增长以及数据的多样化给大数据检索带来了挑战。MapReduce作为一种并行处理框架,在大数据处理上具有明显优势。为此,结合概念格的相关知识,采用形式概念分析发现文档之间的关系并用格进行表示,提出... 随着信息化技术飞速发展,爆炸性数据的增长以及数据的多样化给大数据检索带来了挑战。MapReduce作为一种并行处理框架,在大数据处理上具有明显优势。为此,结合概念格的相关知识,采用形式概念分析发现文档之间的关系并用格进行表示,提出一种新型的支持大规模文本检索的形式概念索引结构,给出基于MapReduce框架建立概念索引的相关算法。通过与Lucene索引进行比较,验证了所提索引的有效性。实验结果表明,将文档之间关系采用概念格表示并建立概念索引,能够提高大规模文本检索的性能。 展开更多
关键词 大数据 MAPREDUCE框架 数据检索 形式概念分析 概念 概念索引
下载PDF
美国《生物学文摘》创刊以来的变化 被引量:1
4
作者 冯艳娟 《医学信息学杂志》 CAS 1995年第1期47-50,共4页
美国《生物学文摘》(Biological Ab-stracts简称BA),是“生物学文摘生物科学信息服务社(Biosciences InformationService Of Biological Abstracts 简称BIOSIS)编辑出版的一种专业性文摘刊物。创刊于1926年,它主要介绍世界各国有关生物... 美国《生物学文摘》(Biological Ab-stracts简称BA),是“生物学文摘生物科学信息服务社(Biosciences InformationService Of Biological Abstracts 简称BIOSIS)编辑出版的一种专业性文摘刊物。创刊于1926年,它主要介绍世界各国有关生物学、医学和农业方面的文献,包括生物学、农学和生物医学的理论,以及来自实验室、临床与现场的原始资料;生物学研究的新技术与新方法;生物学、 展开更多
关键词 《生物学文摘》 分类索引 概念索引 生物分类 生物系统 出版频率 检索工具 BASIC 字顺排列 文摘号
下载PDF
基于本体兴趣特征向量空间模型的社区自组织算法 被引量:5
5
作者 程艳 许维胜 +1 位作者 杨继君 何一文 《系统工程》 CSCD 北大核心 2009年第5期96-103,共8页
为了解决远程教育不可避免地产生的"孤独"学习者的问题,把具有相同学习兴趣的学习者组织到同一个学习社区中进行协作式学习。学习社区建立的重点和难点在于学习者之间相似关系的判定和计算,针对传统的向量空间模型中术语间语... 为了解决远程教育不可避免地产生的"孤独"学习者的问题,把具有相同学习兴趣的学习者组织到同一个学习社区中进行协作式学习。学习社区建立的重点和难点在于学习者之间相似关系的判定和计算,针对传统的向量空间模型中术语间语义相关性被忽略的不足,提出基于本体的向量空间模型来计算学习者的兴趣特征向量,根据兴趣的隐性表示获取对应的显式表示,此计算模型提高了兴趣相似性比较的精确程度。同时提出了一种基于学习者兴趣相似匹配度和学习者兴趣匹配浓度的学习社区的自组织算法。针对基于本体的向量空间模型使用本体中的概念构造向量空间表现出的巨大维数,运用概念索引降维法对兴趣特征矩阵进行合理降维,大大减少了计算的复杂性。最后,以网络学习案例来进行实验分析,验证该模型算法具有较高的效率和良好的扩展性。 展开更多
关键词 本体 兴趣特征向量空间模型 概念索引降维 兴趣相似匹配度 兴趣匹配浓度
原文传递
基于本体的VSM在兴趣型学习社区分组中的应用 被引量:2
6
作者 程艳 许维胜 +1 位作者 赵斐 何一文 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2010年第5期736-743,共8页
采用语义网络技术,提出了基于本体的向量空间模型(VSM),计算学习者的兴趣向量,克服了传统的VSM有术语间语义相关性被忽略的不足,提高了兴趣相似性比较的精确程度,同时提出了一种基于学习者兴趣相似匹配度和学习者兴趣匹配浓度的学习社... 采用语义网络技术,提出了基于本体的向量空间模型(VSM),计算学习者的兴趣向量,克服了传统的VSM有术语间语义相关性被忽略的不足,提高了兴趣相似性比较的精确程度,同时提出了一种基于学习者兴趣相似匹配度和学习者兴趣匹配浓度的学习社区自组织分组算法.针对模型使用本体中的概念构造向量空间表现出的巨大维数,运用概念索引降维法对兴趣特征矩阵进行合理降维,大大降低了计算的复杂性.最后通过应用案例验证分析了该模型算法具有较高的分组效率和良好的扩展性. 展开更多
关键词 分组算法 本体 兴趣特征 向量空间模型 概念索引
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部