期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
Ontology Learning for Chinese Documents Based on SVD and Conceptual Clustering
1
作者 李守丽 廖乐健 +1 位作者 曹元大 曹树贵 《Journal of Beijing Institute of Technology》 EI CAS 2003年第S1期139-144,共6页
In order to construct Chinese ontology easily, an automated ontology learning technology for Chinese documents based on singular value decomposition (SVD) and conceptual clustering is proposed . First the system extra... In order to construct Chinese ontology easily, an automated ontology learning technology for Chinese documents based on singular value decomposition (SVD) and conceptual clustering is proposed . First the system extracts concepts from a set of domain-specific documents by using SVD technology, and then acquires subsumption relationships between the concepts by means of hierarchical conceptual clustering method. The system thus yields domain-related concept hierarchy. 展开更多
关键词 semantic Web ONTOLOGY ontology learning singular value decomposition conceptual clustering
下载PDF
奇异性数据的分类检索方法研究与仿真
2
作者 王立巍 《计算机仿真》 CSCD 北大核心 2016年第5期431-434,共4页
对奇异性数据进行分类,可以提升检索的精度并改善用户需求。在对奇异性数据的进行分类检索时,当检索对象为海量数据时,需要对海量数据进行自动标定和划分,并对数据特征进行检测,获取数据特征集,并从中提取奇异性语义向量空间,完成奇异... 对奇异性数据进行分类,可以提升检索的精度并改善用户需求。在对奇异性数据的进行分类检索时,当检索对象为海量数据时,需要对海量数据进行自动标定和划分,并对数据特征进行检测,获取数据特征集,并从中提取奇异性语义向量空间,完成奇异性数据的分类检索,而传统算法只能根据人工标定方法进行分类检索,当针对海量数据时,只能粗略的进行标定分类,分类检索时会漏掉很多奇异性特征,无法实现准确的分类检索。提出采用奇异值分解的奇异性数据分类检索方法,对海量数据进行划分,并对数据特征进行挖掘,获取数据特征集,引入奇异值分解方法提取数据特征集的奇异性数据向量空间,利用奇异值分解方法,逐级进行奇异性数据特征的相似度匹配,实现奇异性数据的分类检索。仿真结果表明,所提方法的奇异性数据匹配检索效果良好,并具有稳定的检索性能。 展开更多
关键词 奇异性语义 特征提取 向量空间 数据检索
下载PDF
矩阵奇异值分解及其在高维数据处理中的应用 被引量:20
3
作者 尹芳黎 杨雁莹 +1 位作者 王传栋 王士鹏 《数学的实践与认识》 CSCD 北大核心 2011年第15期171-177,共7页
矩阵奇异值分解能够实现对高维数据的局部特征提取及维数约减,在智能信息处理和模式识别研究领域具有十分重要的应用价值.首先分析了高维数据处理所面临的困境,并对常用的降维算法进行简单的归纳总结;然后阐述了矩阵奇异值分解的基本原... 矩阵奇异值分解能够实现对高维数据的局部特征提取及维数约减,在智能信息处理和模式识别研究领域具有十分重要的应用价值.首先分析了高维数据处理所面临的困境,并对常用的降维算法进行简单的归纳总结;然后阐述了矩阵奇异值分解的基本原理及其在维数约减和数据压缩中的物理意义;接着通过分析两种建立在奇异值分解基础上的PCA与LSA降维算法的数学导出过程,进一步给出了两者的等价性证明;最后总结了矩阵奇异值分解的优缺点,并且预测了高维数据处理技术未来的发展趋势. 展开更多
关键词 奇异值分解 维数约减 主分量分析 隐含语义分析
原文传递
基于非负矩阵分解的隐含语义图像检索 被引量:7
4
作者 梁栋 杨杰 +1 位作者 卢进军 常宇畴 《上海交通大学学报》 EI CAS CSCD 北大核心 2006年第5期787-790,共4页
提出了一种基于非负矩阵分解(Non-negative Matrix Factorization,NMF)的隐含语义索引(Latent Semantic Indexing,LSI)模型用于图像检索.应用NMF训练算法构造了一个语义空间,将查询图像和原型图像都投影到该空间以获得语义特征,在此空... 提出了一种基于非负矩阵分解(Non-negative Matrix Factorization,NMF)的隐含语义索引(Latent Semantic Indexing,LSI)模型用于图像检索.应用NMF训练算法构造了一个语义空间,将查询图像和原型图像都投影到该空间以获得语义特征,在此空间中进行相似性的度量并将距离最近的图像返回给用户.与已有两种检索模型的实验结果对比表明,所提出模型是有效的. 展开更多
关键词 图像检索 隐含语义索引 非负矩阵分解 奇异值分解 语义空间
下载PDF
应用潜在语义分析,探析认知科学 被引量:3
5
作者 杨守捷 刘曼华 《天津大学学报(社会科学版)》 2001年第3期238-244,共7页
潜在语义分析是美国 2 0世纪 90年代发展起来的一种信息提取技术。文章对其原理和结构进行了分析 ,并对其在认知科学的应用 ,主要集中在文本理解和人类如何获取知识、归纳知识和表述知识方面进行了探讨 。
关键词 潜在语义分析 奇异值分解 认知科学 文本理解 语义空间 询问 知识 归纳 应用 LSA模式
下载PDF
基于潜在语义分析的文本指纹提取方法 被引量:8
6
作者 崔彤彤 崔荣一 《中文信息学报》 CSCD 北大核心 2018年第5期74-79,共6页
网络化大数据时代的到来丰富了网络空间中的信息资源,然而由于数据资源类型的多样性及其增长的快速性,给网络空间的存储和信息资源的有效利用带来了压力和挑战。该文提出了一种基于潜在语义分析的文本指纹提取方法,该方法是对数据信息... 网络化大数据时代的到来丰富了网络空间中的信息资源,然而由于数据资源类型的多样性及其增长的快速性,给网络空间的存储和信息资源的有效利用带来了压力和挑战。该文提出了一种基于潜在语义分析的文本指纹提取方法,该方法是对数据信息的一种压缩表示,是针对目前指纹提取方法语义缺失的一种改进。该方法主要通过奇异值分解获取原始文档的潜在语义特征,然后将原文档向量空间转换到与其对应的潜在语义空间,再根据随机超平面原理将该空间的文档转换成二进制数字指纹,最终用汉明距离来衡量指纹间的差异程度。实验以中国知网上的学术论文作为数据对象,通过对论文文本进行相似度实验和聚类实验对该文提出的方法进行实验验证。实验结果表明该方法能够较好地表征文档语义信息,进而验证了文本语义压缩表示的准确性和有效性。 展开更多
关键词 文本指纹 奇异值分解 潜在语义分析 随机超平面原理
下载PDF
基于语义空间的支持向量机的文本过滤 被引量:3
7
作者 沈丽虹 周昌乐 《计算机应用》 CSCD 北大核心 2005年第3期664-665,共2页
传统的基于支持向量机的文本过滤,用向量空间模型来表示文本和用户模板,向量空间模型假设特征项之间是线性无关的,该假设引入了许多因具体用词变化不定而带来的词汇噪音信息,影响了基于支持向量机的文本过滤的过滤性能。提出基于语义空... 传统的基于支持向量机的文本过滤,用向量空间模型来表示文本和用户模板,向量空间模型假设特征项之间是线性无关的,该假设引入了许多因具体用词变化不定而带来的词汇噪音信息,影响了基于支持向量机的文本过滤的过滤性能。提出基于语义空间的支持向量机的文本过滤,用语义来表示文本和用户模板。该方法主要通过奇异值分解提取文本的潜在语义空间,在语义空间上训练支持向量机得到用户模板和过滤阈值,文本流上的文本映射到语义空间上,在语义空间上计算用户模板和新文本的相似度。实验表明:该方法的过滤性能可以达到 98. 67%。 展开更多
关键词 文本过滤 奇异值分解 支持向量机 语义空间
下载PDF
应用潜在语意索引提取信息 被引量:2
8
作者 杨守捷 胡祥恩 《天津师范大学学报(自然科学版)》 CAS 2002年第1期48-52,共5页
关键词信息提取技术效率很低 ,潜在语意索引技术是对它的改进 .在分析潜在语意索引技术的结构与原理的基础上 。
关键词 潜在语意索引 奇异值分解 语义空间 信息过滤 信息提取 汉语信息处理
下载PDF
矩阵奇异值分解在隐含语义信息检索中的应用 被引量:5
9
作者 何志林 王春红 《现代计算机》 2011年第6期21-23,27,共4页
对矩阵奇异值分解的特征进行分析,并将矩阵的奇异值分解应用于向量空间模型,对其进行改进,实现基于语义的信息检索模型,该模型能消除同义词和多义词的影响,提高了文本表示的准确性,从而使信息检索的准确率有显著提高,具有重要的实用价值。
关键词 奇异值分解 信息检索 隐含语义索引模型
下载PDF
基于奇异值分解的新闻标题聚类研究 被引量:3
10
作者 文晓艺 郝程程 《计算机技术与发展》 2020年第2期42-46,共5页
和导航中应用广泛。文本聚类作为一种无监督学习算法,其依据是聚类假设:同类的文档相似程度大,不同类的文档相似程度小。文中主要研究汉语文本聚类算法在新闻标题类文本中的应用。首先对采集到的若干条新闻标题进行分词和特征提取,将分... 和导航中应用广泛。文本聚类作为一种无监督学习算法,其依据是聚类假设:同类的文档相似程度大,不同类的文档相似程度小。文中主要研究汉语文本聚类算法在新闻标题类文本中的应用。首先对采集到的若干条新闻标题进行分词和特征提取,将分词后的文本转化为词条矩阵;然后使用TF-IDF技术处理词条矩阵,得到基于分词权重的新的词条矩阵,对新的词条矩阵进行奇异值分解,得到主成分得分矩阵,提取主成分分析文本特征并根据主成分得分矩阵进行K-均值和分层聚类分析;最后将聚类结果用词云图的形式展示出来并评价聚类效果的好坏。实证显示,对词条矩阵的奇异值分解能降低向量空间的维数,提高聚类的精度和运算速度。 展开更多
关键词 汉语分词 词云图 奇异值分解 潜在语义分析 K-MEANS聚类
下载PDF
P2P系统分布式LSI的构建和更新
11
作者 张三峰 吴国新 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第1期39-42,共4页
从P2P系统自组织和动态性特点出发,提出分布式环境下隐语义索引(LSI)构建和更新的P2P网络模型,设计适合P2P系统文档矩阵的降维表示(RDR)合并算法,结合信号和噪声子空间模型从理论上分析RDR合并算法的有效性及算法需要满足的前提条件;使... 从P2P系统自组织和动态性特点出发,提出分布式环境下隐语义索引(LSI)构建和更新的P2P网络模型,设计适合P2P系统文档矩阵的降维表示(RDR)合并算法,结合信号和噪声子空间模型从理论上分析RDR合并算法的有效性及算法需要满足的前提条件;使用M atlab6.5针对标准文集测试RDR合并算法对查询精度的影响.理论分析和数字实验证明,该算法能够解决P2P系统中分布式LSI的构建和更新问题,能在可容忍的查询精度影响范围内,以较低的网络开销和计算量分布式地构建、更新隐语义索引. 展开更多
关键词 奇异值分解 更新算法 隐语义索引 peer—to—peer
下载PDF
隐含语义索引技术在供求信息分类中的应用
12
作者 朱学昊 王儒敬 《计算机工程与应用》 CSCD 北大核心 2007年第14期192-194,共3页
介绍了一种信息抽取和自动分类的新应用,分析了传统分类方法的不足,介绍了一种基于隐含语义索引技术的文本分类改进方案。该技术是一新型的检索模型,它通过奇异值分解,或增强或消减词在文档中的语义影响力,使得文档之间的语义关系更为明... 介绍了一种信息抽取和自动分类的新应用,分析了传统分类方法的不足,介绍了一种基于隐含语义索引技术的文本分类改进方案。该技术是一新型的检索模型,它通过奇异值分解,或增强或消减词在文档中的语义影响力,使得文档之间的语义关系更为明晰,从而能容易地剔除掉那些语义关联弱的噪声数据,提高特征值提取精度和最后的分类准确度。 展开更多
关键词 隐含语义索引 奇异值分解 文本分类 信息抽取
下载PDF
英语单数基数词语义的模糊性
13
作者 范秀英 《阜阳职业技术学院学报》 2016年第2期84-88,共5页
模糊性是自然语言的普遍特征,数字语言也不例外。基于有无数值义,本文对英语单数基数词语义的模糊性进行探讨。在一定语境下有些基数词是虚数,不表达精确数字含义,具有一定的引申义,富含鲜明的民族特色,并起着一定的修辞作用。
关键词 英语单数基数词 语义模糊 数值义 语境 修辞作用
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部