期刊文献+
共找到226篇文章
< 1 2 12 >
每页显示 20 50 100
基于语义依存的汉语句子相似度计算 被引量:127
1
作者 李彬 刘挺 +1 位作者 秦兵 李生 《计算机应用研究》 CSCD 北大核心 2003年第12期15-17,共3页
句子间相似度的计算在自然语言处理的各个领域都占有很重要的地位,在多文档自动文摘技术中,句子间相似度的计算是一个关键的问题。由于汉语句子的表达形式是多种多样的,要准确地刻画一个句子所表达的意思,必须深入到语义一级并结合语法... 句子间相似度的计算在自然语言处理的各个领域都占有很重要的地位,在多文档自动文摘技术中,句子间相似度的计算是一个关键的问题。由于汉语句子的表达形式是多种多样的,要准确地刻画一个句子所表达的意思,必须深入到语义一级并结合语法结构信息,由此提出了一种基于语义依存的汉语句子相似度计算的方法,该方法取得了令人满意的实验效果。 展开更多
关键词 相似度计算 语义 依存结构 自然语言处理 多文档文摘
下载PDF
基于本体的个性化领域信息服务 被引量:17
2
作者 余正涛 宋丽哲 樊孝忠 《计算机工程》 EI CAS CSCD 北大核心 2005年第5期22-24,81,共4页
以数字图书馆领域个性化服务为例,以空间向量模型表示用户兴趣和资源特征,并借助于构建的领域本体和“知网”知识词典对向量进行概念上的扩展,形成用户和资源特征概念空间向量,并通过向量相似度计算寻找最优的资源,从而为用户提供个性... 以数字图书馆领域个性化服务为例,以空间向量模型表示用户兴趣和资源特征,并借助于构建的领域本体和“知网”知识词典对向量进行概念上的扩展,形成用户和资源特征概念空间向量,并通过向量相似度计算寻找最优的资源,从而为用户提供个性化信息服务。实验数据说明了基于概念的相似度计算比基于关键词的相似度计算具有更明显的优越性。 展开更多
关键词 个性化服务 本体论 特征提取 空间向量 相似度计算
下载PDF
基于图学习的本体概念相似度计算 被引量:22
3
作者 高炜 梁立 张云港 《西南师范大学学报(自然科学版)》 CAS CSCD 北大核心 2011年第4期64-67,共4页
根据边的类型、顶点深度、边的密度和强度以及边关联的两顶点的属性计算有向边的权重,通过图学习正则化模型得到优化函数.将本体结构图中每个顶点映射成一个实数,通过比较实数间的差值判断两概念的相似程度.实验表明该方法对于计算本体... 根据边的类型、顶点深度、边的密度和强度以及边关联的两顶点的属性计算有向边的权重,通过图学习正则化模型得到优化函数.将本体结构图中每个顶点映射成一个实数,通过比较实数间的差值判断两概念的相似程度.实验表明该方法对于计算本体概念间的相对相似度是有效的. 展开更多
关键词 本体 概念相似度 语义亏损 正则化模型 图的容量
下载PDF
基于图计算的论文审稿自动推荐系统 被引量:21
4
作者 谢玮 沈一 马永征 《计算机应用研究》 CSCD 北大核心 2016年第3期798-801,共4页
针对传统审稿方式所存在的问题,设计了基于TextRank图算法思想的论文推荐系统,以实现论文审稿分配过程的自动化。系统通过加入词与词之间的影响力计算以及多文档集中逆文档频率IDF,实现关键词抽取部分,并使用基于余弦向量值的计算对抽... 针对传统审稿方式所存在的问题,设计了基于TextRank图算法思想的论文推荐系统,以实现论文审稿分配过程的自动化。系统通过加入词与词之间的影响力计算以及多文档集中逆文档频率IDF,实现关键词抽取部分,并使用基于余弦向量值的计算对抽取出的关键词向量进行相似度匹配,最后计算审稿人在各研究领域的影响力,实现论文的推荐。采用了综合考察准确率、召回率的F值作为评测指标,验证了该方法的有效性。在实际使用环境中,该系统具有较高的准确性与可靠性。 展开更多
关键词 论文推荐 推荐系统 审稿分配 关键词抽取 相似度计算 图计算
下载PDF
k-部排序本体相似度计算 被引量:18
5
作者 兰美辉 任友俊 +1 位作者 徐坚 高炜 《计算机应用》 CSCD 北大核心 2012年第4期1094-1096,共3页
将本体图中每个顶点的相关信息用一个向量表示。根据本体图自身的结构将顶点分成k个部分。在每个部分中选取样本点组成S,并选择相应的排序亏损函数。运用k-部排序学习算法得到最优排序函数,从而将本体结构图中每个顶点映射成一个实数,... 将本体图中每个顶点的相关信息用一个向量表示。根据本体图自身的结构将顶点分成k个部分。在每个部分中选取样本点组成S,并选择相应的排序亏损函数。运用k-部排序学习算法得到最优排序函数,从而将本体结构图中每个顶点映射成一个实数,通过比较实数间的差值判断两概念的相似程度。实验表明该方法对于计算本体概念间的相对相似度是有效的。 展开更多
关键词 本体 相似度计算 k-部排序 排序函数 排序亏损函数
下载PDF
细粒度语义网检索 被引量:11
6
作者 吴刚 唐杰 +1 位作者 李涓子 王克宏 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2005年第S1期1865-1872,共8页
语义网的有向标记图数据模型决定其在内容检索方面与纯文本、超文本或半结构化文档检索存在较大差异。现有检索模型和相似度计算方法不能完全满足对语义网的检索和评价。该文以资源这种较细粒度作为检索单元。
关键词 在资源内容中的频率和结构分布 提出一个细粒
原文传递
主观题自动阅卷技术研究 被引量:13
7
作者 田甜 张振国 《计算机工程与设计》 CSCD 北大核心 2010年第16期3697-3699,3704,共4页
为了实现考试系统中主观题型的自动阅卷,提出了基于语句相似度的计算方法对主观题进行自动批改。通过对语句相似度的定义和计算模型的建立以及汉语的特殊性分析,同时借鉴自动问答、自动文摘、信息检索等领域内关于语句相似度的研究,建... 为了实现考试系统中主观题型的自动阅卷,提出了基于语句相似度的计算方法对主观题进行自动批改。通过对语句相似度的定义和计算模型的建立以及汉语的特殊性分析,同时借鉴自动问答、自动文摘、信息检索等领域内关于语句相似度的研究,建立了对主观题的自动阅卷模型。通过对语句的词形、词序、词义3个层次计算相似度的融合,使句子的相似度计算更加准确。实验结果表明,主观题自动阅卷技术的正确率达到81.5%。 展开更多
关键词 自然语言处理 自动阅卷 主观题 相似度计算 知网
下载PDF
基于标签信息特征相似性的协同过滤个性化推荐 被引量:12
8
作者 何明 要凯升 +1 位作者 杨芃 张久伶 《计算机科学》 CSCD 北大核心 2018年第B06期415-422,共8页
标签推荐系统旨在利用标签数据为用户提供个性化推荐。已有的基于标签的推荐方法往往忽视了用户和资源本身的特征,而且在相似性度量时仅针对项目相似性或用户相似性进行计算,并未充分考虑二者之间的有效融合,推荐结果的准确性较低。为... 标签推荐系统旨在利用标签数据为用户提供个性化推荐。已有的基于标签的推荐方法往往忽视了用户和资源本身的特征,而且在相似性度量时仅针对项目相似性或用户相似性进行计算,并未充分考虑二者之间的有效融合,推荐结果的准确性较低。为了解决上述问题,将标签信息融入到结合用户相似性和项目相似性的协同过滤中,提出融合标签特征与相似性的协同过滤个性化推荐方法。该方法在充分考虑用户、项目以及标签信息的基础上,利用二维矩阵来定义用户-标签以及标签-项目之间的行为。构建用户和项目的标签特征表示,通过基于标签特征的相似性度量方法计算用户相似性和项目相似性。基于用户标签行为和用户与项目的相似性线性组合来预测用户对项目的偏好值,并根据预测偏好值排序,生成最终的推荐列表。在Last.fm数据集上的实验结果表明,该方法能够提高推荐的准确度,满足用户的个性化需求。 展开更多
关键词 协同过滤 标签 推荐系统 相似性计算
下载PDF
融合耦合距离区分度和强类别特征的短文本相似度计算方法 被引量:12
9
作者 马慧芳 刘文 +1 位作者 李志欣 蔺想红 《电子学报》 EI CAS CSCD 北大核心 2019年第6期1331-1336,共6页
短文本相似度计算在社会网络、文本挖掘和自然语言处理等领域中起着至关重要的作用.针对短文本内容简短、特征稀疏等特点,以及传统的短文本相似度计算忽略类别信息等问题,提出一种融合耦合距离区分度和强类别特征的短文本相似度计算方法... 短文本相似度计算在社会网络、文本挖掘和自然语言处理等领域中起着至关重要的作用.针对短文本内容简短、特征稀疏等特点,以及传统的短文本相似度计算忽略类别信息等问题,提出一种融合耦合距离区分度和强类别特征的短文本相似度计算方法.一方面,在整个短文本语料库中利用两个共现词之间的距离计算词项共现距离相关度,并以此来对词项加权从而捕获词项间内联和外联关系,得到短文本的耦合距离区分度相似度;另一方面,基于少量带类别标签的监督数据提取每类中强类别区分能力的特征项作为强类别特征集合,并利用词项的上下文来对强类别特征语义消歧,然后基于文本间包含相同类别的强类别特征数量来衡量文本间的相似度.最后,本文结合耦合距离区分度和强类别特征来衡量短文本的相似度.经实验证明本文提出的方法能够提高短文本相似度计算的准确率. 展开更多
关键词 文本挖掘 自然语言处理 文本聚类 社会网络 耦合关系 特征提取 语义消歧 相似度计算
下载PDF
基于研究主题的学科领域知识演化路径识别——以图书情报领域粗糙集为例 被引量:12
10
作者 焦红 李秀霞 《情报理论与实践》 CSSCI 北大核心 2019年第3期101-106,共6页
[目的/意义]对学科领域知识演化路径进行可视化研究,可以帮助研究人员快速发现学科领域中的核心文献和关键主题,把握研究主题的演变趋势。[方法/过程]文章将主路径分析方法与文本挖掘技术相结合,以图书情报(ISLS)领域的粗糙集研究方向为... [目的/意义]对学科领域知识演化路径进行可视化研究,可以帮助研究人员快速发现学科领域中的核心文献和关键主题,把握研究主题的演变趋势。[方法/过程]文章将主路径分析方法与文本挖掘技术相结合,以图书情报(ISLS)领域的粗糙集研究方向为例,识别其核心文献,同时基于向量空间模型对核心文献进行补充,并利用主题模型提取主题,继而绘制知识演化路径图。[结果/结论]研究结果表明:知识演化路径能够全面、细致地展示学科领域的知识内容。该路径不仅能够展示学科领域的不同研究主题、热点主题、核心文献间的关联、研究主题和研究方法的演化趋势,还能够呈现学科领域研究的跨学科特征。 展开更多
关键词 学科领域 知识演化路径 文献相似度 主题模型 文本挖掘
原文传递
改进的领域本体概念相似度计算方法 被引量:10
11
作者 张帆 钟金宏 黄玲 《计算机工程》 CAS CSCD 北大核心 2010年第23期66-68,共3页
在领域本体中,概念间往往存在多条路径,现有的基于语义距离的方法只考虑最短距离的路径,不能完全体现出概念间的相似度。基于此,提出一种基于加权语义距离的概念相似度计算方法。该方法搜索出两概念间的所有路径,以所有路径的加权平均... 在领域本体中,概念间往往存在多条路径,现有的基于语义距离的方法只考虑最短距离的路径,不能完全体现出概念间的相似度。基于此,提出一种基于加权语义距离的概念相似度计算方法。该方法搜索出两概念间的所有路径,以所有路径的加权平均距离代替最短距离来计算相似度,并综合考虑节点深度、公共父节点对相似度的影响。实验表明,该方法计算出的概念相似度能够更准确地体现出概念间的相似程度。 展开更多
关键词 领域本体 多重继承 加权语义距离 相似度计算
下载PDF
融合类别信息和用户兴趣度的协同过滤推荐算法 被引量:11
12
作者 何明 肖润 +1 位作者 刘伟世 孙望 《计算机科学》 CSCD 北大核心 2017年第8期230-235,269,共7页
协同过滤直接根据用户的行为记录去预测其可能感兴趣的项目,是现今最成功、应用最广泛的推荐技术。推荐的准确度受相似性度量方法效果的影响。传统的相似性度量方法主要关注用户共同评分项之间的相似度,忽视了评分项目中的类别信息,在... 协同过滤直接根据用户的行为记录去预测其可能感兴趣的项目,是现今最成功、应用最广泛的推荐技术。推荐的准确度受相似性度量方法效果的影响。传统的相似性度量方法主要关注用户共同评分项之间的相似度,忽视了评分项目中的类别信息,在面对数据稀疏性问题时存在一定的不足。针对上述问题,提出基于分类信息的评分矩阵填充方法,结合用户兴趣相似度计算方法并充分考虑到评分项目的类别信息,使得兴趣度的度量更加符合推荐系统应用的实际情况。实验结果表明,该算法可以弥补传统相似性度量方法的不足,缓解评分数据稀疏对协同过滤算法的影响,能够提高推荐的准确性、多样性和新颖性。 展开更多
关键词 协同过滤 推荐系统 兴趣度 相似性计算
下载PDF
基于K-means的机构归一化研究 被引量:10
13
作者 孙海霞 李军莲 吴英杰 《医学信息学杂志》 CAS 2013年第7期41-44,71,共5页
分析k-means算法的核心思想和基本步骤,借鉴现有基于频繁词集的文本聚类初始中心确定方法,提出一种面向大规模机构名称归一化处理应用的机构聚类方法,详细阐述机构聚类中心的生成、相似度算法的选择以及迭代次数问题,其实验和应用效果... 分析k-means算法的核心思想和基本步骤,借鉴现有基于频繁词集的文本聚类初始中心确定方法,提出一种面向大规模机构名称归一化处理应用的机构聚类方法,详细阐述机构聚类中心的生成、相似度算法的选择以及迭代次数问题,其实验和应用效果表现良好。 展开更多
关键词 机构归一 机构聚类 K-MEANS 频繁词集 相似度计算
下载PDF
数据集成中数据项与数据元匹配算法 被引量:8
14
作者 文必龙 付玥 《计算机系统应用》 2012年第3期240-243,231,共5页
近年来,随着数据元标准的建立,数据元在各行各业的数据集成过程中担任着重要角色,用于规范数据库、报表、文档中的数据项,实现各种数据源之间的映射。分析数据元的结构,提出一种数据项与数据元匹配算法,该算法基于编辑距离算法,融合最... 近年来,随着数据元标准的建立,数据元在各行各业的数据集成过程中担任着重要角色,用于规范数据库、报表、文档中的数据项,实现各种数据源之间的映射。分析数据元的结构,提出一种数据项与数据元匹配算法,该算法基于编辑距离算法,融合最长公共子序列、权重、词语重心后移等思想,实现数据项与数据元字典中数据元的相似度计算,利用排列组合原理对匹配速度进行优化。以中石化标准数据元为实验数据进行实验,验证了该匹配算法的有效性。 展开更多
关键词 编辑距离 最长公共子序列 相似度计算 数据元 权重
下载PDF
自动标引通用评价模型研究 被引量:6
15
作者 章成志 周冬敏 《情报学报》 CSSCI 北大核心 2009年第1期40-47,共8页
目前大多文档都不具有关键词,但手工标引关键词费时费力且主观性较强,因此关键词自动标引是一项值得研究的技术,由此引发的标引结果有效评价问题也成为一个亟需解决的问题。然而,评估关键词自动标引的性能并非一件容易的事情。针对... 目前大多文档都不具有关键词,但手工标引关键词费时费力且主观性较强,因此关键词自动标引是一项值得研究的技术,由此引发的标引结果有效评价问题也成为一个亟需解决的问题。然而,评估关键词自动标引的性能并非一件容易的事情。针对常规自动标引评价方法存在的评价结果不能完全反映真实的标引结果以及评价成本高的情况,本文提出一种通用的自动标引评价模型。该模型可以有效地利用外部资源,在有参照情况下与无参照情况下,分别对标引结果进行评价。实验结果表明,自动标引通用评价模型能增加标引评价的可靠性,并且降低标引评价的成本。 展开更多
关键词 自动标引 评价模型 语义相似度 相似度计算
下载PDF
基于MapReduce与项目分类的协同过滤算法 被引量:7
16
作者 程曦 陈军 《计算机工程》 CAS CSCD 北大核心 2016年第7期194-198,共5页
针对传统协同过滤算法中存在的数据稀疏性和系统可扩展性问题,提出一种新的协同过滤算法。根据用户对不同项目的评价信息得出项目评分矩阵,利用朴素贝叶斯分类器对项目进行分类,通过修正的余弦相似度计算方法在相同类中寻找项目最近邻... 针对传统协同过滤算法中存在的数据稀疏性和系统可扩展性问题,提出一种新的协同过滤算法。根据用户对不同项目的评价信息得出项目评分矩阵,利用朴素贝叶斯分类器对项目进行分类,通过修正的余弦相似度计算方法在相同类中寻找项目最近邻集合。结合Hadoop平台下的MapReduce并行计算框架进行数据分布式处理,最终形成评分预测列表进行项目推荐。实验结果表明,与基于用户分类的协同过滤算法和基于项目分类的协同过滤算法相比,该算法能有效解决因数据稀疏导致预测精度较低的问题,具有较高的推荐准确性,并且通过算法并行计算提高了系统运行效率和可扩展性。 展开更多
关键词 协同过滤 项目分类 相似度计算 并行计算 分布式处理 评分预测
下载PDF
中文句子相似度计算的研究 被引量:5
17
作者 贾宗福 王知非 《科技信息》 2009年第11期10-11,共2页
句子相似度计算是自然语言处理领域中比较重要的研究课题,有着非常广泛的应用,直接决定某些领域的发展。本文介绍了中文句子相似度计算存在的特点和难点,分析了当前常用的中文句子相似度计算方法的优点以及存在的问题。
关键词 相似度计算 中文信息处理 自然语言处理
下载PDF
基于论文共同作者学术关系的学者推荐系统 被引量:7
18
作者 邓少伟 罗泽 +1 位作者 李树仁 阎保平 《计算机工程》 CAS CSCD 2013年第2期12-17,共6页
为使用户能够准确、高效地查找出关联的科研人员、学科知识及研究领域等相关信息,提出一种基于论文共同作者学术关系的推荐系统。该推荐系统应用科研人员所著论文的关键词对科研人员进行建模,突出科研人员与研究领域之间的关联,通过论... 为使用户能够准确、高效地查找出关联的科研人员、学科知识及研究领域等相关信息,提出一种基于论文共同作者学术关系的推荐系统。该推荐系统应用科研人员所著论文的关键词对科研人员进行建模,突出科研人员与研究领域之间的关联,通过论文共同作者等学术关系计算科研人员之间的相似度以进行推荐。实验结果证明,与未应用学术关系的普通方法相比,该推荐系统的精准度能提高5%左右。 展开更多
关键词 学术关系 共同作者 社会化推荐 推荐技术 相似度计算
下载PDF
面向多视图的跨部门应急处置流程相似度计算方法 被引量:7
19
作者 曾庆田 周长红 +1 位作者 鲁法明 段华 《计算机集成制造系统》 EI CSCD 北大核心 2015年第2期368-380,共13页
为了在应急处置环境下更好地基于流程相似性进行流程的检索、推荐和重构,提出一种面向多视图的应急处置流程相似度计算方法。该方法以应急处置任务的形式化表示为基础,将应急处置流程中不同组织部门之间的协同模式分为任务同步、任务选... 为了在应急处置环境下更好地基于流程相似性进行流程的检索、推荐和重构,提出一种面向多视图的应急处置流程相似度计算方法。该方法以应急处置任务的形式化表示为基础,将应急处置流程中不同组织部门之间的协同模式分为任务同步、任务选择和消息传递三种类型;同时为更好地体现跨部门应急处置流程的多样性,分别建立了应急处置流程的任务逻辑关系视图、部门内部流程视图、部门间协同关系视图和多部门联动视图,进而以四个视图为基础,分别给出了不同视图表示下应急处置流程的相似度计算方法。上述应急处置流程多视图的呈现方式和面向多视图的流程计算方法,在自主设计并开发的煤矿突发事故应急联动管理平台中得到了应用验证。 展开更多
关键词 多视图 应急处置 业务流程 相似度计算
下载PDF
基于叙词表的林业信息语义检索模型 被引量:6
20
作者 韩其琛 李冬梅 《计算机科学与探索》 CSCD 北大核心 2016年第1期122-129,共8页
随着互联网的快速发展,基于关键词字面匹配的信息检索方式已不能满足人们的需求。叙词表中所包含的语义关系是提高查全率和查准率的重要途径,如果将叙词表控制机制引入当前网络信息检索工具中,必然能在一定程度上提高信息检索的效率。... 随着互联网的快速发展,基于关键词字面匹配的信息检索方式已不能满足人们的需求。叙词表中所包含的语义关系是提高查全率和查准率的重要途径,如果将叙词表控制机制引入当前网络信息检索工具中,必然能在一定程度上提高信息检索的效率。利用叙词表中的词间关系,提出了一种计算叙词间语义相似度的方法,借助查询扩展的思想,设计了一种基于叙词表的林业信息语义检索模型。最后,以林业汉英拉叙词表中两个类目范畴作为实验对象,分别同百度搜索引擎、农业叙词表中所使用的检索方法进行了比较,实验结果表明,提出的检索模型可以更好地利用叙词表来改进传统的基于关键字的检索方式,此外,所提模型是通用的,为叙词表在网络信息系统中的应用提供了一种新的思路。 展开更多
关键词 林业叙词表 语义检索 相似度计算 查询扩展 网页抓取
下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部