期刊文献+
共找到29篇文章
< 1 2 >
每页显示 20 50 100
从文本中构建领域本体技术综述 被引量:51
1
作者 任飞亮 沈继坤 +1 位作者 孙宾宾 朱靖波 《计算机学报》 EI CSCD 北大核心 2019年第3期654-676,共23页
本体是一种重要的知识库,其包含的丰富的语义信息可以为问答系统、信息检索、语义Web、信息抽取等领域的研究及相关应用提供重要的支持.因而,如何快速有效地构建本体具有非常重要的研究价值.研究者们分别从不同角度提出了大量有效地进... 本体是一种重要的知识库,其包含的丰富的语义信息可以为问答系统、信息检索、语义Web、信息抽取等领域的研究及相关应用提供重要的支持.因而,如何快速有效地构建本体具有非常重要的研究价值.研究者们分别从不同角度提出了大量有效地进行本体构建的方法.一般来讲,这些本体构建方法可以分为手工构建的方法和采用自动、半自动技术构建的方法.手工本体的方法往往需要本体专家参与到构建的整个过程,存在着构建成本高、效率低下、主观性强、移植不便等缺点,因而,此类方法正逐步被大量基于自动、半自动技术的本体构建方法所代替.自动、半自动构建的方法不需要(或仅需少量)人工参与,可以很方便地使用其它研究领域(如机器学习、自然语言处理等)的最新研究成果,也可以方便地使用不同数据源进行本体构建.其中,文本数据源具有数据量大、获取方便的优点.因而,越来越多的研究者开始关注如何有效地使用文本资源进行本体构建.该文全面分析了以文本为数据源,采用自动、半自动技术进行本体构建的国内外最新研究成果.该文首先介绍了当前一些具有代表性的关于以文本为数据源进行本体构建的技术综述文章.在这一部分内容中,该文重点关注了各个综述文章针对本体构建技术研究所得出的结论.接着,该文从"全局"与"局部"两个角度对本体构建方法进行了详细的介绍.在"全局"角度介绍中,该文根据本体构建过程中用到的主导技术,将本体构建方法分为统计主导的方法和语言分析主导的方法两类,分别对各类方法进行了详细的介绍,并分析了各类方法的优缺点.在"局部"角度介绍中,该文把本体构建过程分为以下子任务:术语抽取、概念抽取、关系(包括层次关系和非层次关系)抽取、本体形成.分别从每个任务所使用的技术,从"任务-技术"这一角� 展开更多
关键词 本体构建 本体术语抽取 本体概念抽取 本体关系抽取 深度学习
下载PDF
本体学习:原理、方法与相关进展 被引量:9
2
作者 孔敬 《情报学报》 CSSCI 北大核心 2006年第6期657-665,共9页
本体学习是自动或半自动构建本体的一系列方法和技术。本文概述了本体学习的研究状况。描述了本体学习的框架结构,总结了本体学习的技术、方法与算法,提出了当前本体学习研究的问题与难题以及进一步研究方向。
关键词 本体学习 本体构建 自动抽取 概念抽取 概念聚类
下载PDF
基于上下文的领域本体概念和关系的提取 被引量:14
3
作者 张玉芳 杨芬 +1 位作者 熊忠阳 陈小莉 《计算机应用研究》 CSCD 北大核心 2010年第1期74-76,共3页
目前本体学习的研究重点在于概念及关系的提取,概念提取领域一致度与领域相关度相结合的方法取得了比较好的效果,而关系提取则主要采用基于关联规则的方法。这种本体概念、关系学习方法由于只考虑词频,提取结果准确性欠缺。针对这种缺陷... 目前本体学习的研究重点在于概念及关系的提取,概念提取领域一致度与领域相关度相结合的方法取得了比较好的效果,而关系提取则主要采用基于关联规则的方法。这种本体概念、关系学习方法由于只考虑词频,提取结果准确性欠缺。针对这种缺陷,在统计的基础上考虑了语义因素,利用词汇上下文计算概念的语义相似度并将其应用到概念与关系提取中。实验结果表明,词汇上下文与传统统计相结合的方法能够有效改进概念和关系提取的准确度。 展开更多
关键词 本体学习 上下文 概念提取 关系提取 语义相似度
下载PDF
基于规则与统计的本体概念自动获取方法研究 被引量:10
4
作者 张新 党延忠 《情报学报》 CSSCI 北大核心 2007年第6期813-820,共8页
为获取中文领域本体的概念提出了基于规则匹配和统计方法相结合的学习模型,充分利用现有的自然语言处理技术和统计学习方法,从领域文本中通过语义串切分、规则匹配、领域归属度分析和概念约简算法自动获取领域概念。该方法解决了现有... 为获取中文领域本体的概念提出了基于规则匹配和统计方法相结合的学习模型,充分利用现有的自然语言处理技术和统计学习方法,从领域文本中通过语义串切分、规则匹配、领域归属度分析和概念约简算法自动获取领域概念。该方法解决了现有中文本体学习方法对领域词典的依赖以及无法获得短语式特定领域概念的问题,同时解决了领域概念筛选问题。实验证明了该方法的有效性。 展开更多
关键词 领域本体构建 概念抽取规则匹配领域归属度 概念约简
下载PDF
基于统计自然语言处理技术的领域本体半自动构建研究 被引量:7
5
作者 何琳 侯汉清 《情报学报》 CSSCI 北大核心 2009年第2期201-207,共7页
本体的构建是影响语义Web成功与否的重要因素之一。本文借鉴机器学习以及自然语言处理等技术成果尝试半自动构建本体,以专业研究论文为研究语料,采用N-Gram文本表达法从语料中抽取关键概念,计算主题度获取领域概念。利用改进的层次聚类... 本体的构建是影响语义Web成功与否的重要因素之一。本文借鉴机器学习以及自然语言处理等技术成果尝试半自动构建本体,以专业研究论文为研究语料,采用N-Gram文本表达法从语料中抽取关键概念,计算主题度获取领域概念。利用改进的层次聚类算法对领域概念进行聚类以获取其等级体系,采用句法分析与统计相结合的方法从语料中获取可能的主、谓、宾模式为领域关系提供参考,并以农业史为例,设计开发了一个领域本体半自动构建实验系统,文中重点介绍了本体构建中概念的获取、等级关系、领域关系的构建以及形式化处理等关键技术的实现过程。 展开更多
关键词 领域本体 半自动构建 概念抽取 等级关系 领域关系 主谓宾模式
下载PDF
基于关联规则和语义规则的本体概念提取研究 被引量:8
6
作者 贺海涛 郑山红 +1 位作者 李万龙 彭馨仪 《吉林大学学报(信息科学版)》 CAS 2014年第6期657-663,共7页
为解决基于非结构化文本的中文领域本体概念提取效率和准确率不理想的问题,提出了一种基于关联规则和语义规则的领域本体概念提取方法。利用领域一致性和相关性检查以及关联规则分别获取候选概念和关系集合,计算候选概念在领域术语关系... 为解决基于非结构化文本的中文领域本体概念提取效率和准确率不理想的问题,提出了一种基于关联规则和语义规则的领域本体概念提取方法。利用领域一致性和相关性检查以及关联规则分别获取候选概念和关系集合,计算候选概念在领域术语关系中的深度和广度,利用深度和广度信息反馈概念隶属度的思想,定量分析术语与领域的隶属程度,进行本体概念的领域隶属度检查,完成领域本体概念的提取。实验结果表明,该方法提高了领域本体概念的提取效率和准确率,具有可行性和合理性,领域本体概念的提取准确率提高了12%左右。 展开更多
关键词 本体概念提取 关联规则 语义规则 领域隶属度检查
下载PDF
基于模式匹配的中文通用本体概念抽取模型 被引量:6
7
作者 王昊 苏新宁 《情报理论与实践》 CSSCI 北大核心 2008年第2期292-297,291,共7页
本文重点阐述了中文通用本体概念实例的机器抽取过程,建立了基于模式匹配的通用本体概念识别模型,以此作为领域本体自动构建的基础。此后探讨了该模型在情报学各研究领域中的应用前景,并通过实验检验模型在实际应用中的识别效果。
关键词 通用本体 概念抽取 模式匹配 隐马尔可夫模型
下载PDF
基于word2vec的数字图书馆本体构建技术研究 被引量:6
8
作者 闭炳华 《现代电子技术》 北大核心 2016年第15期90-94,共5页
针对传统本体构建既费时又费力等问题,设计了一种基于Web的领域本体半自动构建方法,提出了基于word2vec的领域本体概念抽取算法,采用基于中英文词典的方法抽取同义关系,研究了基于特征向量的上下位关系抽取算法。最后将基于Web的领域本... 针对传统本体构建既费时又费力等问题,设计了一种基于Web的领域本体半自动构建方法,提出了基于word2vec的领域本体概念抽取算法,采用基于中英文词典的方法抽取同义关系,研究了基于特征向量的上下位关系抽取算法。最后将基于Web的领域本体半自动构建方法应用于数字图书馆气候变化领域,实践表明,该方法大大缩短了本体构建的周期,减少了人工参与。 展开更多
关键词 本体构建 领域本体 概念抽取 关系抽取 数字图书馆现状
下载PDF
基于HowNet的中文本体学习方法研究 被引量:6
9
作者 贾文娟 何丰 《计算机技术与发展》 2011年第6期77-80,84,共5页
目前针对国内在中文环境下本体学习的研究才刚刚起步的现状,对本体学习和HowNet进行了简单介绍,提出了基于HowNet的中文本体学习的主要思路。当前,本体学习的研究重点在于概念及概念间关系抽取。采用文本语料作为输入,首先对文本进行预... 目前针对国内在中文环境下本体学习的研究才刚刚起步的现状,对本体学习和HowNet进行了简单介绍,提出了基于HowNet的中文本体学习的主要思路。当前,本体学习的研究重点在于概念及概念间关系抽取。采用文本语料作为输入,首先对文本进行预处理,然后基于HowNet生成了一个领域语义词典,在本体学习中加入领域核心概念本体,在概念关系抽取阶段,采用基于HowNet的语义相似度计算方法。实验证明,提出的本体学习方法能够有效改进概念和概念间关系抽取的准确度。 展开更多
关键词 本体学习 HOWNET 概念抽取 概念关系抽取
下载PDF
结合对数似然比的领域本体概念和关系的提取 被引量:5
10
作者 张玉芳 舒万里 熊忠阳 《计算机工程与应用》 CSCD 2013年第6期148-151,共4页
本体学习已成为计算机领域的一个研究热点,目前本体学习的研究重点在于概念及关系的提取。针对现有学习方法准确率不高,提出一种结合对数似然比(Log-Likelihood Ratio,LLR)的本体学习方法,采用对数似然比计算概念与领域及概念与概念之... 本体学习已成为计算机领域的一个研究热点,目前本体学习的研究重点在于概念及关系的提取。针对现有学习方法准确率不高,提出一种结合对数似然比(Log-Likelihood Ratio,LLR)的本体学习方法,采用对数似然比计算概念与领域及概念与概念之间的相关性,将其应用到概念与关系提取中。实验结果表明,结合对数似然比的学习方法能够有效改进概念和关系提取的准确度。 展开更多
关键词 本体学习 概念提取 关系提取 对数似然比
下载PDF
面向中文文本的玉米病虫害本体学习研究 被引量:3
11
作者 齐红 官莹莹 刘亚波 《计算机工程与应用》 CSCD 北大核心 2011年第20期206-209,共4页
由于中文和英文在语法和句法等方面的差异,面向中文文本的本体学习方法尚存在一定困难。研究了面向中文文本的玉米病虫害本体学习方法。提出单字合并法,将其与TFIDF方法结合,进行概念抽取;将欧几里德距离与余弦距离加权平均计算概念相似... 由于中文和英文在语法和句法等方面的差异,面向中文文本的本体学习方法尚存在一定困难。研究了面向中文文本的玉米病虫害本体学习方法。提出单字合并法,将其与TFIDF方法结合,进行概念抽取;将欧几里德距离与余弦距离加权平均计算概念相似度,进行概念关系抽取。从中国玉米网选取50篇领域文档,应用上述方法构建了玉米病虫害本体。 展开更多
关键词 本体学习 概念抽取 概念关系抽取 玉米病虫害本体
下载PDF
限定领域的本体自动构建方法
12
作者 苏宁 刘敏 +1 位作者 洪楚扬 邹晟 《起重运输机械》 2023年第8期49-57,共9页
针对港口机械领域从业人员难以准确高效获取领域知识的难题,提出了一种面向港口机械领域的本体自动构建方法,为后续领域信息检索系统的构建奠定了语义层面的基础。首先,在对港口机械领域语料库预处理的基础上,利用基于规则模板与基于统... 针对港口机械领域从业人员难以准确高效获取领域知识的难题,提出了一种面向港口机械领域的本体自动构建方法,为后续领域信息检索系统的构建奠定了语义层面的基础。首先,在对港口机械领域语料库预处理的基础上,利用基于规则模板与基于统计学相结合的方法抽取港口机械领域本体概念;然后将基于LF的蚁群聚类与谱聚类相融合用于概念间分类关系的抽取,并利用关联规则与基于统计学的VF-ICF方法抽取概念间的非分类关系。在利用Protégé生成初始领域本体并经过本体推理与修改完善后,最终得到了港口机械领域本体,为相关从业人员获取领域知识提供了一种准确可靠的信息源。 展开更多
关键词 港口机械 本体构建 概念抽取 概念间关系抽取
下载PDF
工业机器人预测式健康管理本体半自动化构建 被引量:2
13
作者 柳少峰 肖红 +3 位作者 黄子豪 姜文超 熊梦 贺忠堂 《组合机床与自动化加工技术》 北大核心 2022年第1期29-33,共5页
针对工业机器人预测式健康管理(PHM)案例信息缺乏深度利用、PHM本体人工构建、过程不智能、构建成本高、本体不完备等问题,提出一种工业机器人PHM本体半自动化构建方法。首先,对多源工业机器人PHM语料进行分词、去除停用词等预处理;其次... 针对工业机器人预测式健康管理(PHM)案例信息缺乏深度利用、PHM本体人工构建、过程不智能、构建成本高、本体不完备等问题,提出一种工业机器人PHM本体半自动化构建方法。首先,对多源工业机器人PHM语料进行分词、去除停用词等预处理;其次,使用融合词频、文档频率、TF-IDF、C-value等算法进行本体概念综合抽取;接着,基于CSC语义词库和搜索引擎进行概念间上下属关系抽取,同时基于SAO结构进行交叉关系抽取;最后,使用Protégé工具对工业机器人PHM本体进行持久化与可视化。实验平台采用某国产机器人设备,测试数据为机器人PHM记录以及简书博客、维普期刊获取的相关文档共1690篇,与TF-IDF、C-value、LDA主题模型、BRT等算法进行实验对比,该方法在概念抽取阶段准确率提升10%,在概念关系抽取阶段提升3%,实际应用结果表明本方法有效可行。 展开更多
关键词 工业机器人 预测式健康管理 本体 概念抽取 关系抽取
下载PDF
舆情本体概念抽取研究 被引量:3
14
作者 张学芳 刘胜全 刘艳 《新疆大学学报(自然科学版)》 CAS 北大核心 2016年第3期333-337,共5页
面对舆情信息的动态性、跨领域性、面向主题等特点,目前已有的领域本体学习方法难以适应舆情本体知识的自动构建.本文采用信息爬取技术收集热点舆情文本信息,根据构建模型自动识别主题进行归类,并对识别后的主题文本提取名词性词汇或者... 面对舆情信息的动态性、跨领域性、面向主题等特点,目前已有的领域本体学习方法难以适应舆情本体知识的自动构建.本文采用信息爬取技术收集热点舆情文本信息,根据构建模型自动识别主题进行归类,并对识别后的主题文本提取名词性词汇或者短语作为候选概念集;采用语义相似度方法计算候选概念间的相关度,根据相关度计算各概念的权值,并进行排序;结合词频变化的方法抽取与主题相关的核心概念.实验结果表明,本文方法可有效地抽取与舆情主题相关的核心概念,对舆情本体的构建以及后期的知识共享和重用起到积极作用. 展开更多
关键词 舆情本体 概念抽取 词语相似度 词频统计
下载PDF
本体驱动的企业知识检索系统研究与实现 被引量:2
15
作者 周文海 黄雅萍 +4 位作者 周震 刘晓强 李锋 李金茂 王瑜 《计算机应用》 CSCD 北大核心 2010年第A01期40-43,共4页
为了在企业知识管理中获得更准确全面的知识,提出了一种基于语义的检索方法。该方法采用映射关系数据库、概念抽取和本体编辑工具半自动构建企业知识本体,并运用该本体对用户查询进行语义处理,实现了基于语义的知识检索系统。实际应用表... 为了在企业知识管理中获得更准确全面的知识,提出了一种基于语义的检索方法。该方法采用映射关系数据库、概念抽取和本体编辑工具半自动构建企业知识本体,并运用该本体对用户查询进行语义处理,实现了基于语义的知识检索系统。实际应用表明,该系统能有效返回含有语义信息的检索结果,实现对企业知识的智能化检索。 展开更多
关键词 企业知识本体 知识检索 映射规则 概念抽取 语义推理
下载PDF
研发设计资源大规模领域本体构建方法
16
作者 栗统 杜丽峰 王磊 《锻压装备与制造技术》 2022年第4期138-145,共8页
对企业中知识资源缺乏统一的组织与管理,共享效率低的问题进行了研究,提出了企业研发资源空间本体层中领域本体的构建方法,开展了本体构建技术研究。根据集团企业的需求将设计资源分类,并针对每类资源的非结构化文本数据运用Jieba分词... 对企业中知识资源缺乏统一的组织与管理,共享效率低的问题进行了研究,提出了企业研发资源空间本体层中领域本体的构建方法,开展了本体构建技术研究。根据集团企业的需求将设计资源分类,并针对每类资源的非结构化文本数据运用Jieba分词进行分词以及停用词过滤、词性过滤等,通过LDA模型抽取本体中的概念,之后运用双语词典、基于word2vec的层次聚类、关联规则等算法进行关系识别,并在最后运用企业设计资源中软件资源的部分资料对本文提出的方法进行可行性验证。 展开更多
关键词 研发设计资源 本体构建 概念抽取 关系识别
下载PDF
基于双模式的产品指标本体概念抽取 被引量:1
17
作者 时公泽 王浩畅 《信息技术》 2017年第3期26-29,33,共5页
由于人们对产品指标执行情况的关心日益增加,人们需要一种能够清晰描述产品指标的方法,而以本体为基础描述产品指标的方法由于其清晰的领域知识结构能够为统计分析打好基础成为目前研究者研究的主要方向之一。为了减少产品指标本体构建... 由于人们对产品指标执行情况的关心日益增加,人们需要一种能够清晰描述产品指标的方法,而以本体为基础描述产品指标的方法由于其清晰的领域知识结构能够为统计分析打好基础成为目前研究者研究的主要方向之一。为了减少产品指标本体构建对领域专家的依赖度,文中提出了一种双策略结合的产品指标本体概念抽取模式,针对产品指标数据的结构特点,融合两种分类特征重叠范围较小的策略分别对关键词赋予权重并加权排序,之后可由人工挑选或设定阈值确定领域概念。实验证明使用该方法抽取概念相较于单一策略准确性有所提高,且抽取结果是有效的。 展开更多
关键词 本体 产品指标 概念抽取
下载PDF
基于动态权值的多策略领域本体概念自动抽取 被引量:1
18
作者 张华楠 刘胜全 +2 位作者 刘艳 刘华鹏 李鹏 《计算机工程与应用》 CSCD 2014年第21期152-156,共5页
为了提高中文领域本体概念抽取的自动化程度及准确率,提出了一种基于动态权值的多策略中文领域本体概念自动抽取方法。针对中文领域本体概念的特点,采用自动学习的规则学习模式,筛选出候选概念,将改进的DR&DC、TF-IDF和NC-Value三... 为了提高中文领域本体概念抽取的自动化程度及准确率,提出了一种基于动态权值的多策略中文领域本体概念自动抽取方法。针对中文领域本体概念的特点,采用自动学习的规则学习模式,筛选出候选概念,将改进的DR&DC、TF-IDF和NC-Value三种策略融合,对候选概念进行领域归属度排序,将最终权重超过阈值的概念存入最终概念集合。实验证明了该方法抽取领域概念的可行性和有效性。 展开更多
关键词 动态权值 本体学习 多策略 概念抽取
下载PDF
高速列车本体半自动构建方法研究
19
作者 丁雨秋 黎荣 +1 位作者 郑宇飞 黎伟洋 《机械设计与研究》 CSCD 北大核心 2020年第4期185-189,共5页
目前高速列车本体多采用人工构建的方法,这种方法存在成本高、效率低且缺乏灵活性的不足。针对这种问题,提出了一种高速列车本体半自动构建方法,先使用分词工具Jieba对高速列车领域文档进行分词、去除停用词等预处理,然后使用TF-IDF、C-... 目前高速列车本体多采用人工构建的方法,这种方法存在成本高、效率低且缺乏灵活性的不足。针对这种问题,提出了一种高速列车本体半自动构建方法,先使用分词工具Jieba对高速列车领域文档进行分词、去除停用词等预处理,然后使用TF-IDF、C-value等算法进行概念抽取,再使用层次聚类及Dice测度等算法挖掘领域层次关系及非层次关系,最后使用protégé工具构建结构化的OWL本体并进行可视化管理。通过高速列车本体半自动构建实例,实现概念及语义关系的自动获取,验证该方法的有效性及可行性。 展开更多
关键词 高速列车 本体 半自动 概念抽取 关系挖掘
原文传递
基于云变换的农业领域知识概念提取
20
作者 杨阳 李绍稳 《洛阳理工学院学报(自然科学版)》 2018年第1期54-58,63,共6页
针对农业领域本体知识概念层次构建中多概念生成时复杂度高、耗时长及聚合度低的缺点,提出一种改进的云变换方法。通过K-Means++聚类对数据集初始筛选,然后根据细化后问题域中的数据分布快速、自动地进行信息准确划分及不同概念定性提取... 针对农业领域本体知识概念层次构建中多概念生成时复杂度高、耗时长及聚合度低的缺点,提出一种改进的云变换方法。通过K-Means++聚类对数据集初始筛选,然后根据细化后问题域中的数据分布快速、自动地进行信息准确划分及不同概念定性提取,使得最终的概念层次能够更加贴近实际。选用茶学数据作为实验样本对该方法进行分析与验证,结果表明了该方法的正确性和有效性。 展开更多
关键词 农业本体 云变换 概念抽取 K-Means++
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部