期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于规则与统计的本体概念自动获取方法研究 被引量:10
1
作者 张新 党延忠 《情报学报》 CSSCI 北大核心 2007年第6期813-820,共8页
为获取中文领域本体的概念提出了基于规则匹配和统计方法相结合的学习模型,充分利用现有的自然语言处理技术和统计学习方法,从领域文本中通过语义串切分、规则匹配、领域归属度分析和概念约简算法自动获取领域概念。该方法解决了现有... 为获取中文领域本体的概念提出了基于规则匹配和统计方法相结合的学习模型,充分利用现有的自然语言处理技术和统计学习方法,从领域文本中通过语义串切分、规则匹配、领域归属度分析和概念约简算法自动获取领域概念。该方法解决了现有中文本体学习方法对领域词典的依赖以及无法获得短语式特定领域概念的问题,同时解决了领域概念筛选问题。实验证明了该方法的有效性。 展开更多
关键词 领域本体构建 概念抽取规则匹配领域归属度 概念约简
下载PDF
基于统计自然语言处理技术的领域本体半自动构建研究 被引量:7
2
作者 何琳 侯汉清 《情报学报》 CSSCI 北大核心 2009年第2期201-207,共7页
本体的构建是影响语义Web成功与否的重要因素之一。本文借鉴机器学习以及自然语言处理等技术成果尝试半自动构建本体,以专业研究论文为研究语料,采用N-Gram文本表达法从语料中抽取关键概念,计算主题度获取领域概念。利用改进的层次聚类... 本体的构建是影响语义Web成功与否的重要因素之一。本文借鉴机器学习以及自然语言处理等技术成果尝试半自动构建本体,以专业研究论文为研究语料,采用N-Gram文本表达法从语料中抽取关键概念,计算主题度获取领域概念。利用改进的层次聚类算法对领域概念进行聚类以获取其等级体系,采用句法分析与统计相结合的方法从语料中获取可能的主、谓、宾模式为领域关系提供参考,并以农业史为例,设计开发了一个领域本体半自动构建实验系统,文中重点介绍了本体构建中概念的获取、等级关系、领域关系的构建以及形式化处理等关键技术的实现过程。 展开更多
关键词 领域本体 半自动构建 概念抽取 等级关系 领域关系 主谓宾模式
下载PDF
基于word2vec的数字图书馆本体构建技术研究 被引量:6
3
作者 闭炳华 《现代电子技术》 北大核心 2016年第15期90-94,共5页
针对传统本体构建既费时又费力等问题,设计了一种基于Web的领域本体半自动构建方法,提出了基于word2vec的领域本体概念抽取算法,采用基于中英文词典的方法抽取同义关系,研究了基于特征向量的上下位关系抽取算法。最后将基于Web的领域本... 针对传统本体构建既费时又费力等问题,设计了一种基于Web的领域本体半自动构建方法,提出了基于word2vec的领域本体概念抽取算法,采用基于中英文词典的方法抽取同义关系,研究了基于特征向量的上下位关系抽取算法。最后将基于Web的领域本体半自动构建方法应用于数字图书馆气候变化领域,实践表明,该方法大大缩短了本体构建的周期,减少了人工参与。 展开更多
关键词 本体构建 领域本体 概念抽取 关系抽取 数字图书馆现状
下载PDF
一种中文领域概念词自动提取方法研究 被引量:5
4
作者 董丽丽 李欢 +1 位作者 张翔 刘闫锋 《计算机工程与应用》 CSCD 2014年第6期127-131,共5页
针对统计学方法在领域概念获取时缺少词语语义信息的问题,提出了一种结合语义相似度和改进近邻传播算法的领域概念自动获取方法。该方法通过互信息进行合成词提取,使用对数似然比避免对低频词的遗漏,利用HowNet和余弦相似度识别术语间... 针对统计学方法在领域概念获取时缺少词语语义信息的问题,提出了一种结合语义相似度和改进近邻传播算法的领域概念自动获取方法。该方法通过互信息进行合成词提取,使用对数似然比避免对低频词的遗漏,利用HowNet和余弦相似度识别术语间同义词,采用改进的近邻传播算法获取领域概念集合。实验结果表明,该方法在准确率、召回率和困惑度变化率上比传统的方法都有较大提高。 展开更多
关键词 领域概念获取 改进近邻传播算法 对数似然比 语义相似度 互信息
下载PDF
网络社区领域概念共现关系分析及应用——以丁香园眼科论坛为例 被引量:2
5
作者 傅泽平 陈果 《信息资源管理学报》 CSSCI 2019年第2期103-108,128,共7页
以丁香园眼科论坛为例,从现有医学主题词表和网络医学百科词条中提取出能够反映眼科疾病名称、疾病症状、发病器官和相关诊疗的眼科领域概念术语,利用这些眼科领域概念术语对采集到的论坛帖文本集进行分词处理,分析基于文本频次的眼科... 以丁香园眼科论坛为例,从现有医学主题词表和网络医学百科词条中提取出能够反映眼科疾病名称、疾病症状、发病器官和相关诊疗的眼科领域概念术语,利用这些眼科领域概念术语对采集到的论坛帖文本集进行分词处理,分析基于文本频次的眼科领域概念术语共现频次和共现强度,并以此为基础实现对论坛帖信息资源的分面导航。 展开更多
关键词 网络社区 领域概念提取 领域概念共现 分面导航 医学主题词 眼科主题词
下载PDF
面向茶学领域本体的概念自动提取方法研究
6
作者 徐济成 李绍稳 +1 位作者 张友华 辜丽川 《农业网络信息》 2010年第8期13-15,24,共4页
针对目前手工构建本体耗时费力这一难题,以茶学领域知识为研究对象,提出了一种本体的概念自动提取方法。该方法利用中文分词技术对茶学语料进行切分,使用互信息技术从切分后的语料中得出候选概念(合成词)集合,通过判断候选概念和非合成... 针对目前手工构建本体耗时费力这一难题,以茶学领域知识为研究对象,提出了一种本体的概念自动提取方法。该方法利用中文分词技术对茶学语料进行切分,使用互信息技术从切分后的语料中得出候选概念(合成词)集合,通过判断候选概念和非合成词的领域相关性,自动提取出茶学领域本体概念。以该方法为基础开发了相应的原型系统,实验结果表明,该方法是有效的。 展开更多
关键词 茶学本体 概念提取 互信息 领域相关性
下载PDF
领域本体概念实例、属性和属性值的抽取及关系预测 被引量:32
7
作者 郭剑毅 李真 +1 位作者 余正涛 张志坤 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2012年第4期383-389,共7页
研究了如何使用协作分类器(协作使用条件随机场(CRFs)和支持向量机(SVM))解决领域概念实例、属性及属性值的抽取以及它们三者之间对应关系预测的问题.首先将概念实例、属性及属性值看作三类实体,把概念实例、属性及属性值的抽取问题转... 研究了如何使用协作分类器(协作使用条件随机场(CRFs)和支持向量机(SVM))解决领域概念实例、属性及属性值的抽取以及它们三者之间对应关系预测的问题.首先将概念实例、属性及属性值看作三类实体,把概念实例、属性及属性值的抽取问题转化为命名实体识别问题,利用条件随机场建模进行命名实体识别;在此基础上定义实体间对应关系,对概念实例、属性及属性值三者的对应关系做预测,把概念实例、属性与属性值三者之间存在关系的向量标记为1,否则标记为0,利用支持向量机建模进行关系的预测.且以云南旅游景点概念实例、属性及属性值进行六组相关的实验.实验表明,在开放测试中协作分类器精确度达到84.4%、召回率达到82.7%及F值达到为83.6%,相比于词语共现F值提高了20个百分点. 展开更多
关键词 领域本体 概念实例抽取 属性抽取 属性值抽取 条件随机场 支持向量机
下载PDF
基于深度学习的领域本体概念自动获取方法研究 被引量:17
8
作者 王思丽 祝忠明 +1 位作者 刘巍 杨恒 《情报理论与实践》 CSSCI 北大核心 2020年第3期145-152,144,共9页
[目的/意义]实现对领域概念的自动学习抽取,解决领域本体自动化构建的首要基础任务。[方法/过程]以无监督的学习方法和端到端的识别模式为理论技术基础,首先通过对主流词嵌入模型进行对比分析,设计提出了基于Word2Vec和Skip-Gram的领域... [目的/意义]实现对领域概念的自动学习抽取,解决领域本体自动化构建的首要基础任务。[方法/过程]以无监督的学习方法和端到端的识别模式为理论技术基础,首先通过对主流词嵌入模型进行对比分析,设计提出了基于Word2Vec和Skip-Gram的领域文本特征词嵌入模型的自动生成方法;其次研究构建了以IOB格式的标注文本作为输入,基于自注意力机制的BLSTM-CRF领域概念自动抽取模型;最后以资源环境学科领域为例进行了实验研究与评估分析。[结果/结论]模型能够实现对领域概念的自动抽取,对领域新概念或术语的自动识别也具有一定的健壮性。[局限]模型精度尚未达到峰值,有待进一步优化提升。 展开更多
关键词 深度学习 领域本体 概念自动获取 词嵌入 自注意力
原文传递
基于Web弱指导的本体概念实例及属性的同步提取 被引量:4
9
作者 康为 穗志方 《中文信息学报》 CSCD 北大核心 2010年第1期54-59,共6页
该文提出了一种基于Web弱指导的本体概念实例和属性的同步提取方法,利用小规模的种子实例和属性集,该文从Web上自动获取实例和属性共现的上下文模式,并利用种子实例和属性的关联性来评价这些模式。进一步,根据上下文模式提取候选概念实... 该文提出了一种基于Web弱指导的本体概念实例和属性的同步提取方法,利用小规模的种子实例和属性集,该文从Web上自动获取实例和属性共现的上下文模式,并利用种子实例和属性的关联性来评价这些模式。进一步,根据上下文模式提取候选概念实例和属性后,该文提出两种方法来评价提取的候选实例和属性。第一,利用概念实例和属性的关联性来互相评价对方的准确度;第二,利用候选实例或候选属性与种子实例或属性在上下文模式分布上的相似度来评价准确度。在疾病类实验结果表明,人工确认候选实例的准确率在前500个结果达到94%,前1 000个结果的准确率也高达93%。 展开更多
关键词 计算机应用 中文信息处理 WEB 概念实例提取 属性提取 弱指导 上下文模式
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部