期刊文献+
共找到46篇文章
< 1 2 3 >
每页显示 20 50 100
基于DNN的汉语框架识别研究 被引量:8
1
作者 赵红燕 李茹 +1 位作者 张晟 张力文 《中文信息学报》 CSCD 北大核心 2016年第6期75-83,共9页
框架识别是语义角色标注的基本任务,它是根据目标词激起的语义场景,为其分配一个合适的语义框架。目前框架识别的研究主要是基于统计机器学习方法,把它看作多分类问题,框架识别的性能主要依赖于人工选择的特征。然而,人工选择特征的有... 框架识别是语义角色标注的基本任务,它是根据目标词激起的语义场景,为其分配一个合适的语义框架。目前框架识别的研究主要是基于统计机器学习方法,把它看作多分类问题,框架识别的性能主要依赖于人工选择的特征。然而,人工选择特征的有效性和完备性无法保证。深度神经网络自动学习特征的能力,为我们提供了新思路。该文探索了利用深度神经网络自动学习目标词上下文特征,建立了一种新的通用的框架识别模型,在汉语框架网和《人民日报》2003年3月新闻语料上分别取得了79.64%和78.58%的准确率,实验证明该模型具有较好的泛化能力。 展开更多
关键词 汉语框架 框架识别 深度神经网络 分布式表征
下载PDF
基于词分布式表征的汉语框架排歧模型 被引量:7
2
作者 张力文 王瑞波 +1 位作者 李茹 张晟 《中文信息学报》 CSCD 北大核心 2017年第6期50-57,共8页
框架排歧是根据句子中目标词的上下文语境,从框架库中为该目标词自动选择一个合适的框架。该任务在一定程度上解决了动词中一词多义的现象。该文基于词语及句子的分布式表征,提出了基于距离和基于词语相似度矩阵的框架排歧模型。与传统... 框架排歧是根据句子中目标词的上下文语境,从框架库中为该目标词自动选择一个合适的框架。该任务在一定程度上解决了动词中一词多义的现象。该文基于词语及句子的分布式表征,提出了基于距离和基于词语相似度矩阵的框架排歧模型。与传统方法相比,该模型有效避免了人工选择特征,克服了特征空间维度过高、特征之间没有关联性等缺点,使框架排歧的准确率达到65.71%。并与当前最好的模型,进行显著性和一致性检验,进一步验证了词分布式表征对框架排歧任务的有效性。 展开更多
关键词 汉语框架 框架排歧 分布式表征
下载PDF
基于汉语框架的网络事件抽取及相关算法研究 被引量:4
3
作者 赵文娟 刘忠宝 《情报理论与实践》 CSSCI 北大核心 2016年第10期112-116,79,共6页
文章研究的目的是从众多非结构化的网络文档中抽取出与某一主题事件相关的各种信息,对信息进行合并、提取,然后依据相应的规则填槽到主题事件框架槽中,供用户进一步的查询提供依据。研究方法是通过对基于汉语框架的网络事件抽取流程的介... 文章研究的目的是从众多非结构化的网络文档中抽取出与某一主题事件相关的各种信息,对信息进行合并、提取,然后依据相应的规则填槽到主题事件框架槽中,供用户进一步的查询提供依据。研究方法是通过对基于汉语框架的网络事件抽取流程的介绍,对流程中使用的技术和方法进行了描述。最后通过"空难"框架下的"德国之翼坠机事件"为例对方法的有效性进行了验证。 展开更多
关键词 事件抽取 汉语框架 信息抽取 文本聚类
原文传递
基于Wordnet的汉语框架网络知识库词元扩展研究 被引量:1
4
作者 贾君枝 董文清 《情报科学》 CSSCI 北大核心 2009年第12期1866-1870,共5页
基于Wordnet汉语框架网络知识库词元组织的不同特点,提出了利用Wordnet丰富词汇的特点来扩充汉语框架网络知识库词元的思路。通过采用跨本体的相似度计算方法--MD3模型,计算概念之间的相似度,将Wordnet中含义相同的同义词集合放到其对... 基于Wordnet汉语框架网络知识库词元组织的不同特点,提出了利用Wordnet丰富词汇的特点来扩充汉语框架网络知识库词元的思路。通过采用跨本体的相似度计算方法--MD3模型,计算概念之间的相似度,将Wordnet中含义相同的同义词集合放到其对应的汉语框架网络知识库中的框架下,可有效地实现词元扩充的目的。 展开更多
关键词 WORDNET 汉语框架 网络知识库 词元 扩展
原文传递
汉语框架语义知识库及软件描述体系 被引量:52
5
作者 郝晓燕 刘伟 +1 位作者 李茹 刘开瑛 《中文信息学报》 CSCD 北大核心 2007年第5期96-100,138,共6页
汉语框架网络工程是以框架语义学为理论基础的基于语料库的计算词典编纂工程,用于语言学、计算语言学研究及自然语言处理研究。该工程的结果包括两部分:汉语框架语义知识库(即词典资源)和相关软件。其中,汉语框架网络知识库包括框架库... 汉语框架网络工程是以框架语义学为理论基础的基于语料库的计算词典编纂工程,用于语言学、计算语言学研究及自然语言处理研究。该工程的结果包括两部分:汉语框架语义知识库(即词典资源)和相关软件。其中,汉语框架网络知识库包括框架库、句子库和词元库三部分,相关软件主要包括汉语框架语义知识库管理系统和基于Web的展示系统。本文介绍了汉语框架语义知识库的语义描述体系以及软件描述体系。 展开更多
关键词 计算机应用 中文信息处理 汉语框架网络 框架语义 描述体系 软件
下载PDF
基于框架语义分析的汉语句子相似度计算 被引量:47
6
作者 李茹 王智强 +2 位作者 李双红 梁吉业 Collin Baker 《计算机研究与发展》 EI CSCD 北大核心 2013年第8期1728-1736,共9页
句子相似度计算在自然语言处理的许多领域中发挥着重要作用.已有的汉语句子相似度计算方法由于考虑句子的语义不全面,使得相似度计算结果不够准确,为此提出一种新的汉语句子相似度计算方法.该方法基于汉语框架网语义资源,通过多框架语... 句子相似度计算在自然语言处理的许多领域中发挥着重要作用.已有的汉语句子相似度计算方法由于考虑句子的语义不全面,使得相似度计算结果不够准确,为此提出一种新的汉语句子相似度计算方法.该方法基于汉语框架网语义资源,通过多框架语义分析、框架的重要度度量、框架的相似匹配、框架间相似度计算等关键步骤来实现句子语义的相似度量.其中多框架语义分析是从框架角度对句子中的所有目标词进行识别、框架选择及框架元素标注,从而达到全面刻画句子语义的目的;在此基础上根据句子中框架的语义覆盖范围对不同框架的重要度进行区分,能够使得相似度结果更准确.在包含多目标词的句子集上的实验结果显示,基于多框架语义分析的句子相似度计算方法相对传统方法获得了更好的测试结果. 展开更多
关键词 汉语框架 框架语义分析 句子语义相似度 框架相似度 框架重要度
下载PDF
汉语框架语义角色的自动标注 被引量:42
7
作者 李济洪 王瑞波 +1 位作者 王蔚林 李国臣 《软件学报》 EI CSCD 北大核心 2010年第4期597-611,共15页
基于山西大学自主开发的汉语框架语义知识库(CFN),将语义角色标注问题通过IOB策略转化为词序列标注问题,采用条件随机场模型,研究了汉语框架语义角色的自动标注.模型以词为基本标注单元,选择词、词性、词相对于目标词的位置、目标词及... 基于山西大学自主开发的汉语框架语义知识库(CFN),将语义角色标注问题通过IOB策略转化为词序列标注问题,采用条件随机场模型,研究了汉语框架语义角色的自动标注.模型以词为基本标注单元,选择词、词性、词相对于目标词的位置、目标词及其组合为特征.针对每个特征设定若干可选的窗口,组合构成模型的各种特征模板,基于统计学中的正交表,给出一种较优模板选择方法.全部实验在选出的25个框架的6692个例句的语料上进行.对每一个框架,分别按照其例句训练一个模型,同时进行语义角色的边界识别与分类,进行2-fold交叉验证.在给定句子中的目标词以及目标词所属的框架情况下,25个框架交叉验证的实验结果的准确率、召回率、F1-值分别达到74.16%,52.70%和61.62%. 展开更多
关键词 汉语框架语义知识库 语义角色标注 正交表 特征选择 条件随机场
下载PDF
汉语框架语义网构建及其应用技术研究 被引量:24
8
作者 刘开瑛 《中文信息学报》 CSCD 北大核心 2011年第6期46-52,62,共8页
汉语框架语义网(Chinese FrameNet,CFN)是一个以Fillmore的框架语义学为理论基础、以英文FrameNet为参照、以汉语语料事实为依据的供计算机使用的汉语词汇语义数据库。该文首先介绍了汉语框架语义网的构建基础——框架语义学以及英语的... 汉语框架语义网(Chinese FrameNet,CFN)是一个以Fillmore的框架语义学为理论基础、以英文FrameNet为参照、以汉语语料事实为依据的供计算机使用的汉语词汇语义数据库。该文首先介绍了汉语框架语义网的构建基础——框架语义学以及英语的框架语义网工程,然后具体分析了汉语框架语义网的构建技术,并对基于汉语框架网的语义角色自动标注研究进行了介绍,25个框架的交叉验证的实验结果的准确率、召回率、F1-值分别达到74.16%,52.70%,61.62%;最后,介绍了几个基于汉语框架语义网的研究课题的进展情况。 展开更多
关键词 汉语框架 语义角色标注 框架语义依存图
下载PDF
基于Dropout正则化的汉语框架语义角色识别 被引量:16
9
作者 王瑞波 李济洪 +1 位作者 李国臣 杨耀文 《中文信息学报》 CSCD 北大核心 2017年第1期147-154,共8页
汉语框架语义角色识别是汉语框架语义分析的重要任务之一。该文基于汉语词语、词性等特征的分布式表示,使用一种多特征融合的神经网络结构来构建汉语框架语义角色识别模型。鉴于可用的训练语料规模有限,该文采用了Dropout正则化技术来... 汉语框架语义角色识别是汉语框架语义分析的重要任务之一。该文基于汉语词语、词性等特征的分布式表示,使用一种多特征融合的神经网络结构来构建汉语框架语义角色识别模型。鉴于可用的训练语料规模有限,该文采用了Dropout正则化技术来改进神经网络的训练过程。实验结果表明,Dropout正则化的加入有效地缓解了模型的过拟合现象,使得模型的F值有了近7%的提高。该文进一步优化了学习率以及分布式表示的初始值,最终的汉语框架语义角色识别的F值达到70.54%,较原有的最优结果提升2%左右。 展开更多
关键词 汉语框架网络 语义角色识别 Dropout正则化
下载PDF
基于汉语框架网的旅游信息问答系统设计 被引量:14
10
作者 李茹 王文晶 +3 位作者 梁吉业 宋小香 刘海静 由丽萍 《中文信息学报》 CSCD 北大核心 2009年第2期34-40,共7页
该文借助汉语框架网(Chinese Frame Net,简称CFN)在语义表达方面的独特优势,探讨用本体描述语言建立面向特定领域的汉语框架语义知识库,并且以旅游交通领域中问答系统设计为例分析方法的有效性。方法中首先利用TREC分类与本体分类相结... 该文借助汉语框架网(Chinese Frame Net,简称CFN)在语义表达方面的独特优势,探讨用本体描述语言建立面向特定领域的汉语框架语义知识库,并且以旅游交通领域中问答系统设计为例分析方法的有效性。方法中首先利用TREC分类与本体分类相结合的方式为查询问句分类,然后提出基于CFN的问句分析策略,通过CFN语义分析得到问句中三元组:语义谓词、语义主体和语义客体,在问句分析的基础上从旅游本体知识库中对答案进行抽取并对答案处理,同时用本体编辑工具Protégé编码,实验证实方法是有效的。 展开更多
关键词 计算机应用 中文信息处理 汉语框架 本体 问答系统
下载PDF
汉语框架自动识别中的歧义消解 被引量:11
11
作者 李济洪 高亚慧 +1 位作者 王瑞波 李国臣 《中文信息学报》 CSCD 北大核心 2011年第3期38-44,共7页
该文研究了汉语框架自动识别中的歧义消解问题,即对给定句子中的目标词,基于其上下文环境,从现有的框架库中,为该目标词自动标注一个合适的框架。该文将此任务看作分类问题,使用最大熵建模,选用词、词性、基本块、依存句法树上的若干特... 该文研究了汉语框架自动识别中的歧义消解问题,即对给定句子中的目标词,基于其上下文环境,从现有的框架库中,为该目标词自动标注一个合适的框架。该文将此任务看作分类问题,使用最大熵建模,选用词、词性、基本块、依存句法树上的若干特征,并使用开窗口技术和BOW策略,以目前汉语框架语义知识库中的88个词元的2 077条例句为训练、测试语料,进行了3-fold交叉验证实验,最好结果取得69.28%的精确率(Accuracy)。 展开更多
关键词 汉语框架语义知识库 框架语义 框架消歧 最大熵模型
下载PDF
汉、英语义框架网络对比 被引量:8
12
作者 周领顺 《中国外语》 CSSCI 2009年第4期47-53,共7页
中文信息处理需要以庞大的语义知识库为依托,而正在研制的汉语框架网络CFN便是这样一项基础性的资源。汉语框架网络以框架语义学理论为指导,并以英语框架网络FN的实践为重要参考。本文针对中文信息处理应用目标的需要,通过英汉框架网络... 中文信息处理需要以庞大的语义知识库为依托,而正在研制的汉语框架网络CFN便是这样一项基础性的资源。汉语框架网络以框架语义学理论为指导,并以英语框架网络FN的实践为重要参考。本文针对中文信息处理应用目标的需要,通过英汉框架网络的比较,展示了CFN的研究思路。 展开更多
关键词 英语框架网络 汉语框架网络 中文信息处理
原文传递
基于汉语框架网的中文问题分类 被引量:8
13
作者 李茹 宋小香 王文晶 《计算机工程与应用》 CSCD 北大核心 2009年第31期111-114,137,共5页
问题分类是问答系统中重要的组成部分,问题分类结果的准确性直接影响到问答系统的质量。基于汉语框架网(Chinese FrameNet,CFN)提出了一种用于中文问题分类的新方法。该方法通过构建一系列汉语框架语义特征来表达每个问句的语义信息,进... 问题分类是问答系统中重要的组成部分,问题分类结果的准确性直接影响到问答系统的质量。基于汉语框架网(Chinese FrameNet,CFN)提出了一种用于中文问题分类的新方法。该方法通过构建一系列汉语框架语义特征来表达每个问句的语义信息,进而使用最大熵模型进行中文问题的自动分类,与传统的问题分类技术相比,汉语框架语义信息的加入使得中文问题分类的精度得到了显著提高。实验结果进一步验证了该方法的有效性,大类和小类的分类精度分别达到了91.38%和83.20%。 展开更多
关键词 汉语框架 问题分类 最大熵模型
下载PDF
基于条件随机场的汉语框架语义角色自动标注 被引量:8
14
作者 宋毅君 王瑞波 +1 位作者 李济洪 李国臣 《中文信息学报》 CSCD 北大核心 2014年第3期36-47,共12页
在给定目标词及其所属框架的条件下,汉语框架语义角色标注可以分为语义角色识别和角色分类两个步骤。该文将此任务通过IOB2标记策略形式化为词序列标注问题,以词为基本标注单元,采用条件随机场模型进行自动标注实验。先对语料使用清华... 在给定目标词及其所属框架的条件下,汉语框架语义角色标注可以分为语义角色识别和角色分类两个步骤。该文将此任务通过IOB2标记策略形式化为词序列标注问题,以词为基本标注单元,采用条件随机场模型进行自动标注实验。先对语料使用清华大学的基本块自动分析器进行分析,提取出15个块层面的新特征,并将这些特征标记形式化到词序列上。以文献[20]已有的12个词层面特征以及15个块层面特征共同构成候选特征集,采用正交表方法来选择模型的最优特征模板。在与文献[20]相同的语料上,相同的3组2折交叉验证实验下,语义角色标注的总性能的F1-值比文献[20]的F1-值提高了近1%,且在显著水平0.05的t-检验下显著。实验结果表明:(1)基于词序列模型,新加入的15个块层面特征可以显著提高标注模型的性能,但这类特征主要对角色分类有显著作用,对角色识别作用不显著;(2)基于词序列的标注模型显著好于以基本块为标注单元以及以句法成分为标注单元的标注模型。 展开更多
关键词 汉语框架语义知识库 语义角色标注 条件随机场模型 基本块
下载PDF
基于本体的领域自动问答系统研究 被引量:7
15
作者 朱淑媛 罗军 《计算机应用与软件》 北大核心 2019年第8期98-105,154,共9页
由于传统信息检索返回的结果难以充分理解用户的问题语义,因此以医学领域本体为例,提出一种具有语义推理的自动问答系统。系统在领域知识本体上,通过链式索引结构抽取问题对应在领域知识本体中的命名实体。为理解问题的语义层次,通过改... 由于传统信息检索返回的结果难以充分理解用户的问题语义,因此以医学领域本体为例,提出一种具有语义推理的自动问答系统。系统在领域知识本体上,通过链式索引结构抽取问题对应在领域知识本体中的命名实体。为理解问题的语义层次,通过改进CFN汉语框架网结构,给出从领域知识本体直接生成能理解问题语义的QFN问题框架本体的映射算法。运用QFN将自然语言问题转化成RDF三元组结构,自动生成问题对应的SPARQL查询语句,同时调用Jena推理机完成语义推理查询在知识本体中查找并给出问题的相关回答。实验结果表明,该方法相比传统的信息检索,可以理解问题表达语义并给出与问题语义相关度高的答案。 展开更多
关键词 本体 自动问答 CFN汉语框架 问题框架 RDF三元组 SPARQL
下载PDF
基于词元语义特征的汉语框架排歧研究 被引量:7
16
作者 李国臣 张立凡 +2 位作者 李茹 刘海静 石佼 《中文信息学报》 CSCD 北大核心 2013年第4期44-51,共8页
框架排歧指的是在一个给定的句子中,判断句中目标词激起的语义场景与该目标词可能激起的哪个框架一致,则将该框架分配给当前的目标词。框架排歧最重要的一个步骤就是特征选择,目前常用的方法是人工特征选择方法,但是这种方法不能有效地... 框架排歧指的是在一个给定的句子中,判断句中目标词激起的语义场景与该目标词可能激起的哪个框架一致,则将该框架分配给当前的目标词。框架排歧最重要的一个步骤就是特征选择,目前常用的方法是人工特征选择方法,但是这种方法不能有效地利用每个目标词的语义特征,而且大量实验表明,不同的目标词取得最好的结果时所用的特征模板是不同的。因此,该文为每个目标词设置一个特征模板,并提出了特征模板的自动选择算法,首先从语料中抽取特征构成特征集,然后利用打分机制,把特征集中得分最高的特征逐个加入到特征模板中,直到相邻两次的得分不再增加。该文借助汉语框架网语义资源,利用最大熵模型建模,使用自动特征选择算法选出特征模板,并进行5-fold交叉验证,平均精确率可达到84.46%。 展开更多
关键词 框架排歧 汉语框架网语义资源 自动特征选择 词元语义特征
下载PDF
汉语核心框架语义分析 被引量:6
17
作者 石佼 李茹 王智强 《中文信息学报》 CSCD 北大核心 2014年第6期48-55,共8页
汉语核心框架语义分析是从框架语义角度,通过抽取句子的核心框架,获取汉语句子的核心语义骨架。该文将核心框架语义分析分为核心目标词识别、框架选择和框架元素标注三个子任务,基于各个子任务的不同特点,采取最大熵模型分别对核心目标... 汉语核心框架语义分析是从框架语义角度,通过抽取句子的核心框架,获取汉语句子的核心语义骨架。该文将核心框架语义分析分为核心目标词识别、框架选择和框架元素标注三个子任务,基于各个子任务的不同特点,采取最大熵模型分别对核心目标词识别与框架选择任务进行建模;采用序列标注模型条件随机场对框架元素标注任务进行建模。实验在汉语框架网资源的10 831条测试语料中显示,核心目标词识别和框架元素标注F值分别达到99.51%和59.01%,框架选择准确率达到84.73%。 展开更多
关键词 汉语框架 核心框架语义 语义分析
下载PDF
汉语篇章中零形式的识别与消解 被引量:5
18
作者 武娟 李茹 王智强 《中文信息学报》 CSCD 北大核心 2016年第3期9-15,共7页
传统的语义角色标注只能为句中显式表达的句法论元分配语义角色,但是忽略了一些隐式的语义成分,即零形式。该文基于汉语框架语义研究了零形式的识别及消解。在识别阶段,首先使用规则方法进行零形式检测,然后运用筛选过滤的策略去除部分... 传统的语义角色标注只能为句中显式表达的句法论元分配语义角色,但是忽略了一些隐式的语义成分,即零形式。该文基于汉语框架语义研究了零形式的识别及消解。在识别阶段,首先使用规则方法进行零形式检测,然后运用筛选过滤的策略去除部分错误识别的零形式;在消解阶段,将篇章中显式表达的框架元素填充项作为零形式的候选先行语,提出结合框架元素语义类型与框架关系的消解方法。在构建的164篇中文语料上进行实验,与其他方法相比,该方法能获得更好的结果。 展开更多
关键词 汉语框架 零形式识别 零形式消解
下载PDF
基于框架语义映射和类型感知的篇章事件抽取
19
作者 卢江 苏雪峰 +2 位作者 李茹 闫智超 陈加兴 《中文信息学报》 CSCD 北大核心 2024年第5期53-64,共12页
篇章事件抽取任务从给定的文本中识别其事件类型和事件论元。该任务包括事件检测和论元识别两个子任务。目前篇章事件普遍存在数据稀疏和多值论元耦合的问题。基于此,该文提出了一种基于框架语义映射和类型感知的篇章事件抽取方法。该... 篇章事件抽取任务从给定的文本中识别其事件类型和事件论元。该任务包括事件检测和论元识别两个子任务。目前篇章事件普遍存在数据稀疏和多值论元耦合的问题。基于此,该文提出了一种基于框架语义映射和类型感知的篇章事件抽取方法。该文分析发现事件描述与框架语义网有着相似的结构,因此将汉语框架网(CFN)与中文篇章事件建立映射,并在文本输入层引入触发词释义信息和滑窗机制充分感知上下文信息,改善了事件检测的数据稀疏问题;使用基于类型感知标签的多事件分离策略缓解了论元耦合问题。为了提升模型的鲁棒性,进一步引入对抗训练。在DuEE-fin和CCKS2021数据集上的实验结果显示,该文模型较当前主流模型测试结果有较大提升,验证了方法的有效性。 展开更多
关键词 汉语框架 框架语义映射 类型感知 事件抽取
下载PDF
汉语框架网络知识库的语义角色特征识别 被引量:4
20
作者 贾君枝 赵文娟 王东元 《图书情报工作》 CSSCI 北大核心 2009年第17期110-113,共4页
以汉语框架网络数据库为研究对象,从短语类型、主控范畴、句法树路径、位置、中心词、语态等特征方面综合考虑,达到识别各种框架语义角色的目的,并结合盗窃框架中的词元"偷",对一系列语义角色特征的规律进行总结说明,进而对CF... 以汉语框架网络数据库为研究对象,从短语类型、主控范畴、句法树路径、位置、中心词、语态等特征方面综合考虑,达到识别各种框架语义角色的目的,并结合盗窃框架中的词元"偷",对一系列语义角色特征的规律进行总结说明,进而对CFN框架网络语义层自动识别理论进行探索。 展开更多
关键词 汉语框架网络 CFN 框架 语义角色 特征标识
原文传递
上一页 1 2 3 下一页 到第
使用帮助 返回顶部