期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
汉语框架语义知识库及软件描述体系 被引量:52
1
作者 郝晓燕 刘伟 +1 位作者 李茹 刘开瑛 《中文信息学报》 CSCD 北大核心 2007年第5期96-100,138,共6页
汉语框架网络工程是以框架语义学为理论基础的基于语料库的计算词典编纂工程,用于语言学、计算语言学研究及自然语言处理研究。该工程的结果包括两部分:汉语框架语义知识库(即词典资源)和相关软件。其中,汉语框架网络知识库包括框架库... 汉语框架网络工程是以框架语义学为理论基础的基于语料库的计算词典编纂工程,用于语言学、计算语言学研究及自然语言处理研究。该工程的结果包括两部分:汉语框架语义知识库(即词典资源)和相关软件。其中,汉语框架网络知识库包括框架库、句子库和词元库三部分,相关软件主要包括汉语框架语义知识库管理系统和基于Web的展示系统。本文介绍了汉语框架语义知识库的语义描述体系以及软件描述体系。 展开更多
关键词 计算机应用 中文信息处理 汉语框架网络 框架语义 描述体系 软件
下载PDF
基于框架语义分析的汉语句子相似度计算 被引量:47
2
作者 李茹 王智强 +2 位作者 李双红 梁吉业 Collin Baker 《计算机研究与发展》 EI CSCD 北大核心 2013年第8期1728-1736,共9页
句子相似度计算在自然语言处理的许多领域中发挥着重要作用.已有的汉语句子相似度计算方法由于考虑句子的语义不全面,使得相似度计算结果不够准确,为此提出一种新的汉语句子相似度计算方法.该方法基于汉语框架网语义资源,通过多框架语... 句子相似度计算在自然语言处理的许多领域中发挥着重要作用.已有的汉语句子相似度计算方法由于考虑句子的语义不全面,使得相似度计算结果不够准确,为此提出一种新的汉语句子相似度计算方法.该方法基于汉语框架网语义资源,通过多框架语义分析、框架的重要度度量、框架的相似匹配、框架间相似度计算等关键步骤来实现句子语义的相似度量.其中多框架语义分析是从框架角度对句子中的所有目标词进行识别、框架选择及框架元素标注,从而达到全面刻画句子语义的目的;在此基础上根据句子中框架的语义覆盖范围对不同框架的重要度进行区分,能够使得相似度结果更准确.在包含多目标词的句子集上的实验结果显示,基于多框架语义分析的句子相似度计算方法相对传统方法获得了更好的测试结果. 展开更多
关键词 汉语框架网 多框架语义分析 句子语义相似度 框架相似度 框架重要度
下载PDF
汉语框架语义角色的自动标注 被引量:42
3
作者 李济洪 王瑞波 +1 位作者 王蔚林 李国臣 《软件学报》 EI CSCD 北大核心 2010年第4期597-611,共15页
基于山西大学自主开发的汉语框架语义知识库(CFN),将语义角色标注问题通过IOB策略转化为词序列标注问题,采用条件随机场模型,研究了汉语框架语义角色的自动标注.模型以词为基本标注单元,选择词、词性、词相对于目标词的位置、目标词及... 基于山西大学自主开发的汉语框架语义知识库(CFN),将语义角色标注问题通过IOB策略转化为词序列标注问题,采用条件随机场模型,研究了汉语框架语义角色的自动标注.模型以词为基本标注单元,选择词、词性、词相对于目标词的位置、目标词及其组合为特征.针对每个特征设定若干可选的窗口,组合构成模型的各种特征模板,基于统计学中的正交表,给出一种较优模板选择方法.全部实验在选出的25个框架的6692个例句的语料上进行.对每一个框架,分别按照其例句训练一个模型,同时进行语义角色的边界识别与分类,进行2-fold交叉验证.在给定句子中的目标词以及目标词所属的框架情况下,25个框架交叉验证的实验结果的准确率、召回率、F1-值分别达到74.16%,52.70%和61.62%. 展开更多
关键词 汉语框架语义知识库 语义角色标注 正交表 特征选择 条件随机场
下载PDF
汉语框架语义网构建及其应用技术研究 被引量:24
4
作者 刘开瑛 《中文信息学报》 CSCD 北大核心 2011年第6期46-52,62,共8页
汉语框架语义网(Chinese FrameNet,CFN)是一个以Fillmore的框架语义学为理论基础、以英文FrameNet为参照、以汉语语料事实为依据的供计算机使用的汉语词汇语义数据库。该文首先介绍了汉语框架语义网的构建基础——框架语义学以及英语的... 汉语框架语义网(Chinese FrameNet,CFN)是一个以Fillmore的框架语义学为理论基础、以英文FrameNet为参照、以汉语语料事实为依据的供计算机使用的汉语词汇语义数据库。该文首先介绍了汉语框架语义网的构建基础——框架语义学以及英语的框架语义网工程,然后具体分析了汉语框架语义网的构建技术,并对基于汉语框架网的语义角色自动标注研究进行了介绍,25个框架的交叉验证的实验结果的准确率、召回率、F1-值分别达到74.16%,52.70%,61.62%;最后,介绍了几个基于汉语框架语义网的研究课题的进展情况。 展开更多
关键词 汉语框架网 语义角色标注 框架语义依存图
下载PDF
基于汉语框架网的旅游信息问答系统设计 被引量:14
5
作者 李茹 王文晶 +3 位作者 梁吉业 宋小香 刘海静 由丽萍 《中文信息学报》 CSCD 北大核心 2009年第2期34-40,共7页
该文借助汉语框架网(Chinese Frame Net,简称CFN)在语义表达方面的独特优势,探讨用本体描述语言建立面向特定领域的汉语框架语义知识库,并且以旅游交通领域中问答系统设计为例分析方法的有效性。方法中首先利用TREC分类与本体分类相结... 该文借助汉语框架网(Chinese Frame Net,简称CFN)在语义表达方面的独特优势,探讨用本体描述语言建立面向特定领域的汉语框架语义知识库,并且以旅游交通领域中问答系统设计为例分析方法的有效性。方法中首先利用TREC分类与本体分类相结合的方式为查询问句分类,然后提出基于CFN的问句分析策略,通过CFN语义分析得到问句中三元组:语义谓词、语义主体和语义客体,在问句分析的基础上从旅游本体知识库中对答案进行抽取并对答案处理,同时用本体编辑工具Protégé编码,实验证实方法是有效的。 展开更多
关键词 计算机应用 中文信息处理 汉语框架网 本体 问答系统
下载PDF
汉语框架自动识别中的歧义消解 被引量:11
6
作者 李济洪 高亚慧 +1 位作者 王瑞波 李国臣 《中文信息学报》 CSCD 北大核心 2011年第3期38-44,共7页
该文研究了汉语框架自动识别中的歧义消解问题,即对给定句子中的目标词,基于其上下文环境,从现有的框架库中,为该目标词自动标注一个合适的框架。该文将此任务看作分类问题,使用最大熵建模,选用词、词性、基本块、依存句法树上的若干特... 该文研究了汉语框架自动识别中的歧义消解问题,即对给定句子中的目标词,基于其上下文环境,从现有的框架库中,为该目标词自动标注一个合适的框架。该文将此任务看作分类问题,使用最大熵建模,选用词、词性、基本块、依存句法树上的若干特征,并使用开窗口技术和BOW策略,以目前汉语框架语义知识库中的88个词元的2 077条例句为训练、测试语料,进行了3-fold交叉验证实验,最好结果取得69.28%的精确率(Accuracy)。 展开更多
关键词 汉语框架语义知识库 框架语义 框架消歧 最大熵模型
下载PDF
基于汉语框架网的中文问题分类 被引量:8
7
作者 李茹 宋小香 王文晶 《计算机工程与应用》 CSCD 北大核心 2009年第31期111-114,137,共5页
问题分类是问答系统中重要的组成部分,问题分类结果的准确性直接影响到问答系统的质量。基于汉语框架网(Chinese FrameNet,CFN)提出了一种用于中文问题分类的新方法。该方法通过构建一系列汉语框架语义特征来表达每个问句的语义信息,进... 问题分类是问答系统中重要的组成部分,问题分类结果的准确性直接影响到问答系统的质量。基于汉语框架网(Chinese FrameNet,CFN)提出了一种用于中文问题分类的新方法。该方法通过构建一系列汉语框架语义特征来表达每个问句的语义信息,进而使用最大熵模型进行中文问题的自动分类,与传统的问题分类技术相比,汉语框架语义信息的加入使得中文问题分类的精度得到了显著提高。实验结果进一步验证了该方法的有效性,大类和小类的分类精度分别达到了91.38%和83.20%。 展开更多
关键词 汉语框架网 问题分类 最大熵模型
下载PDF
基于条件随机场的汉语框架语义角色自动标注 被引量:8
8
作者 宋毅君 王瑞波 +1 位作者 李济洪 李国臣 《中文信息学报》 CSCD 北大核心 2014年第3期36-47,共12页
在给定目标词及其所属框架的条件下,汉语框架语义角色标注可以分为语义角色识别和角色分类两个步骤。该文将此任务通过IOB2标记策略形式化为词序列标注问题,以词为基本标注单元,采用条件随机场模型进行自动标注实验。先对语料使用清华... 在给定目标词及其所属框架的条件下,汉语框架语义角色标注可以分为语义角色识别和角色分类两个步骤。该文将此任务通过IOB2标记策略形式化为词序列标注问题,以词为基本标注单元,采用条件随机场模型进行自动标注实验。先对语料使用清华大学的基本块自动分析器进行分析,提取出15个块层面的新特征,并将这些特征标记形式化到词序列上。以文献[20]已有的12个词层面特征以及15个块层面特征共同构成候选特征集,采用正交表方法来选择模型的最优特征模板。在与文献[20]相同的语料上,相同的3组2折交叉验证实验下,语义角色标注的总性能的F1-值比文献[20]的F1-值提高了近1%,且在显著水平0.05的t-检验下显著。实验结果表明:(1)基于词序列模型,新加入的15个块层面特征可以显著提高标注模型的性能,但这类特征主要对角色分类有显著作用,对角色识别作用不显著;(2)基于词序列的标注模型显著好于以基本块为标注单元以及以句法成分为标注单元的标注模型。 展开更多
关键词 汉语框架语义知识库 语义角色标注 条件随机场模型 基本块
下载PDF
基于词元语义特征的汉语框架排歧研究 被引量:7
9
作者 李国臣 张立凡 +2 位作者 李茹 刘海静 石佼 《中文信息学报》 CSCD 北大核心 2013年第4期44-51,共8页
框架排歧指的是在一个给定的句子中,判断句中目标词激起的语义场景与该目标词可能激起的哪个框架一致,则将该框架分配给当前的目标词。框架排歧最重要的一个步骤就是特征选择,目前常用的方法是人工特征选择方法,但是这种方法不能有效地... 框架排歧指的是在一个给定的句子中,判断句中目标词激起的语义场景与该目标词可能激起的哪个框架一致,则将该框架分配给当前的目标词。框架排歧最重要的一个步骤就是特征选择,目前常用的方法是人工特征选择方法,但是这种方法不能有效地利用每个目标词的语义特征,而且大量实验表明,不同的目标词取得最好的结果时所用的特征模板是不同的。因此,该文为每个目标词设置一个特征模板,并提出了特征模板的自动选择算法,首先从语料中抽取特征构成特征集,然后利用打分机制,把特征集中得分最高的特征逐个加入到特征模板中,直到相邻两次的得分不再增加。该文借助汉语框架网语义资源,利用最大熵模型建模,使用自动特征选择算法选出特征模板,并进行5-fold交叉验证,平均精确率可达到84.46%。 展开更多
关键词 框架排歧 汉语框架网语义资源 自动特征选择 词元语义特征
下载PDF
基于词分布式表征的汉语框架排歧模型 被引量:7
10
作者 张力文 王瑞波 +1 位作者 李茹 张晟 《中文信息学报》 CSCD 北大核心 2017年第6期50-57,共8页
框架排歧是根据句子中目标词的上下文语境,从框架库中为该目标词自动选择一个合适的框架。该任务在一定程度上解决了动词中一词多义的现象。该文基于词语及句子的分布式表征,提出了基于距离和基于词语相似度矩阵的框架排歧模型。与传统... 框架排歧是根据句子中目标词的上下文语境,从框架库中为该目标词自动选择一个合适的框架。该任务在一定程度上解决了动词中一词多义的现象。该文基于词语及句子的分布式表征,提出了基于距离和基于词语相似度矩阵的框架排歧模型。与传统方法相比,该模型有效避免了人工选择特征,克服了特征空间维度过高、特征之间没有关联性等缺点,使框架排歧的准确率达到65.71%。并与当前最好的模型,进行显著性和一致性检验,进一步验证了词分布式表征对框架排歧任务的有效性。 展开更多
关键词 汉语框架 框架排歧 分布式表征
下载PDF
汉语核心框架语义分析 被引量:6
11
作者 石佼 李茹 王智强 《中文信息学报》 CSCD 北大核心 2014年第6期48-55,共8页
汉语核心框架语义分析是从框架语义角度,通过抽取句子的核心框架,获取汉语句子的核心语义骨架。该文将核心框架语义分析分为核心目标词识别、框架选择和框架元素标注三个子任务,基于各个子任务的不同特点,采取最大熵模型分别对核心目标... 汉语核心框架语义分析是从框架语义角度,通过抽取句子的核心框架,获取汉语句子的核心语义骨架。该文将核心框架语义分析分为核心目标词识别、框架选择和框架元素标注三个子任务,基于各个子任务的不同特点,采取最大熵模型分别对核心目标词识别与框架选择任务进行建模;采用序列标注模型条件随机场对框架元素标注任务进行建模。实验在汉语框架网资源的10 831条测试语料中显示,核心目标词识别和框架元素标注F值分别达到99.51%和59.01%,框架选择准确率达到84.73%。 展开更多
关键词 汉语框架网 核心框架语义 语义分析
下载PDF
中文阅读理解语料库构建技术研究 被引量:3
12
作者 郝晓燕 李济洪 +1 位作者 由丽萍 刘开瑛 《中文信息学报》 CSCD 北大核心 2007年第6期29-35,共7页
阅读理解问答系统指的是能够自动分析一个自然语言文章,并且根据文中的信息为每个问题生成一个答案的系统,具有很高的研究价值。然而,缺乏中文阅读理解语料库已经成为制约汉语阅读理解问答系统发展的主要障碍。本文对于中文阅读理解语... 阅读理解问答系统指的是能够自动分析一个自然语言文章,并且根据文中的信息为每个问题生成一个答案的系统,具有很高的研究价值。然而,缺乏中文阅读理解语料库已经成为制约汉语阅读理解问答系统发展的主要障碍。本文对于中文阅读理解语料库的构建过程进行了详细的介绍,包括语料选材、编写问句,标注答案句、语料加工和评测机制,尤其是基于汉语框架语义知识库对语料进行了框架元素、短语类型和句法功能三个层面标注的深加工技术。 展开更多
关键词 计算机应用 中文信息处理 阅读理解问答系统 中文阅读理解语料库 汉语框架语义知识库
下载PDF
汉语篇章中零形式的识别与消解 被引量:5
13
作者 武娟 李茹 王智强 《中文信息学报》 CSCD 北大核心 2016年第3期9-15,共7页
传统的语义角色标注只能为句中显式表达的句法论元分配语义角色,但是忽略了一些隐式的语义成分,即零形式。该文基于汉语框架语义研究了零形式的识别及消解。在识别阶段,首先使用规则方法进行零形式检测,然后运用筛选过滤的策略去除部分... 传统的语义角色标注只能为句中显式表达的句法论元分配语义角色,但是忽略了一些隐式的语义成分,即零形式。该文基于汉语框架语义研究了零形式的识别及消解。在识别阶段,首先使用规则方法进行零形式检测,然后运用筛选过滤的策略去除部分错误识别的零形式;在消解阶段,将篇章中显式表达的框架元素填充项作为零形式的候选先行语,提出结合框架元素语义类型与框架关系的消解方法。在构建的164篇中文语料上进行实验,与其他方法相比,该方法能获得更好的结果。 展开更多
关键词 汉语框架网 零形式识别 零形式消解
下载PDF
基于框架语义映射和类型感知的篇章事件抽取
14
作者 卢江 苏雪峰 +2 位作者 李茹 闫智超 陈加兴 《中文信息学报》 CSCD 北大核心 2024年第5期53-64,共12页
篇章事件抽取任务从给定的文本中识别其事件类型和事件论元。该任务包括事件检测和论元识别两个子任务。目前篇章事件普遍存在数据稀疏和多值论元耦合的问题。基于此,该文提出了一种基于框架语义映射和类型感知的篇章事件抽取方法。该... 篇章事件抽取任务从给定的文本中识别其事件类型和事件论元。该任务包括事件检测和论元识别两个子任务。目前篇章事件普遍存在数据稀疏和多值论元耦合的问题。基于此,该文提出了一种基于框架语义映射和类型感知的篇章事件抽取方法。该文分析发现事件描述与框架语义网有着相似的结构,因此将汉语框架网(CFN)与中文篇章事件建立映射,并在文本输入层引入触发词释义信息和滑窗机制充分感知上下文信息,改善了事件检测的数据稀疏问题;使用基于类型感知标签的多事件分离策略缓解了论元耦合问题。为了提升模型的鲁棒性,进一步引入对抗训练。在DuEE-fin和CCKS2021数据集上的实验结果显示,该文模型较当前主流模型测试结果有较大提升,验证了方法的有效性。 展开更多
关键词 汉语框架网 框架语义映射 类型感知 事件抽取
下载PDF
基于中文框架网络的浅层语义分析模型 被引量:3
15
作者 张惠春 由丽萍 《电脑开发与应用》 2009年第8期4-6,共3页
在中文框架网络的基础上建立中文浅层语义分析模型。模型利用统计的方法,经过句子分解、识别框架元素界限、确定框架元素类型三个阶段。通过对模型进行实例数据分析,表明基于中文框架网络的浅层语义分析模型是可行的。
关键词 中文框架网络 浅层语义分析 语义角色标注
下载PDF
基于FrameNet的汉语语义框架网络自动构造 被引量:1
16
作者 龙波 郭文 《现代计算机》 2010年第2期4-7,共4页
语义知识库是自然语言处理的基础性工程,但现阶段语义知识库的构建,大部分工作基于人工。基于英语框架网络FrameNet,采用FrameNet的现有框架库作为汉语框架网络的框架库,通过FrameNet中现有标注英文例句训练一语义角色标注器,利用英汉... 语义知识库是自然语言处理的基础性工程,但现阶段语义知识库的构建,大部分工作基于人工。基于英语框架网络FrameNet,采用FrameNet的现有框架库作为汉语框架网络的框架库,通过FrameNet中现有标注英文例句训练一语义角色标注器,利用英汉双语平行语料,对英文语料进行语义角色标注并将其映射到中文句子上,从标注好的汉语句子中提取汉语词元和例句填充汉语框架,构建汉语词汇库和例句库,从而实现汉语语义框架网络的自动构造。 展开更多
关键词 汉语语义框架 框架语义学 语义角色标注 最大熵
下载PDF
汉语框架网中未登录词元的框架选择 被引量:2
17
作者 陈学丽 李茹 +1 位作者 王赛 王智强 《中文信息学报》 CSCD 北大核心 2014年第3期48-54,61,共8页
汉语框架网的低覆盖率导致汉语句子中存在许多未登录的词元,严重制约着汉语的框架语义分析任务。针对未登录词元的框架识别问题,该文借助同义词词林的词义信息,提出基于平均语义相似度计算及最大熵模型两种方法,采用静态特征与动态特征... 汉语框架网的低覆盖率导致汉语句子中存在许多未登录的词元,严重制约着汉语的框架语义分析任务。针对未登录词元的框架识别问题,该文借助同义词词林的词义信息,提出基于平均语义相似度计算及最大熵模型两种方法,采用静态特征与动态特征相结合的特征选择方法。实验证明,这两种方法都能有效地实现未登录词元的框架选择,基于相似度计算的方法(TOP-4)获得78.61%的准确率;基于最大熵的方法结果可达87.29%,同时在新闻语料上达到了75%的准确率。 展开更多
关键词 汉语框架网 未登录词元 词义信息
下载PDF
一种基于CFN的特征选择及权重算法 被引量:2
18
作者 柴忠 常晓明 《微计算机信息》 2009年第3期221-222,283,共3页
利用TF和DF的组合进行特征选择,及利用TF-IDF算法计算权重,是文本分类中常用的算法。但当训练集较小时,此特征选择算法会将一些特征区分能力强的低频词过滤掉,并直接影响特征词的权重。本文提出一种基于汉语框架网络(以下简称CFN)的特... 利用TF和DF的组合进行特征选择,及利用TF-IDF算法计算权重,是文本分类中常用的算法。但当训练集较小时,此特征选择算法会将一些特征区分能力强的低频词过滤掉,并直接影响特征词的权重。本文提出一种基于汉语框架网络(以下简称CFN)的特征选择和计算权重的算法。实验表明:算法可使分类的准确率达到67.3%,较传统算法有很大提高。也说明了该算法能够满足小训练集环境下对文本分类准确率的要求。 展开更多
关键词 文本分类 特征选择 小训练集 权重 汉语框架网络
下载PDF
基于CFN的相似度计算在实例机器翻译中的应用 被引量:1
19
作者 杨立波 《电脑开发与应用》 2011年第6期58-60,共3页
在信息检索,文本挖掘以及基于实例的机器翻译中,相似度计算都是一个关键问题。在实例机器翻译中,相似度计算一般是基于字符、词的匹配以及向量空间模型,但基于句子语义结构的相似度研究还不多见。借助了汉语框架语义网(Chinese FrameNet... 在信息检索,文本挖掘以及基于实例的机器翻译中,相似度计算都是一个关键问题。在实例机器翻译中,相似度计算一般是基于字符、词的匹配以及向量空间模型,但基于句子语义结构的相似度研究还不多见。借助了汉语框架语义网(Chinese FrameNet,简称CFN)的场景语义描述优势,提出了一种新的面向EBMT进行实例相似度计算的方法。该方法主要基于CFN从句子整体结构相似和各语义块内部相似两个角度来度量句子相似度,将这两部分的相似度结果进行凸组合作为待翻译句子与候选实例之间的相似度值。实验结果表明,与传统方法相比,所提出的这种方法是有效的。 展开更多
关键词 相似度 实例机器翻译 汉语框架网 框架语义
下载PDF
汉语框架网络数据库例句辅助标注系统的设计与实现 被引量:1
20
作者 郭丹丹 刘伟 《科技情报开发与经济》 2010年第32期98-102,共5页
框架网络工程是一个基于语料库的、经验性的、以框架为基础的计算机词典编撰项目。框架网络的基本单元是被称作框架的概念结构,它由三大部分组成,即框架库、词元库和例句库,而例句库又是其中的重要部分。针对构建例句库和词元库给出了... 框架网络工程是一个基于语料库的、经验性的、以框架为基础的计算机词典编撰项目。框架网络的基本单元是被称作框架的概念结构,它由三大部分组成,即框架库、词元库和例句库,而例句库又是其中的重要部分。针对构建例句库和词元库给出了一种基于汉语框架网络例句库的辅助标注系统的设计与实现的方法,介绍了配价模式的提取以及框架元素的句法实现模式的提取,并对框架元素、短语类型和句法功能分别进行了展示。 展开更多
关键词 汉语框架网络 数据库 例句辅助标注系统 系统设计
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部