期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
生成语法框架下领主属宾句的派生过程新探 被引量:12
1
作者 杨大然 陈晓扣 《现代外语》 CSSCI 北大核心 2016年第3期314-325,437,共12页
学界对领主属宾句的研究先后形成了一系列理论假设,但均未能很好解决领有名词如何进入句法推导和隶属名词如何核查格位两个关键性问题。本文在前人研究的基础上,首先将领主属宾句定性为汉语的广义存现句,然后依据Hazout(2004)和Chomsky(... 学界对领主属宾句的研究先后形成了一系列理论假设,但均未能很好解决领有名词如何进入句法推导和隶属名词如何核查格位两个关键性问题。本文在前人研究的基础上,首先将领主属宾句定性为汉语的广义存现句,然后依据Hazout(2004)和Chomsky(2013)的研究,在生成语法框架下对该句式的派生过程给出新的解释。本文提出,领有名词与隶属名词发生初始合并构成小句结构,而后再与非宾格谓词发生合并,领有名词为满足句法加标的要求移位到句首。本文的分析既可以克服先前研究的各种弊端,也可以较好解释领有名词的地位作用以及名词成分的赋格问题。 展开更多
关键词 领主属宾句 广义存现句 小句 句法加标
原文传递
基于条件随机场模型的汉语功能块自动标注 被引量:7
2
作者 李国臣 王瑞波 李济洪 《计算机研究与发展》 EI CSCD 北大核心 2010年第2期336-343,共8页
汉语组块分析是将汉语句子中的词首先组合成基本块,进一步组合形成句子的功能块,最终形成一个具有层次组合结构的汉语句法描述结构.将汉语功能块的自动标注问题看作序列标注任务,并使用词和基本块作为标注单元分别建立标注模型.针对不... 汉语组块分析是将汉语句子中的词首先组合成基本块,进一步组合形成句子的功能块,最终形成一个具有层次组合结构的汉语句法描述结构.将汉语功能块的自动标注问题看作序列标注任务,并使用词和基本块作为标注单元分别建立标注模型.针对不同的标注模型,分别构建基本块层面的特征集合,并使用条件随机场模型进行汉语功能块的自动标注.实验数据来自清华大学TCT语料库,并且按照8∶2的比例切分形成训练集和测试集.实验结果表明,与仅使用词层面信息的标注模型相比,基本块特征信息的适当加入可以显著提高功能块标注性能.当使用人工标注的基本块信息时,汉语功能块自动标注的准确率达到88.47%,召回率达到89.93%,F值达到89.19%.当使用自动标注的基本块信息时,汉语功能块的标注的准确率为84.27%,召回率为85.57%,F值为84.92%. 展开更多
关键词 汉语基本块 汉语功能块 条件随机场模型 句法分析 序列标注
下载PDF
融合语义与语法信息的中文评价对象提取 被引量:4
3
作者 周浩 王莉 《智能系统学报》 CSCD 北大核心 2019年第1期171-178,共8页
鉴于常规的序列化标注方法提取中文评价对象准确率低,存在忽略中文语义与语法信息的缺陷,提出了融合语义与语法信息的中文评价对象提取模型。该模型在原始字向量的基础上通过优化字符含义策略强化语义特征,弥补忽略的字符与词语的内部信... 鉴于常规的序列化标注方法提取中文评价对象准确率低,存在忽略中文语义与语法信息的缺陷,提出了融合语义与语法信息的中文评价对象提取模型。该模型在原始字向量的基础上通过优化字符含义策略强化语义特征,弥补忽略的字符与词语的内部信息;并通过词性序列标注,对句子的词性信息进行表征,深化输入的语法特征。网络训练使用双向长短期记忆网络并用条件随机场克服标注标签的偏差,提高了提取准确率。该模型在BDCI2017数据集上进行验证,与未融入语义和语法的提取模型相比,中文主题词与情感词提取准确率分别提高了2.1%与1.68%,联合提取的准确率为77.16%,具备良好的中文评价对象提取效果。 展开更多
关键词 中文评价对象 语义 语法 序列标注 双向长短期记忆网络 条件随机场 提取模型
下载PDF
中文句法异构蕴含语块标注和边界识别研究 被引量:4
4
作者 金天华 姜姗 +2 位作者 于东 赵美倩 刘璐 《中文信息学报》 CSCD 北大核心 2019年第2期17-25,共9页
文本蕴含是自然语言处理的难点,其形式、类型复杂,知识难以概括。早期多利用词汇蕴含和逻辑推理知识识别蕴含,但该方法反对特定类型的蕴含有效。近年来,利用大规模数据训练深度学习模型的方法在句级蕴含关系识别任务上取得优异性能,但... 文本蕴含是自然语言处理的难点,其形式、类型复杂,知识难以概括。早期多利用词汇蕴含和逻辑推理知识识别蕴含,但该方法反对特定类型的蕴含有效。近年来,利用大规模数据训练深度学习模型的方法在句级蕴含关系识别任务上取得优异性能,但模型不可解释,尤其是无法标定引起蕴含的具体语言片段。该文研究文本蕴含成因形式,归纳为词汇、句法异构、常识和社会经验三类,并以句法异构蕴含为研究对象。针对上述两个问题,提出句法异构蕴含语块的概念,定义其边界识别任务。该文制定句法异构蕴含语块标注规范,建立标注数据集。在此基础上,分别建立基于规则和基于深度学习的模型,探索句法异构蕴含语块的自动识别方法。实验结果表明,该文提出的深度学习模型能有效发现蕴含语块,为下一步的研究提供可靠的基线方法。 展开更多
关键词 文本蕴含 句法异构 语块标注
下载PDF
基于句式与句模对应规则的语义角色标注 被引量:5
5
作者 何保荣 邱立坤 孙盼盼 《中文信息学报》 CSCD 北大核心 2018年第4期59-65,共7页
大规模语义角色标注语料库的构建可以为计算机理解自然语言的语义提供有用的训练数据。该文主要研究服务于语义角色标注语料库构建的语义角色标注规则。在人工语义角色标注的基础上,分析句式和句模的对应关系,并总结出一套基于句式的语... 大规模语义角色标注语料库的构建可以为计算机理解自然语言的语义提供有用的训练数据。该文主要研究服务于语义角色标注语料库构建的语义角色标注规则。在人工语义角色标注的基础上,分析句式和句模的对应关系,并总结出一套基于句式的语义角色标注规则,在测试集上达到78.73%的正确率。基于上述规则,可以在构建语义角色标注语料库时完成自动标注的工作,标注人员在此基础上进行人工校对,可有效地减少工作量。 展开更多
关键词 句模 句式 语义角色标注 标注规则
下载PDF
基于知识增强的文本隐喻识别图编码方法
6
作者 黄河燕 刘啸 刘茜 《计算机研究与发展》 EI CSCD 北大核心 2023年第1期140-152,共13页
隐喻识别是自然语言处理中语义理解的重要任务之一,目标为识别某一概念在使用时是否借用了其他概念的属性和特点.由于单纯的神经网络方法受到数据集规模和标注稀疏性问题的制约,近年来,隐喻识别研究者开始探索如何利用其他任务中的知识... 隐喻识别是自然语言处理中语义理解的重要任务之一,目标为识别某一概念在使用时是否借用了其他概念的属性和特点.由于单纯的神经网络方法受到数据集规模和标注稀疏性问题的制约,近年来,隐喻识别研究者开始探索如何利用其他任务中的知识和粗粒度句法知识结合神经网络模型,获得更有效的特征向量进行文本序列编码和建模.然而,现有方法忽略了词义项知识和细粒度句法知识,造成了外部知识利用率低的问题,难以建模复杂语境.针对上述问题,提出一种基于知识增强的图编码方法(knowledge-enhanced graph encoding method,KEG)来进行文本中的隐喻识别.该方法分为3个部分:在文本编码层,利用词义项知识训练语义向量,与预训练模型产生的上下文向量结合,增强语义表示;在图网络层,利用细粒度句法知识构建信息图,进而计算细粒度上下文,结合图循环神经网络进行迭代式状态传递,获得表示词的节点向量和表示句子的全局向量,实现对复杂语境的高效建模;在解码层,按照序列标注架构,采用条件随机场对序列标签进行解码.实验结果表明,该方法的性能在4个国际公开数据集上均获得有效提升. 展开更多
关键词 隐喻识别 图循环神经网络 知识增强方法 词义项知识 细类别句法知识 序列标注
下载PDF
基于多特征融合的中文微博评价对象抽取方法 被引量:3
7
作者 李景玉 张仰森 蒋玉茹 《计算机应用研究》 CSCD 北大核心 2016年第2期378-383,共6页
中文微博的评价对象抽取作为中文微博情感分析的基础任务,受到研究者的广泛关注,有着重要的研究价值。结合微博文本的特点,对微博文本进行预处理,利用句法分析构建包括名词、名词短语、微博话题在内的评价对象候选集,再分别利用SVM模型... 中文微博的评价对象抽取作为中文微博情感分析的基础任务,受到研究者的广泛关注,有着重要的研究价值。结合微博文本的特点,对微博文本进行预处理,利用句法分析构建包括名词、名词短语、微博话题在内的评价对象候选集,再分别利用SVM模型、加权模型实现多特征融合的筛选候选评价对象方法,所用特征包括语义角色信息、最小距离和词频。算法经实验证明有效,在对候选评价对象进行筛选后,采用SVM模型的F值达到0.357 3,加权模型的F值达到0.405 9。 展开更多
关键词 评价对象 评价对象候选集 句法分析 语义角色标注 支持向量机
下载PDF
Improved head-driven statistical models for natural language parsing 被引量:1
8
作者 袁里驰 《Journal of Central South University》 SCIE EI CAS 2013年第10期2747-2752,共6页
Head-driven statistical models for natural language parsing are the most representative lexicalized syntactic parsing models, but they only utilize semantic dependency between words, and do not incorporate other seman... Head-driven statistical models for natural language parsing are the most representative lexicalized syntactic parsing models, but they only utilize semantic dependency between words, and do not incorporate other semantic information such as semantic collocation and semantic category. Some improvements on this distinctive parser are presented. Firstly, "valency" is an essential semantic feature of words. Once the valency of word is determined, the collocation of the word is clear, and the sentence structure can be directly derived. Thus, a syntactic parsing model combining valence structure with semantic dependency is purposed on the base of head-driven statistical syntactic parsing models. Secondly, semantic role labeling(SRL) is very necessary for deep natural language processing. An integrated parsing approach is proposed to integrate semantic parsing into the syntactic parsing process. Experiments are conducted for the refined statistical parser. The results show that 87.12% precision and 85.04% recall are obtained, and F measure is improved by 5.68% compared with the head-driven parsing model introduced by Collins. 展开更多
关键词 VALENCE structure SEMANTIC dependency head-driven statistical syntactic PARSING SEMANTIC role labeling
下载PDF
结合gazetteers和句法依存树的中文命名实体识别 被引量:1
9
作者 方红 苏铭 +1 位作者 冯一铂 张澜 《计算机工程与应用》 CSCD 北大核心 2022年第18期227-232,共6页
中文命名实体识别在机器翻译、智能问答等下游任务中起着重要作用。提出一种新的基于gazetteers和句法依存树的中文命名实体识别方法,旨在解决由于字符向量缺少词信息和词之间的句法依赖结构信息而导致的错误传递问题。该方法将句子中的... 中文命名实体识别在机器翻译、智能问答等下游任务中起着重要作用。提出一种新的基于gazetteers和句法依存树的中文命名实体识别方法,旨在解决由于字符向量缺少词信息和词之间的句法依赖结构信息而导致的错误传递问题。该方法将句子中的gazetteers信息和句法依存树信息形成图,再通过自适应门控图神经网络(adapted gated graph neural networks,AGGNN)将其融入到字符向量中,从而使得每个字向量很好地获取词汇间的语义关系,提升识别准确率。通过在Ecommerce、Resume、QI等数据集的验证,新的方法可以使得中文实体识别的准确率得到较大提升。 展开更多
关键词 GAZETTEERS 句法依存树 序列标注 自适应门控图神经网络(AGGNN) 双向长短记忆网络(BiLSTM) 条件随机场(CRF)
下载PDF
基于语义与情感的句子相似度计算方法 被引量:1
10
作者 杨延娇 赵国涛 王丕栋 《计算机工程与应用》 CSCD 北大核心 2021年第16期151-158,共8页
针对汉语语句表意灵活复杂多变的特点,提出一种基于语义与情感的句子相似度计算方法,从表意层面计算句子相似度。该方法使用哈工大LTP平台对句子进行预处理,提取词语、词性、句法依存标记与语义角色标记,将语义角色标注结果作为句中语... 针对汉语语句表意灵活复杂多变的特点,提出一种基于语义与情感的句子相似度计算方法,从表意层面计算句子相似度。该方法使用哈工大LTP平台对句子进行预处理,提取词语、词性、句法依存标记与语义角色标记,将语义角色标注结果作为句中语义独立成分赋予相似度权重系数,综合句法依存关系与词法关系计算两句相同标签语义独立成分相似度得到部分相似度,加权计算部分相似度得到句子整体相似度。另外,考虑到情感与句式因子,在整体相似度的基础上对满足条件的两句计算情感减益与句式减益。实验结果表明,该方法能有效提取出句子语义独立成分,从语义层面上计算句子相似度,解决了信息遗漏与句子组成成分不一致的问题,提高了句子相似度计算的准确率与鲁棒性。 展开更多
关键词 句子相似度 句法结构 情感信息 哈工大LTP平台 句法依存分析 语义角色标注
下载PDF
融合语义类信息的句法分析统计模型 被引量:1
11
作者 袁里驰 《数据采集与处理》 CSCD 北大核心 2017年第1期175-181,共7页
稀疏数据严重影响句子结构分析模型的结果,而句法结构是语义内容和句法分析形式的结合。本文在语义结构信息标注的基础上提出了一种基于语义搭配关系的词聚类模型和算法,建立基于语义类的头驱动句子结构分析统计模型。该语言模型不但比... 稀疏数据严重影响句子结构分析模型的结果,而句法结构是语义内容和句法分析形式的结合。本文在语义结构信息标注的基础上提出了一种基于语义搭配关系的词聚类模型和算法,建立基于语义类的头驱动句子结构分析统计模型。该语言模型不但比较成功地解决了数据稀疏问题,而且句子结构分析系统性能也有了明显的提高。句子结构分析实验结果表明,基于语义类的头驱动的句子结构分析统计模型,其召回率和精确率的值相应为88.26%和88.73%,综合指标改进了8.39%。 展开更多
关键词 句子结构分析统计模型 语义角色标注 词的自动聚类 头驱动
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部