期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
四种基本统计句法分析模型在汉语句法分析中的性能比较 被引量:10
1
作者 孟遥 李生 +1 位作者 赵铁军 曹海龙 《中文信息学报》 CSCD 北大核心 2003年第3期1-8,共8页
统计模型的选择是统计句法分析的关键。目前句法分析常用的有四种经典统计模型—PCFG模型 ,基于历史模型、分层渐近式模型和头驱动模型。本文通过实验 ,在已有的 10 0 0 0句汉语树库基础上 ,测试了这四种经典模型在现有数据规模下各自... 统计模型的选择是统计句法分析的关键。目前句法分析常用的有四种经典统计模型—PCFG模型 ,基于历史模型、分层渐近式模型和头驱动模型。本文通过实验 ,在已有的 10 0 0 0句汉语树库基础上 ,测试了这四种经典模型在现有数据规模下各自的性能 ,并论述了这四种经典模型的各自特点。本文旨在通过对四种基本模型的比较研究 ,为具体应用中句法分析模型的选择提供参考和依据。 展开更多
关键词 计算机应用 中文信息处理 统计句法分析 基本模型 汉语分析
下载PDF
一种基于概率上下文无关文法的汉语句法分析 被引量:11
2
作者 林颖 史晓东 郭锋 《中文信息学报》 CSCD 北大核心 2006年第2期1-7,32,共8页
本文研究了PCFG独立性假设的局限性,并针对这一局限性提出了句法结构共现的概念以引入上下文信息,给出了计算方法;为了打破中文树库规模过小的局限性,对于句法规则参数的获取,本文利用In-side-Outside算法进行迭代,最后提出了一个基于... 本文研究了PCFG独立性假设的局限性,并针对这一局限性提出了句法结构共现的概念以引入上下文信息,给出了计算方法;为了打破中文树库规模过小的局限性,对于句法规则参数的获取,本文利用In-side-Outside算法进行迭代,最后提出了一个基于统计模型的自顶向下的汉语句法分析器。在封闭测试下,其标记精确率和标记召回率分别为88.1%和86.8%。实验结果表明,这种方法确实能够提高标记的精确率和召回率,值得深入研究。 展开更多
关键词 人工智能 自然语言处理 统计句法分析 概率上下文无关文法 汉语自动分析
下载PDF
大规模真实文本处理的理论与方法——记第五届国际极大规模语料库研讨会(WVLC-5) 被引量:2
3
作者 黄昌宁 《当代语言学》 CSSCI 1998年第1期45-48,共4页
大规模真实文本处理的理论与方法———记第五届国际极大规模语料库研讨会(WVLC-5)黄昌宁清华大学1.背景随着因特网和光盘等大容量存储技术的迅速普及,机储文本语料库的规模已冲破1万亿(1012)字节。这种情况一方面带... 大规模真实文本处理的理论与方法———记第五届国际极大规模语料库研讨会(WVLC-5)黄昌宁清华大学1.背景随着因特网和光盘等大容量存储技术的迅速普及,机储文本语料库的规模已冲破1万亿(1012)字节。这种情况一方面带来了巨大的商业利益,促进了信息咨询... 展开更多
关键词 语料库 理论与方法 真实文本 研讨会 语音识别 介词短语 语言学知识 统计句法分析 处理技术 句法分析
原文传递
统计句法分析建模中基于信息论的特征类型分析 被引量:4
4
作者 穗志方 赵军 俞士汶 《计算机学报》 EI CSCD 北大核心 2001年第2期144-151,共8页
统计句法分析利用概率评价模型评价每棵候选句法树存在的可能性 ,选择概率值最高的候选句法树作为最终的句法分析结果 .因此 ,统计句法分析的核心是一个概率评价模型 ,而各种概率评价模型的本质区别主要在于它们分别是根据上下文中的哪... 统计句法分析利用概率评价模型评价每棵候选句法树存在的可能性 ,选择概率值最高的候选句法树作为最终的句法分析结果 .因此 ,统计句法分析的核心是一个概率评价模型 ,而各种概率评价模型的本质区别主要在于它们分别是根据上下文中的哪些特征来赋予句法树概率的 .在统计句法分析研究领域 ,虽然已经提出了大量的概率评价模型 ,然而 ,不同的模型用到了不同类型的特征 .如何评价这些特征类型对于句法分析的作用呢 ?针对以上的问题 ,本研究为统计句法分析提出了一种特征类型的分析模型 ,该模型可以从信息论的角度量化地分析不同类型的上下文特征对于句法结构的预测作用 .其基本思想是利用信息论中熵与条件熵的度量来显示一个特征类型是否抓住了预测句法结构的主要信息 .如果加入某个特征类型之后当前句法结构的不确定性 (熵 )明显下降 ,则认为该特征类型抓住了上下文中影响句法结构的某些主要信息 .特征类型分析的信息论模型利用预测信息量、预测信息增益、预测信息关联度以及预测信息总量四种度量从不同的侧面量化地分析各种特征类型及特征类型组合对于当前目标的预测作用 .实验以 Penn Tree Bank为训练集 ,将上下文中不同的特征类型对于句法分析规则的预测作用进行了系统的量化分析 。 展开更多
关键词 统计句法分析 信息论 概率建模 特征类型分析 语音识别
下载PDF
融合丰富语言知识的汉语统计句法分析 被引量:2
5
作者 熊德意 刘群 林守勋 《中文信息学报》 CSCD 北大核心 2005年第3期61-66,共6页
知识获取一直以来是自然语言处理中的瓶颈,基于树库的统计句法分析也不例外。树库中潜在隐含的语言知识是非常丰富的,但它们并不是可以直接得到,往往需要特定的策略才能将它们融合到模型中。我们的汉语统计句法分析模型从3个方面融合潜... 知识获取一直以来是自然语言处理中的瓶颈,基于树库的统计句法分析也不例外。树库中潜在隐含的语言知识是非常丰富的,但它们并不是可以直接得到,往往需要特定的策略才能将它们融合到模型中。我们的汉语统计句法分析模型从3个方面融合潜在的丰富语言知识:1)重新标注树库中的非递归名词短语和非递归动词短语;2 )设计新的中心词映射表;3)引进上下文配置框架以更具体地描述二元依存结构。由于融合了以上三种潜在语言知识,模型的F1值提高了2 37% ,完全匹配正确率提高了5 36 %。 展开更多
关键词 人工智能 自然语言处理 统计句法分析 非递归短语 中心词映射表 上下文配置框架
下载PDF
基于最大熵模型的汉语依存分析 被引量:2
6
作者 刘贵全 曾宇斌 《计算机工程》 EI CAS CSCD 北大核心 2006年第11期216-218,共3页
采用最大熵模型实现中文依存语法的分析。用自底而上的方式构建语句的依存关系树,构建过程每一步在向左连接、向右连接以及不连接3种动作选取其一。用最大熵原理判断每个动作的概率,得到依存树中各边的概率,然后找出具有最大概率的依存... 采用最大熵模型实现中文依存语法的分析。用自底而上的方式构建语句的依存关系树,构建过程每一步在向左连接、向右连接以及不连接3种动作选取其一。用最大熵原理判断每个动作的概率,得到依存树中各边的概率,然后找出具有最大概率的依存关系树。实验结果表明,该模型具有较好的分析精度。目前,该模型已被应用于基于自然语言的信息检索项目中。 展开更多
关键词 统计句法分析 依存文法 最大熵原理 信息检索
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部