期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
基于依存分析和错误驱动的中文时间表达式识别 被引量:21
1
作者 贺瑞芳 秦兵 +2 位作者 刘挺 潘越群 李生 《中文信息学报》 CSCD 北大核心 2007年第5期36-40,共5页
时间表达式识别是进行时间表达式归一化的基础,其识别结果的好坏直接影响归一化的效果。本文提出一种基于依存分析和错误驱动识别中文时间表达式的新方法。首先以时间触发词为切入点,据依存关系递归地识别时间表达式,大大地提高了识别效... 时间表达式识别是进行时间表达式归一化的基础,其识别结果的好坏直接影响归一化的效果。本文提出一种基于依存分析和错误驱动识别中文时间表达式的新方法。首先以时间触发词为切入点,据依存关系递归地识别时间表达式,大大地提高了识别效果;然后,采用错误驱动学习来进一步增强识别效果,根据错误识别结果和人工标注的差异自动地获取和改进规则,使系统的性能又提高了近3.5%。最终在封闭测试集和开放测试集上,F1值达到了76.38%和76.57%。 展开更多
关键词 计算机应用 中文信息处理 时间表达式识别 触发词 依存分析 错误驱动学习
下载PDF
基于SVM的组块识别及其错误驱动学习方法 被引量:6
2
作者 黄德根 王莹莹 《中文信息学报》 CSCD 北大核心 2006年第6期17-24,共8页
给出了一种错误驱动学习机制与SVM相结合的汉语组块识别方法。该方法在SVM组块识别的基础上,对SVM识别结果中的错误词语序列的词性、组块标注信息等进行分析,获得候选校正规则集;之后按照阈值条件对候选集进行筛选,得到最终的校正规则集... 给出了一种错误驱动学习机制与SVM相结合的汉语组块识别方法。该方法在SVM组块识别的基础上,对SVM识别结果中的错误词语序列的词性、组块标注信息等进行分析,获得候选校正规则集;之后按照阈值条件对候选集进行筛选,得到最终的校正规则集;最后应用该规则集对SVM的组块识别结果进行校正。实验结果表明,与单独采用SVM模型的组块识别相比,加入错误驱动学习方法后,组块识别的精确率、召回率和F值均得到了提高。 展开更多
关键词 计算机应用 中文信息处理 组块分析 错误驱动学习 支持向量机(SVM) 规则集
下载PDF
基于错误驱动学习策略的藏语句法功能组块边界识别 被引量:7
3
作者 王天航 史树敏 +2 位作者 龙从军 黄河燕 李琳 《中文信息学报》 CSCD 北大核心 2014年第5期170-175,191,共7页
藏语句法功能组块分析旨在识别出藏语句子的句法成分,为后续句子级深入分析提供支持。根据藏语的语言特点,该文在藏语句法功能组块描述体系基础上,提出基于错误驱动学习策略的藏语功能组块边界识别方法。具体思路为,首先基于条件随机场(... 藏语句法功能组块分析旨在识别出藏语句子的句法成分,为后续句子级深入分析提供支持。根据藏语的语言特点,该文在藏语句法功能组块描述体系基础上,提出基于错误驱动学习策略的藏语功能组块边界识别方法。具体思路为,首先基于条件随机场(Conditional Random Fields,CRFs)识别组块,然后分别基于转换规则的错误驱动学习(Transformation-based Error-driven Learning,TBL)及基于新特征模板的CRFs错误驱动学习进行二次识别,并对初次结果进行校正,F值分别提高了1.65%、8.36%。最后通过实验分析,进一步将两种错误驱动学习机制融合,在18 073词级的藏语语料上开展实验,识别性能进一步提高,准确率、召回率与F值分别达到94.1%、94.76%与94.43%,充分验证了本文提出方法的有效性。 展开更多
关键词 错误驱动学习 藏语句法功能组块 组块边界识别 CRFS TBL
下载PDF
基于启发式错误驱动学习的中文时间表达式识别 被引量:3
4
作者 贺瑞芳 秦兵 +2 位作者 潘越群 刘挺 李生 《高技术通讯》 EI CAS CSCD 北大核心 2008年第12期1258-1262,共5页
提出了一种基于启发式错误驱动学习的中文时间表达式识别的新方法。该方法先采用依存分析方法以时间触发词为切入点递归地识别时间表达式,有效地解决了长距离依赖的问题,大大提高了识别效果;在此基础上,对比错误识别结果和人工标注... 提出了一种基于启发式错误驱动学习的中文时间表达式识别的新方法。该方法先采用依存分析方法以时间触发词为切入点递归地识别时间表达式,有效地解决了长距离依赖的问题,大大提高了识别效果;在此基础上,对比错误识别结果和人工标注,采用启发式A*算法搜索策略进行错误驱动学习,降低了规则学习的复杂度,并具有区分每条规则的有效性和规则间相容性的优点,使系统性能提高近6%。最终在封闭测试集和开放测试集上,F值分别达到了77.96%和77.92%。 展开更多
关键词 时间表达式识别 时间触发词 依存分析 错误驱动学习 A*算法
下载PDF
基于转换的时间-事件关系映射 被引量:19
5
作者 王昀 苑春法 《中文信息学报》 CSCD 北大核心 2004年第4期23-30,共8页
近些年来 ,中文时间信息抽取和处理已经变得越来越重要。然而 ,很少有研究者关注中文文本中事件信息所对应的时间信息的识别和分析。本文的目的就是确定文本中时间信息和事件信息之间的映射关系。区别于传统的基于规则的方法 ,本文采用... 近些年来 ,中文时间信息抽取和处理已经变得越来越重要。然而 ,很少有研究者关注中文文本中事件信息所对应的时间信息的识别和分析。本文的目的就是确定文本中时间信息和事件信息之间的映射关系。区别于传统的基于规则的方法 ,本文采用了一种机器学习的方法—基于转换的错误驱动学习—来确定事件相应的时间表达 ,这种学习算法可以自动的获取和改进规则。使用训练得到的转换规则集后 ,系统的时间 -事件映射错误率减少了 9 74 % 。 展开更多
关键词 计算机应用 中文信息处理 时间信息处理 基于转换的错误驱动学习 信息抽取
下载PDF
中文词法分析与句法分析融合策略研究 被引量:13
6
作者 米海涛 熊德意 刘群 《中文信息学报》 CSCD 北大核心 2008年第2期10-17,共8页
利用外部资源是提升句法分析性能的一种有效方法。本文利用中文词法分析器这一外部资源,提出了一种通用转换方法将中文词法分析器与句法分析器有机地融合在一起。通过基于转换的错误驱动学习和条件随机场解决不同切词、词性标注标准间... 利用外部资源是提升句法分析性能的一种有效方法。本文利用中文词法分析器这一外部资源,提出了一种通用转换方法将中文词法分析器与句法分析器有机地融合在一起。通过基于转换的错误驱动学习和条件随机场解决不同切词、词性标注标准间的转换问题。在句法分析方面,本文提出了多子模型句法分析器,将中心词驱动模型和结构上下文模型有效结合在一起。融合后的中文句法分析性能在宾州中文树库1.0版①测试集上F1值达到了82.5%的最好水平。 展开更多
关键词 计算机应用 中文信息处理 中文句法分析 中文词法分析 融合策略 基于转换的错误驱动学习 条件随机场
下载PDF
汉语文语转换系统中停顿指数的自动标注 被引量:6
7
作者 赵永贞 刘挺 +2 位作者 王志伟 陈惠鹏 邵艳秋 《中文信息学报》 CSCD 北大核心 2004年第5期48-55,共8页
本文采用了一个基于C TOBI的停顿指数标注的语料库 ,利用有指导的学习方法对自动停顿指数标注方面做了一些有益的探索。本文共实现了三种方法 :基本的马尔科夫模型 ,引入了词长信息的马尔科夫模型 ,引入词长信息的马尔科夫模型结合基于... 本文采用了一个基于C TOBI的停顿指数标注的语料库 ,利用有指导的学习方法对自动停顿指数标注方面做了一些有益的探索。本文共实现了三种方法 :基本的马尔科夫模型 ,引入了词长信息的马尔科夫模型 ,引入词长信息的马尔科夫模型结合基于转换的错误驱动的学习方法。然后通过对 30 0 0句的真实文本进行开放测试 ,以基本的马尔科夫模型的结果作为基准 ,实验结果不断改进 ,最终达到了 78 6 %的准确率 ,错误代价降低了 14 5 % 展开更多
关键词 计算机应用 中文信息处理 文语转换 停顿指数 马尔科夫模型 基于转换的错误驱动的学习
下载PDF
基于TBL算法的汉语韵律词预测 被引量:6
8
作者 陈龙 杨鸿武 蔡莲红 《西北师范大学学报(自然科学版)》 CAS 2008年第1期47-51,共5页
提出了一种新的汉语韵律词预测方法.利用标注过的语料,分析了语法词与韵律词之间的关系,发现24%的韵律词由不同语法词组合而成,语法词的词长是确定韵律词边界的主要特征.基于以上分析,实现了一种基于错误驱动的规则学习算法(TBL)的韵律... 提出了一种新的汉语韵律词预测方法.利用标注过的语料,分析了语法词与韵律词之间的关系,发现24%的韵律词由不同语法词组合而成,语法词的词长是确定韵律词边界的主要特征.基于以上分析,实现了一种基于错误驱动的规则学习算法(TBL)的韵律词预测方法.实验结果表明,所提出的方法在测试集上能够达到97.5%的预测精度. 展开更多
关键词 韵律词 语法词 TBL算法 文语转换
下载PDF
SVM和基于转换的错误驱动学习相结合的汉语组块识别 被引量:4
9
作者 邹宏梅 王挺 《计算机工程与科学》 CSCD 2007年第4期91-94,123,共5页
本文研究了一种支持向量机(SVM)和基于转换的错误驱动学习相结合的汉语组块识别方法。SVM在选取特征方面有突出的优点,并且在高维特征空间也具有较高的泛化性能,通过核函数的原则,SVM能够在独立于训练数据维数的小计算范围内进行训练。... 本文研究了一种支持向量机(SVM)和基于转换的错误驱动学习相结合的汉语组块识别方法。SVM在选取特征方面有突出的优点,并且在高维特征空间也具有较高的泛化性能,通过核函数的原则,SVM能够在独立于训练数据维数的小计算范围内进行训练。利用基于转换的错误驱动学习方法对SVM的标注结果进行校正,转换规则较好地处理了语言现象中的特殊情况,进一步提高了SVM的识别结果。实验结果表明,该方法具有较好的效果。 展开更多
关键词 支持向量机 基于转换的错误驱动学习 汉语组块识别
下载PDF
基于句法特征的汉语韵律边界预测 被引量:6
10
作者 杨鸿武 朱玲 《西北师范大学学报(自然科学版)》 CAS 北大核心 2013年第1期41-45,共5页
提出了一种利用TBL算法和句法特征进行韵律边界预测的方法.选择语法词的词性、词长和其在语法树中所处的层级这三个句法特征,利用预定义的规则模板,采用基于转换的错误驱动学习算法(Transformation-based error driven learning algorit... 提出了一种利用TBL算法和句法特征进行韵律边界预测的方法.选择语法词的词性、词长和其在语法树中所处的层级这三个句法特征,利用预定义的规则模板,采用基于转换的错误驱动学习算法(Transformation-based error driven learning algorithm,TBL算法),实现了对输入文本的韵律词和韵律短语的预测.结果表明,韵律词的预测精度达到了98.4%,韵律短语的预测精度达到了82.7%,比其他方法具有更高的预测精度. 展开更多
关键词 韵律词 韵律短语 句法特征 TBL算法
下载PDF
Incorporating Linguistic Rules in Statistical Chinese Language Model for Pinyin-to-character Conversion 被引量:2
11
作者 刘秉权 Wang +2 位作者 Xiaolong Wang Yuying 《High Technology Letters》 EI CAS 2001年第2期8-13,共6页
An N-gram Chinese language model incorporating linguistic rules is presented. By constructing elements lattice, rules information is incorporated in statistical frame. To facilitate the hybrid modeling, novel methods ... An N-gram Chinese language model incorporating linguistic rules is presented. By constructing elements lattice, rules information is incorporated in statistical frame. To facilitate the hybrid modeling, novel methods such as MI-based rule evaluating, weighted rule quantification and element-based n-gram probability approximation are presented. Dynamic Viterbi algorithm is adopted to search the best path in lattice. To strengthen the model, transformation-based error-driven rules learning is adopted. Applying proposed model to Chinese Pinyin-to-character conversion, high performance has been achieved in accuracy, flexibility and robustness simultaneously. Tests show correct rate achieves 94.81% instead of 90.53% using bi-gram Markov model alone. Many long-distance dependency and recursion in language can be processed effectively. 展开更多
关键词 Chinese Pinyin-to-character conversion Rule-based language model N-gram language model Hybrid language model Element lattice Transformation-based error-driven learning
下载PDF
SVM与错误驱动学习相结合的中文人名识别 被引量:3
12
作者 赵伟 李丹 《长春工业大学学报》 CAS 2009年第4期396-400,共5页
利用基于转换的错误驱动学习方法对SVM的识别结果进行校正,转换规则较好地处理了语言现象中的特殊情况,进一步提高了SVM的识别结果。实验结果表明,该方法的中文人名识别的准确率、召回率和F值均得到了提高。
关键词 中文姓名识别 支持向量机 基于转换的错误驱动学习
下载PDF
基于错误驱动学习和知网的中文人名识别 被引量:3
13
作者 李波 张蕾 《计算机工程》 CAS CSCD 2012年第12期179-181,共3页
针对统计与规则这2种方法的优缺点,提出一种基于转换的错误驱动学习与知网相结合的中文人名自动识别方法。利用标注语料库,根据在人名识别中的作用对人名上下文环境进行角色标注,提取标注后的实例,并采用基于转换的错误驱动方法和知网... 针对统计与规则这2种方法的优缺点,提出一种基于转换的错误驱动学习与知网相结合的中文人名自动识别方法。利用标注语料库,根据在人名识别中的作用对人名上下文环境进行角色标注,提取标注后的实例,并采用基于转换的错误驱动方法和知网对提取的实例进行可用规则提取,结合规则和实例对文本进行人名识别。实验结果表明,与其他方法相比,该方法的中文人名识别准确率、召回率和F值均有明显提高。 展开更多
关键词 中文人名识别 基于转换的错误驱动学习 知网 语料库 角色标注
下载PDF
基于CRF和错误驱动的中心词识别 被引量:3
14
作者 田卫东 李亚娟 《计算机应用研究》 CSCD 北大核心 2013年第8期2345-2348,共4页
针对中文问题分类的中心词识别不准确的问题,提出了一种基于条件随机场(CRF)和错误驱动学习相结合的识别方法。该方法采用CRF模型对问题的中心词进行初始标注,依据词的上下文信息用错误驱动的学习方法对其标注结果进行纠正。在训练有序... 针对中文问题分类的中心词识别不准确的问题,提出了一种基于条件随机场(CRF)和错误驱动学习相结合的识别方法。该方法采用CRF模型对问题的中心词进行初始标注,依据词的上下文信息用错误驱动的学习方法对其标注结果进行纠正。在训练有序规则的过程中,为了减少训练时间,结合中心词的特点对错误驱动算法进行了改进。实验结果表明,该方法在一定程度上提高了中心词的标注精度,达到88%。 展开更多
关键词 问题分类 中心词 条件随机场(CRF) 错误驱动学习(TBL) 上下文信息 有序规则
下载PDF
用CART模型指导TBL算法预测语调短语 被引量:2
15
作者 刘方舟 周游 陶建华 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第9期1226-1229,共4页
语调短语的自动预测是影响合成语音的可懂度和自然度的关键因素之一。该文提出了一种结合分类与回归树(classification and regression tree,CART)和基于转换的错误驱动的学习(transformation-based error-driven learning,TBL)算法的... 语调短语的自动预测是影响合成语音的可懂度和自然度的关键因素之一。该文提出了一种结合分类与回归树(classification and regression tree,CART)和基于转换的错误驱动的学习(transformation-based error-driven learning,TBL)算法的混合算法,从无限制的文本中预测语调短语边界。该方法根据CART模型的指导,自动生成TBL算法的规则模板,从而减少了规则学习过程中的人工参与。实验结果表明:基于该混合算法的语调短语预测的F-score达70.0%。自动生成的TBL模板不仅能较好地替代手工模板,而且在与手工模板一起使用时,也能为其提供有益的补充。 展开更多
关键词 语调短语预测 模板生成 分类与回归树(CART) 基于转换的错误驱动的学习(TBL)
原文传递
基于CRF和转换错误驱动学习的浅层句法分析 被引量:1
16
作者 张芬 曲维光 +1 位作者 赵红艳 周俊生 《广西师范大学学报(自然科学版)》 CAS 北大核心 2011年第3期147-150,共4页
本文提出一种CRF和基于转换错误驱动相结合的中文浅层句法分析方法。该方法应用于宾州大学中文树库,取得不错的组块识别效果。在CRF识别的基础上,对初始识别结果中的组块标注信息进行统计分析,获得候选转换规则集合;再根据定义的规则评... 本文提出一种CRF和基于转换错误驱动相结合的中文浅层句法分析方法。该方法应用于宾州大学中文树库,取得不错的组块识别效果。在CRF识别的基础上,对初始识别结果中的组块标注信息进行统计分析,获得候选转换规则集合;再根据定义的规则评价函数对候选集进行筛选,得到最终的转换规则集合;最后应用转换规则集对CRF标注的结果进行校正。实验结果表明,与单独使用CRF结果相比,组块识别的精确率、召回率以及F值均得到了提高。 展开更多
关键词 浅层句法分析 CRF 转换错误驱动学习 转换规则集
下载PDF
基于层叠条件随机场的哈语树库构建技术研究
17
作者 于智娟 古丽拉.阿东别克 《计算机应用与软件》 CSCD 2016年第3期71-75,82,共6页
针对如何提高基于统计的哈萨克语句法分析算法的处理性能问题,提出一种通过人机交互来构建哈萨克语树库的方法。在自动句法标注阶段,采用层叠条件随机场模型实现,并在其低层与高层模型之间加入改进的基于转换的错误驱动学习算法来进行... 针对如何提高基于统计的哈萨克语句法分析算法的处理性能问题,提出一种通过人机交互来构建哈萨克语树库的方法。在自动句法标注阶段,采用层叠条件随机场模型实现,并在其低层与高层模型之间加入改进的基于转换的错误驱动学习算法来进行简单句的自动句法标注及自动校正。最后对特殊的整体标记错误进行人工校对,形成基于短语结构的哈萨克语树库。实验结果表明,该方法在很大程度上减少了人力及物力的投入,提高了分析精度及整体处理效率,并为后期基于哈萨克语的句法机器翻译及文本挖掘奠定了一定的基础。 展开更多
关键词 哈萨克语树库 人机交互 层叠条件随机场 错误驱动学习算法
下载PDF
基于转换的错误驱动与决策树算法的句子边界自动识别
18
作者 李康熙 李为山 《科技通报》 北大核心 2012年第10期134-136,共3页
结合基于转换的错误驱动算法和决策树算法,并综合考虑句点标记在语料库中的复杂使用情况,生成能够自动划分英语句子边界的程序。实验结果表明,该方法具有较高的准确率,能够为后续语料库加工提供良好的前提基础。
关键词 句子边界识别 基于转换的错误驱动算法 决策树算法
下载PDF
语词性标注方法比较
19
作者 贺桂华 《怀化学院学报》 2008年第2期82-85,共4页
汉语以字为基本书写单位,且缺乏形态变化,词的兼类现象相当普遍.因此,有效对汉语进行词性标注对利用计算机来理解和生成汉语自然语言具有基础性意义.通过实例分析介绍了四种主要的标注方法并对其优劣进行了比较.
关键词 基于规则方法 统计方法 规则与统计结合方法 基于转换的错误驱动方法
下载PDF
大脑是如何处理信息的——神经元及其模型的计算阐释 被引量:2
20
作者 尤洋 崔帅 《科学技术哲学研究》 CSSCI 北大核心 2014年第5期20-26,共7页
神经元作为神经系统的基本单元,提供了人类认知的基本信息功能处理机制。文章通过对神经元及其模型进行计算分析,指出了神经元内离子对刺激信息的反应,在此基础上阐释了误差驱动任务学习与BP学习法,最后文章对神经元的计算启示给出了解... 神经元作为神经系统的基本单元,提供了人类认知的基本信息功能处理机制。文章通过对神经元及其模型进行计算分析,指出了神经元内离子对刺激信息的反应,在此基础上阐释了误差驱动任务学习与BP学习法,最后文章对神经元的计算启示给出了解读。文章表明,脑认知是动态的表征,其非线性地处理认知现象,并指出计算神经科学在解读大脑处理信息上正在尝试突破,具有重要的研究意义和价值。 展开更多
关键词 神经元 计算阐释 电学原理 扩散原理 误差驱动任务学习 BP学习
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部