期刊文献+
共找到77篇文章
< 1 2 4 >
每页显示 20 50 100
Incorporating Linguistic Rules in Statistical Chinese Language Model for Pinyin-to-character Conversion 被引量:2
1
作者 刘秉权 Wang +2 位作者 Xiaolong Wang Yuying 《High Technology Letters》 EI CAS 2001年第2期8-13,共6页
An N-gram Chinese language model incorporating linguistic rules is presented. By constructing elements lattice, rules information is incorporated in statistical frame. To facilitate the hybrid modeling, novel methods ... An N-gram Chinese language model incorporating linguistic rules is presented. By constructing elements lattice, rules information is incorporated in statistical frame. To facilitate the hybrid modeling, novel methods such as MI-based rule evaluating, weighted rule quantification and element-based n-gram probability approximation are presented. Dynamic Viterbi algorithm is adopted to search the best path in lattice. To strengthen the model, transformation-based error-driven rules learning is adopted. Applying proposed model to Chinese Pinyin-to-character conversion, high performance has been achieved in accuracy, flexibility and robustness simultaneously. Tests show correct rate achieves 94.81% instead of 90.53% using bi-gram Markov model alone. Many long-distance dependency and recursion in language can be processed effectively. 展开更多
关键词 Chinese Pinyin-to-character conversion Rule-based language model N-gram language model Hybrid language model Element lattice transformation-based error-driven learning
下载PDF
基于转换的时间-事件关系映射 被引量:19
2
作者 王昀 苑春法 《中文信息学报》 CSCD 北大核心 2004年第4期23-30,共8页
近些年来 ,中文时间信息抽取和处理已经变得越来越重要。然而 ,很少有研究者关注中文文本中事件信息所对应的时间信息的识别和分析。本文的目的就是确定文本中时间信息和事件信息之间的映射关系。区别于传统的基于规则的方法 ,本文采用... 近些年来 ,中文时间信息抽取和处理已经变得越来越重要。然而 ,很少有研究者关注中文文本中事件信息所对应的时间信息的识别和分析。本文的目的就是确定文本中时间信息和事件信息之间的映射关系。区别于传统的基于规则的方法 ,本文采用了一种机器学习的方法—基于转换的错误驱动学习—来确定事件相应的时间表达 ,这种学习算法可以自动的获取和改进规则。使用训练得到的转换规则集后 ,系统的时间 -事件映射错误率减少了 9 74 % 。 展开更多
关键词 计算机应用 中文信息处理 时间信息处理 基于转换的错误驱动学习 信息抽取
下载PDF
用于词性标注的一种快速学习算法──对Brill的基于变换算法的一项改进 被引量:8
3
作者 周明 吴进 黄昌宁 《计算机学报》 EI CSCD 北大核心 1998年第4期357-366,共10页
本文提出了一种快速学习算法,它解决了Brill基于变换的学习方法中规则获取时间过长的问题.在每次迭代过程中,该算法仅需调整受到影响的小部分变换模式,而无需遍历所有变换模式,大大节省了学习时间.应用这一快速学习算法,以SUSANN... 本文提出了一种快速学习算法,它解决了Brill基于变换的学习方法中规则获取时间过长的问题.在每次迭代过程中,该算法仅需调整受到影响的小部分变换模式,而无需遍历所有变换模式,大大节省了学习时间.应用这一快速学习算法,以SUSANNE英语语料库作为训练文本,获得300条英语词性标注规则和生词处理的概率知识,实现了一个英语词性标注系统,系统封闭测试和开放测试的正确率分别达到了98.2%和96.6%. 展开更多
关键词 学习算法 词性标注 自然语言处理 变换算法
下载PDF
中文词法分析与句法分析融合策略研究 被引量:13
4
作者 米海涛 熊德意 刘群 《中文信息学报》 CSCD 北大核心 2008年第2期10-17,共8页
利用外部资源是提升句法分析性能的一种有效方法。本文利用中文词法分析器这一外部资源,提出了一种通用转换方法将中文词法分析器与句法分析器有机地融合在一起。通过基于转换的错误驱动学习和条件随机场解决不同切词、词性标注标准间... 利用外部资源是提升句法分析性能的一种有效方法。本文利用中文词法分析器这一外部资源,提出了一种通用转换方法将中文词法分析器与句法分析器有机地融合在一起。通过基于转换的错误驱动学习和条件随机场解决不同切词、词性标注标准间的转换问题。在句法分析方面,本文提出了多子模型句法分析器,将中心词驱动模型和结构上下文模型有效结合在一起。融合后的中文句法分析性能在宾州中文树库1.0版①测试集上F1值达到了82.5%的最好水平。 展开更多
关键词 计算机应用 中文信息处理 中文句法分析 中文词法分析 融合策略 基于转换的错误驱动学习 条件随机场
下载PDF
一种新的错误驱动学习方法在中文分词中的应用 被引量:9
5
作者 夏新松 肖建国 《计算机科学》 CSCD 北大核心 2006年第3期160-164,共5页
中文分词应用中一个很重要的问题就是缺乏词的统一性定义。不同的分词标准会导致不同的分词结果,不同的应用也需要不同的分词结果。而针对不同的分词标准开发多个中文分词系统是不现实的,因此针对多种不同的分词标准,如何利用现有的分... 中文分词应用中一个很重要的问题就是缺乏词的统一性定义。不同的分词标准会导致不同的分词结果,不同的应用也需要不同的分词结果。而针对不同的分词标准开发多个中文分词系统是不现实的,因此针对多种不同的分词标准,如何利用现有的分词系统进行灵活有效的输出就显得非常重要。本文提出了一种新的基于转换的学习方法,对分词结果进行后处理,可以针对不同的分词标准进行灵活有效的输出。不同于以往的用于分词的转换学习方法,该方法有效利用了一些语言学信息,把词类和词內结构信息引入规则模板和转换规则中。为了验证该方法,我们在4个标准测试集上进行了分词评测,取得了令人满意的效果。 展开更多
关键词 中文分词 规则模板 词类 词内结构 基于转换的学习(TBL)
下载PDF
汉语文语转换系统中停顿指数的自动标注 被引量:6
6
作者 赵永贞 刘挺 +2 位作者 王志伟 陈惠鹏 邵艳秋 《中文信息学报》 CSCD 北大核心 2004年第5期48-55,共8页
本文采用了一个基于C TOBI的停顿指数标注的语料库 ,利用有指导的学习方法对自动停顿指数标注方面做了一些有益的探索。本文共实现了三种方法 :基本的马尔科夫模型 ,引入了词长信息的马尔科夫模型 ,引入词长信息的马尔科夫模型结合基于... 本文采用了一个基于C TOBI的停顿指数标注的语料库 ,利用有指导的学习方法对自动停顿指数标注方面做了一些有益的探索。本文共实现了三种方法 :基本的马尔科夫模型 ,引入了词长信息的马尔科夫模型 ,引入词长信息的马尔科夫模型结合基于转换的错误驱动的学习方法。然后通过对 30 0 0句的真实文本进行开放测试 ,以基本的马尔科夫模型的结果作为基准 ,实验结果不断改进 ,最终达到了 78 6 %的准确率 ,错误代价降低了 14 5 % 展开更多
关键词 计算机应用 中文信息处理 文语转换 停顿指数 马尔科夫模型 基于转换的错误驱动的学习
下载PDF
基于TBL算法的汉语韵律词预测 被引量:6
7
作者 陈龙 杨鸿武 蔡莲红 《西北师范大学学报(自然科学版)》 CAS 2008年第1期47-51,共5页
提出了一种新的汉语韵律词预测方法.利用标注过的语料,分析了语法词与韵律词之间的关系,发现24%的韵律词由不同语法词组合而成,语法词的词长是确定韵律词边界的主要特征.基于以上分析,实现了一种基于错误驱动的规则学习算法(TBL)的韵律... 提出了一种新的汉语韵律词预测方法.利用标注过的语料,分析了语法词与韵律词之间的关系,发现24%的韵律词由不同语法词组合而成,语法词的词长是确定韵律词边界的主要特征.基于以上分析,实现了一种基于错误驱动的规则学习算法(TBL)的韵律词预测方法.实验结果表明,所提出的方法在测试集上能够达到97.5%的预测精度. 展开更多
关键词 韵律词 语法词 TBL算法 文语转换
下载PDF
Improved Relative-transformation Principal Component Analysis Based on Mahalanobis Distance and Its Application for Fault Detection 被引量:8
8
作者 SHI Huai-Tao LIU Jian-Chang +4 位作者 XUE Peng ZHANG Ke WU Yu-Hou ZHANG Li-Xiu TAN Shuai 《自动化学报》 EI CSCD 北大核心 2013年第9期1533-1542,共10页
主要部件分析(PCA ) 广泛地在过程工业被使用了,它能维持最大的差错察觉率。尽管许多问题在 PCA 被处理了,一些必要问题仍然保持未解决。这研究以下列方法为差错察觉性能改进 PCA。第一,一个相对转变计划基于 Mahalanobis 距离(MD )... 主要部件分析(PCA ) 广泛地在过程工业被使用了,它能维持最大的差错察觉率。尽管许多问题在 PCA 被处理了,一些必要问题仍然保持未解决。这研究以下列方法为差错察觉性能改进 PCA。第一,一个相对转变计划基于 Mahalanobis 距离(MD ) 被介绍消除数据的尺寸的效果而不是无尺寸的标准化,并且改进精确性和差错察觉的即时性能。理论推导证明那相对转变能直接基于 MD 消除尺寸的效果并且在结果显示出的相对空间,分析和模拟给 PCA 的合理解释它的优势和有效性。第二,一个改进摆平的预言错误(SPE ) 统计数值被给改进标准化 PCA 的差错察觉表演,它能使标准化基于 PCA 的差错察觉方法成为对实际工业过程合适的更多。最后,二个改进方法被联合更有效地检测差错。建议方法被使用在热连续滚动过程检测 looper 系统的单个差错和多差错,模拟结果以易感知,精确性和差错察觉的即时性能为差错察觉性能表明这些改进的有效性。 展开更多
关键词 故障检测率 主成分分析 马氏距离 应用 分析基 转化 故障检测方法 实时性能
下载PDF
基于变换的汉语句法功能标注探讨 被引量:5
9
作者 周明 潘海华 《中文信息学报》 CSCD 北大核心 1997年第4期1-10,共10页
本文尝试利用基于变换的方法标注中文句子词汇的句法功能。系统输入已分词并标注了词性的句子,输出每个词的依存关系。我们首先设计了一个由44种依存关系组成的汉语依存体系,然后以人机互助的方式标注了1300句中文句子。其中... 本文尝试利用基于变换的方法标注中文句子词汇的句法功能。系统输入已分词并标注了词性的句子,输出每个词的依存关系。我们首先设计了一个由44种依存关系组成的汉语依存体系,然后以人机互助的方式标注了1300句中文句子。其中1100句作为训练文本用来获取标注规则,余下200句用做测试。设计了17类变换模板,采用基于变换的算法获取了60条有序的依存关系标注规则。在测试时,对新词标注以该词词性所对应的最高频的依存关系作为初始标注以提高鲁棒性。实验表明这种方法简单可行,取得了初步满意的效果。 展开更多
关键词 基于变换 学习算法 汉语 句法标注 信息处理
下载PDF
SVM和基于转换的错误驱动学习相结合的汉语组块识别 被引量:4
10
作者 邹宏梅 王挺 《计算机工程与科学》 CSCD 2007年第4期91-94,123,共5页
本文研究了一种支持向量机(SVM)和基于转换的错误驱动学习相结合的汉语组块识别方法。SVM在选取特征方面有突出的优点,并且在高维特征空间也具有较高的泛化性能,通过核函数的原则,SVM能够在独立于训练数据维数的小计算范围内进行训练。... 本文研究了一种支持向量机(SVM)和基于转换的错误驱动学习相结合的汉语组块识别方法。SVM在选取特征方面有突出的优点,并且在高维特征空间也具有较高的泛化性能,通过核函数的原则,SVM能够在独立于训练数据维数的小计算范围内进行训练。利用基于转换的错误驱动学习方法对SVM的标注结果进行校正,转换规则较好地处理了语言现象中的特殊情况,进一步提高了SVM的识别结果。实验结果表明,该方法具有较好的效果。 展开更多
关键词 支持向量机 基于转换的错误驱动学习 汉语组块识别
下载PDF
基于句法特征的汉语韵律边界预测 被引量:6
11
作者 杨鸿武 朱玲 《西北师范大学学报(自然科学版)》 CAS 北大核心 2013年第1期41-45,共5页
提出了一种利用TBL算法和句法特征进行韵律边界预测的方法.选择语法词的词性、词长和其在语法树中所处的层级这三个句法特征,利用预定义的规则模板,采用基于转换的错误驱动学习算法(Transformation-based error driven learning algorit... 提出了一种利用TBL算法和句法特征进行韵律边界预测的方法.选择语法词的词性、词长和其在语法树中所处的层级这三个句法特征,利用预定义的规则模板,采用基于转换的错误驱动学习算法(Transformation-based error driven learning algorithm,TBL算法),实现了对输入文本的韵律词和韵律短语的预测.结果表明,韵律词的预测精度达到了98.4%,韵律短语的预测精度达到了82.7%,比其他方法具有更高的预测精度. 展开更多
关键词 韵律词 韵律短语 句法特征 TBL算法
下载PDF
基于语法树高度的汉语韵律短语预测 被引量:6
12
作者 杨鸿武 王晓丽 +3 位作者 陈龙 裴东 郭威彤 蔡莲红 《计算机工程与应用》 CSCD 北大核心 2010年第36期139-143,167,共6页
在文语转换系统中,从文本中预测出准确的韵律结构对于提高合成语音的自然度具有重要的作用。利用10 000句标注了词性标记的文本语料,在语言学专家的指导下,人工标注了语料的韵律词和韵律短语。选择了标注结果一致性最高的500句语句,标... 在文语转换系统中,从文本中预测出准确的韵律结构对于提高合成语音的自然度具有重要的作用。利用10 000句标注了词性标记的文本语料,在语言学专家的指导下,人工标注了语料的韵律词和韵律短语。选择了标注结果一致性最高的500句语句,标注了语法层级结构,并利用语法树高度描述语法词之间连接的紧密程度。通过分析韵律短语边界与语法结构的关系,发现韵律短语边界受语法树高度、语法词词性和语法词词长的影响,因此选择了这三个特征,利用TBL算法和400句训练语句训练了预测模型。测试集上的预测结果表明,提出的方法在小规模训练语料下,韵律短语预测的精确率达到了75.2%,召回率达到了77.1%,F-Score达到了76.1%。 展开更多
关键词 韵律结构预测 语法结构 韵律短语 语法树高度 错误驱动的规则学习算法(TBL)
下载PDF
尾矿坝位移分级预警阈值研究及规律分析
13
作者 胡少华 曹思佳 袁友翠 《安全与环境学报》 CAS CSCD 北大核心 2024年第2期511-516,共6页
针对尾矿坝在线监测重建设、轻利用的现状,基于尾矿坝位移在线监测时间序列,通过多步逆向云变换算法(Multi-step Backward Cloud Transformation Algorithm Based on Sampling with Replacement,MBCT-SR)改进云模型,根据“3E_(n)原则”... 针对尾矿坝在线监测重建设、轻利用的现状,基于尾矿坝位移在线监测时间序列,通过多步逆向云变换算法(Multi-step Backward Cloud Transformation Algorithm Based on Sampling with Replacement,MBCT-SR)改进云模型,根据“3E_(n)原则”和内外包络曲线确定在线监测位移的正常运行值,从而建立尾矿坝位移分级预警阈值模型,并利用某尾矿坝全球导航卫星(Global Navigation Satellite System,GNSS)技术表面位移在线监测数据进行实例验证。结果表明:该尾矿坝水平方向位移的黄、橙、红预警阈值分别为8.41 mm/d、12.94 mm/d、19.41 mm/d,呈现出坝体中间预警阈值最大、并由中间向两侧减小的空间变化规律;尾矿坝垂直方向位移的黄、橙、红预警阈值分别为16.56 mm/d、25.48 mm/d、38.22 mm/d,且随着子坝的堆积,预警阈值逐渐增大。 展开更多
关键词 安全工程 尾矿坝 分级预警 多步逆向云变换算法(MBCT-SR) 阈值 空间分布
下载PDF
东北汉族传统民居在历史迁徙过程中的型制转变及其启示 被引量:4
14
作者 李同予 薛滨夏 白雪 《城市建筑》 2009年第5期104-105,共2页
东北汉族传统合院式民居作为中国传统民居的重要组成部分,既有我国北方汉族传统民居建筑许多共同的传统特征,又有其独特的地方特色。本文通过将东北汉族传统民居与其发源地—中原汉族民居进行分析比较,找出它们存在与发展变化的因缘关系... 东北汉族传统合院式民居作为中国传统民居的重要组成部分,既有我国北方汉族传统民居建筑许多共同的传统特征,又有其独特的地方特色。本文通过将东北汉族传统民居与其发源地—中原汉族民居进行分析比较,找出它们存在与发展变化的因缘关系,力求对东北汉族传统民居有一个新的认识,并希望能为东北汉族传统民居的研究提供可借鉴的资料。 展开更多
关键词 东北汉族传统民居 型制转变 成因分析
下载PDF
基于转移学习的中文命名实体识别 被引量:4
15
作者 周法国 吴锡坤 +1 位作者 孙泰 孙镇 《计算机工程与应用》 CSCD 北大核心 2018年第5期117-121,共5页
中文命名实体识别在多个重要领域有广泛的运用,提出一种基于转移学习的算法进行中文命名实体识别,旨在提高识别的准确率和召回率。基于转移学习算法的中心思想是开始以一些简单的结论应用于问题,然后在每个步骤应用转换,选择出每次转换... 中文命名实体识别在多个重要领域有广泛的运用,提出一种基于转移学习的算法进行中文命名实体识别,旨在提高识别的准确率和召回率。基于转移学习算法的中心思想是开始以一些简单的结论应用于问题,然后在每个步骤应用转换,选择出每次转换的最优结论再次应用于问题,当选择的转换在足够的空间内不再修改数据时算法停止。提出算法的规则模板和约束文件的获取方法,形成一个完整的用于中文命名实体识别的模型,并利用该模型进行实验,获得了较好的结果。 展开更多
关键词 命名实体识别 转移学习 准确率 召回率
下载PDF
英汉环保领域平行语料的句对齐与再对齐 被引量:4
16
作者 熊文新 《现代图书情报技术》 CSSCI 北大核心 2013年第6期36-41,共6页
从资源建设角度对现有基于统计的句对齐工具进行用户易用性及性能比较,认为Champollion比较适合英汉双语句对齐处理。借鉴"基于转换错误驱动"的思路,对Champollion对齐错误结果利用语言学规则实施再对齐,使句对齐效果进一步... 从资源建设角度对现有基于统计的句对齐工具进行用户易用性及性能比较,认为Champollion比较适合英汉双语句对齐处理。借鉴"基于转换错误驱动"的思路,对Champollion对齐错误结果利用语言学规则实施再对齐,使句对齐效果进一步提升。以英汉环保领域专业文本为例,句对齐的准确率从最初的88.74%上升至93.91%。这种结合基于统计对齐工具和语言学知识应用的对齐和再对齐处理方法在"分步骤按领域"建设大规模双语语料库的过程中具有普适性。 展开更多
关键词 英汉平行语料库 环保文本 句对齐 再对齐 基于转换错误驱动
原文传递
SVM与错误驱动学习相结合的中文人名识别 被引量:3
17
作者 赵伟 李丹 《长春工业大学学报》 CAS 2009年第4期396-400,共5页
利用基于转换的错误驱动学习方法对SVM的识别结果进行校正,转换规则较好地处理了语言现象中的特殊情况,进一步提高了SVM的识别结果。实验结果表明,该方法的中文人名识别的准确率、召回率和F值均得到了提高。
关键词 中文姓名识别 支持向量机 基于转换的错误驱动学习
下载PDF
基于错误驱动学习和知网的中文人名识别 被引量:3
18
作者 李波 张蕾 《计算机工程》 CAS CSCD 2012年第12期179-181,共3页
针对统计与规则这2种方法的优缺点,提出一种基于转换的错误驱动学习与知网相结合的中文人名自动识别方法。利用标注语料库,根据在人名识别中的作用对人名上下文环境进行角色标注,提取标注后的实例,并采用基于转换的错误驱动方法和知网... 针对统计与规则这2种方法的优缺点,提出一种基于转换的错误驱动学习与知网相结合的中文人名自动识别方法。利用标注语料库,根据在人名识别中的作用对人名上下文环境进行角色标注,提取标注后的实例,并采用基于转换的错误驱动方法和知网对提取的实例进行可用规则提取,结合规则和实例对文本进行人名识别。实验结果表明,与其他方法相比,该方法的中文人名识别准确率、召回率和F值均有明显提高。 展开更多
关键词 中文人名识别 基于转换的错误驱动学习 知网 语料库 角色标注
下载PDF
基于CRF和错误驱动的中心词识别 被引量:3
19
作者 田卫东 李亚娟 《计算机应用研究》 CSCD 北大核心 2013年第8期2345-2348,共4页
针对中文问题分类的中心词识别不准确的问题,提出了一种基于条件随机场(CRF)和错误驱动学习相结合的识别方法。该方法采用CRF模型对问题的中心词进行初始标注,依据词的上下文信息用错误驱动的学习方法对其标注结果进行纠正。在训练有序... 针对中文问题分类的中心词识别不准确的问题,提出了一种基于条件随机场(CRF)和错误驱动学习相结合的识别方法。该方法采用CRF模型对问题的中心词进行初始标注,依据词的上下文信息用错误驱动的学习方法对其标注结果进行纠正。在训练有序规则的过程中,为了减少训练时间,结合中心词的特点对错误驱动算法进行了改进。实验结果表明,该方法在一定程度上提高了中心词的标注精度,达到88%。 展开更多
关键词 问题分类 中心词 条件随机场(CRF) 错误驱动学习(TBL) 上下文信息 有序规则
下载PDF
P3P问题多解条件的补充研究 被引量:2
20
作者 符德林 马文鹏 《计算机工程与应用》 CSCD 北大核心 2011年第2期179-181,203,共4页
PnP问题是计算机视觉与摄影测量学中经典而重要的问题之一,在姿态定位中应用广泛。结合已有的研究成果,利用韦达定理对P3P问题多解的现象进行详细地研究,并给出了一些判定条件,从而扩展了P3P问题多解的判别条件的适用范围。研究结果对... PnP问题是计算机视觉与摄影测量学中经典而重要的问题之一,在姿态定位中应用广泛。结合已有的研究成果,利用韦达定理对P3P问题多解的现象进行详细地研究,并给出了一些判定条件,从而扩展了P3P问题多解的判别条件的适用范围。研究结果对实际的摄像机定位具有一定的理论和应用价值。 展开更多
关键词 基于变换定义 深度因子 多解现象
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部