期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
基于HMM的联机手写哈萨克文字的识别研究 被引量:2
1
作者 达吾勒.阿布都哈依尔 古丽拉.阿东别克 《计算机工程与应用》 CSCD 2014年第1期145-148,共4页
以基于隐马尔可夫模型和统计语言模型的研究作为基础,着重研究联机手写哈萨克文的切分技术、连体段分类和特征参数的独特提取技术。系统先将提取延迟笔划后的连体段主笔划作为HMM识别器的输入,再根据被识别的主笔划的编号和延迟笔划标... 以基于隐马尔可夫模型和统计语言模型的研究作为基础,着重研究联机手写哈萨克文的切分技术、连体段分类和特征参数的独特提取技术。系统先将提取延迟笔划后的连体段主笔划作为HMM识别器的输入,再根据被识别的主笔划的编号和延迟笔划标记从连体段分类词典中查找,找到对应的连体段识别结果。通过去除连体段延迟笔画的方法可以有效地减少需建立的模型数目,进而提高识别速度和避免由字符切分所带来的问题。 展开更多
关键词 哈萨克文 联机手写 隐马尔可夫模型 连体段 连体段分类 Hidden MARKOV Model(HMM)
下载PDF
改进的K-means算法在维文连体段聚类中的应用 被引量:1
2
作者 张建周 哈力木拉提.买买提 陈晓娇 《计算机工程与应用》 CSCD 2014年第14期135-138,254,共5页
在维吾尔文文字识别中,能否有效地聚类将直接影响识别结果的好坏。为改善聚类效果,针对维吾尔文连体段聚类,提出了一种改进的K-means聚类算法。该算法首先采用等间距法多次选择类中心,然后选择最佳码本和利用有效相似比来动态调整聚类个... 在维吾尔文文字识别中,能否有效地聚类将直接影响识别结果的好坏。为改善聚类效果,针对维吾尔文连体段聚类,提出了一种改进的K-means聚类算法。该算法首先采用等间距法多次选择类中心,然后选择最佳码本和利用有效相似比来动态调整聚类个数K,最后完成了连体段聚类。实验结果表明:与传统K-means算法相比,改进的K-means算法得到了较好聚类效果,聚类正确率达90%以上。 展开更多
关键词 维吾尔文文字识别 连体段 聚类算法 等间距法 有效相似比 正确率
下载PDF
基于连体段的印刷维吾尔文特征提取
3
作者 贾钰峰 章蓬伟 +2 位作者 贾园园 邵小青 刘茂霞 《智能计算机与应用》 2020年第5期206-209,212,共5页
典型的印刷识别系统由预处理,特征提取,训练模型,识别器组成。本文讨论了基于连体段的印刷维吾尔文特征提取方法。结合维文书写特点提取了:孔洞数,尾点,交叉点,方向码,笔划位置特征,前后景比值等。并利用以上特征进行了印刷维吾尔文的... 典型的印刷识别系统由预处理,特征提取,训练模型,识别器组成。本文讨论了基于连体段的印刷维吾尔文特征提取方法。结合维文书写特点提取了:孔洞数,尾点,交叉点,方向码,笔划位置特征,前后景比值等。并利用以上特征进行了印刷维吾尔文的模型训练和识别。 展开更多
关键词 印刷维吾尔文 连体段 特征提取
下载PDF
现代汉语词长弹性的量化研究 被引量:7
4
作者 黄丽君 端木三 《语言科学》 CSSCI 北大核心 2013年第1期8-16,共9页
本文先讨论对汉语词长弹性的两种看法,确认词长弹性是汉语的一大特点。然后根据《现代汉语词典》,对词长弹性进行全面的量化考察。对词典收录的单音节词条的1/10进行抽样,针对每一词义逐条考察其弹性特征。结果发现,汉语近70%的词有弹... 本文先讨论对汉语词长弹性的两种看法,确认词长弹性是汉语的一大特点。然后根据《现代汉语词典》,对词长弹性进行全面的量化考察。对词典收录的单音节词条的1/10进行抽样,针对每一词义逐条考察其弹性特征。结果发现,汉语近70%的词有弹性长度,其中名词的比例最高,超过80%,动词的比例略低于名词。文体对词长弹性比例也有一定影响。 展开更多
关键词 词长弹性 词条 词义 词类 词汇 复合词
下载PDF
机器翻译的词处理研究 被引量:12
5
作者 杨宪泽 《计算机工程与科学》 CSCD 北大核心 2009年第5期156-158,共3页
本文首先在讨论汉语自动分词这一难题的基础上提出最大匹配分词的改进算法,然后论述词性兼类处理的一些方法,最后探讨了汉英机器翻译时名词的单复数处理算法。
关键词 机器翻译 分词 词性兼类 单复数
下载PDF
基于实例的中文分词-词性标注方法的应用研究 被引量:4
6
作者 姜涛 姚天顺 张俐 《小型微型计算机系统》 CSCD 北大核心 2007年第11期2090-2093,共4页
通过实验证明基于实例的中文分词-词性标注(下文简称为EBST,Example-Based Chinese word Segment and Tagging)系统对训练语料相关的文本具有非常好的标注性能.实验结果显示了EBST系统的分词-词性标注不仅具有非常高的准确率,而且和训... 通过实验证明基于实例的中文分词-词性标注(下文简称为EBST,Example-Based Chinese word Segment and Tagging)系统对训练语料相关的文本具有非常好的标注性能.实验结果显示了EBST系统的分词-词性标注不仅具有非常高的准确率,而且和训练语料的标注保持了很好的一致性.这使得EBST系统非常适合于在基于实例的机器翻译(Example-Based Machine Translation,EBMT)系统中的应用.本文给出了EBST在EBMT系统中的应用实例及相应的实验结果. 展开更多
关键词 中文分词-词性标注 语料库 EBMT
下载PDF
网上的基础语言信息资源 被引量:2
7
作者 俞士汶 《术语标准化与信息技术》 2001年第4期19-23,共5页
论述了语言信息处理技术在信息化进程中的作用;介绍了北京大学计算语言学研究所在语言信息处理基础研究方面已经取得的成果以及语言资源情况;提出需要进一步研究的课题。
关键词 语言信息处理 汉语标注语料库 词语切分与词性标注 知网 词网 树库
下载PDF
一种中国古典文学文本知识图谱构建方法 被引量:2
8
作者 杨泽 顾磊 《计算机技术与发展》 2021年第7期28-34,41,共8页
以中国古典文学为代表的古文是中文的重要组成部分,其语法、词汇相对于现代文而言更加复杂、讲究,给中文自然语言处理带来了机遇和挑战。针对上述问题,利用自然语言处理和知识图谱技术,以中国古典文学文本中具有代表性的《三国演义》为... 以中国古典文学为代表的古文是中文的重要组成部分,其语法、词汇相对于现代文而言更加复杂、讲究,给中文自然语言处理带来了机遇和挑战。针对上述问题,利用自然语言处理和知识图谱技术,以中国古典文学文本中具有代表性的《三国演义》为例,进行知识图谱构建。该方法通过语料库的网页标签匹配生成了一个分词与词性标注数据集,用来训练神经网络模型的联合分词和词性标注规则,并使用训练好的模型对《三国演义》进行测试解析;从结果中删除停用词,将内容词及其语义链接分别作为知识图谱中的节点和关系,并进行可视化展示。侧重于在古典文学文本进行联合分词与词性标注的基础上进行知识图谱构建。可视化展示的图像清晰地显示了非结构化文本中的重要信息。这项研究表明了以上工作流程的有效性,并展示了将自然语言处理和知识图谱应用于中国古典文学文本的潜力。 展开更多
关键词 中国古典文学 知识图谱 Neo4j 自然语言处理 联合分词与词性标注
下载PDF
微博语料分词及标注方法初探 被引量:1
9
作者 于清 阿里甫.库尔班 《新疆大学学报(自然科学版)》 CAS 2013年第1期81-86,共6页
本文将清华大学中文分词和词性标注系统应用于部分微博语料数据,检测系统对微博新词识别能力及对识别错误进行了分类总结,并对识别率低的新词制定了标注规范.通过人工校对获得新的训练语料数据集,提高系统对微博文本的处理能力,为建立... 本文将清华大学中文分词和词性标注系统应用于部分微博语料数据,检测系统对微博新词识别能力及对识别错误进行了分类总结,并对识别率低的新词制定了标注规范.通过人工校对获得新的训练语料数据集,提高系统对微博文本的处理能力,为建立微博专用语料库做前期准备工作. 展开更多
关键词 分词 标注系统 专有名词 新词 微博语料库
下载PDF
英语词汇形义联系中的溯因推理
10
作者 黄永亮 黄剑 《河北大学学报(哲学社会科学版)》 CSSCI 北大核心 2015年第2期65-68,共4页
英语单词形义联系的紧密程度决定着词义或词形提取的轻松程度;英语单词形义联系的建立有赖于构词成分策略的使用。在运用构词成分策略重述已知词义的过程中溯因推理,把英语词汇形义联系的过程转化为动态逻辑推理,也可解决英语词汇的已... 英语单词形义联系的紧密程度决定着词义或词形提取的轻松程度;英语单词形义联系的建立有赖于构词成分策略的使用。在运用构词成分策略重述已知词义的过程中溯因推理,把英语词汇形义联系的过程转化为动态逻辑推理,也可解决英语词汇的已知词义重述问题:从待解释项"单词的汉语词义"出发,结合构词成分等背景知识,到解释项"单词英文拼写的意义拆分"进行逆推。溯因推理有利于促进并优化单词形义联系的建立,进而提高学习者的词汇学习效率。 展开更多
关键词 英语词汇 形义联系 溯因推理 构词成分策略 意义重述
下载PDF
“所谓”的区别词词性辨析
11
作者 马宁 《柳州职业技术学院学报》 2018年第5期94-97,共4页
"所谓"一词的词性判别,是通过典型的区别词的词性特征与"所谓"的固有词性特征的吻合度来辨析的。"所谓"的词性与它本身是否具备否定性的词汇特征有直接的联系,"所谓"作为修饰成分,它的词性也... "所谓"一词的词性判别,是通过典型的区别词的词性特征与"所谓"的固有词性特征的吻合度来辨析的。"所谓"的词性与它本身是否具备否定性的词汇特征有直接的联系,"所谓"作为修饰成分,它的词性也与它所处的语法位置有一定的关系。 展开更多
关键词 “所谓” 词性 区别词 现代汉语
下载PDF
基于核心属性渗透理论的合成词词性标注方法
12
作者 刘兴林 《电子技术与软件工程》 2013年第16期213-215,235,共4页
针对当前合成词词性难于确定的问题,提出了基于核心属性渗透理论的合成词词性标注算法。算法首先识别出文本中的合成词,并分析合成词的构成方式,获得合成词的构词规则,然后以核心属性渗透理论确定合成词的核心成分,将核心成分的词性标... 针对当前合成词词性难于确定的问题,提出了基于核心属性渗透理论的合成词词性标注算法。算法首先识别出文本中的合成词,并分析合成词的构成方式,获得合成词的构词规则,然后以核心属性渗透理论确定合成词的核心成分,将核心成分的词性标注为整个合成词的词性,并提供显式和隐式两种合成词标注方式,最后修正文本分词结果。实验结果表明,这种词性标注的方法是恰当的,在给定的文本集上合成词词性的标注准确率达到了95%。 展开更多
关键词 合成词 词性标注 核心属性渗透理 论分词修正
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部