期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于条件随机场的藏文人名识别技术研究 被引量:12
1
作者 珠杰 李天瑞 刘胜久 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2016年第2期289-299,共11页
文本挖掘中命名实体识别是一项重要的研究内容,利用统计学原理进行命名实体识别具有较高的识别率.利用条件随机场(conditional random fields,CRF)方法,研究藏文人名识别技术,重点探讨藏文人名的内部结构特征、上下文特征、特征选择和... 文本挖掘中命名实体识别是一项重要的研究内容,利用统计学原理进行命名实体识别具有较高的识别率.利用条件随机场(conditional random fields,CRF)方法,研究藏文人名识别技术,重点探讨藏文人名的内部结构特征、上下文特征、特征选择和数据预处理等内容,并通过实验分析了不同特征的有效性.首先给出了基于字(音节)和字位信息的人名识别方法;其次研究了触发词、虚词、人名词典和指人名词后缀为特征的不同特征组合与优化,并细化了不同虚词对人名识别的作用;最后,通过不同组合的实验测试,结果表明:1)触发词和作格助词特征在藏文人名识别上能够起到积极的作用;2)不同特征窗口大小对人名识别有一定影响;3)利用CRF识别藏文人名F1值能够达到80%左右,但由于藏文两字人名的高歧义性,目前还达不到与其他语言相近的识别效果. 展开更多
关键词 藏文人名 条件随机场(CRF) 特征选择
下载PDF
基于条件随机场的藏文人名识别研究 被引量:10
2
作者 康才畯 龙从军 江荻 《计算机工程与应用》 CSCD 北大核心 2015年第3期109-111,185,共4页
基于条件随机场模型在字粒度上识别并切分藏文人名,其优势是可以较好地利用藏文人名在文本中出现的基本特征和上下文特征来确定藏文人名在文本序列中的边界。根据藏文人名自身的特点设定特征标签集,利用条件随机场模型作为标注建模工具... 基于条件随机场模型在字粒度上识别并切分藏文人名,其优势是可以较好地利用藏文人名在文本中出现的基本特征和上下文特征来确定藏文人名在文本序列中的边界。根据藏文人名自身的特点设定特征标签集,利用条件随机场模型作为标注建模工具来进行训练和测试。从实验结果来看,该方法有较高的识别正确率,具有进一步研究的价值。下一步的改进需要扩充训练语料,并针对人名与一般词语同形现象进行特征标签集的优化。 展开更多
关键词 藏文人名 条件随机场 特征标签集
下载PDF
深度学习模型的藏文人名识别方法 被引量:10
3
作者 珠杰 李天瑞 《高原科学研究》 2017年第1期112-124,共13页
文章采用深度学习技术探讨了藏文文本中的人名识别方法。首先通过word2vec训练出藏文词向量,然后在该词向量的基础上利用神经网络探讨了藏文人名识别技术,通过实验证明识别效果F1能够达到94%以上。训练出了比较好的藏文词向量,且结合藏... 文章采用深度学习技术探讨了藏文文本中的人名识别方法。首先通过word2vec训练出藏文词向量,然后在该词向量的基础上利用神经网络探讨了藏文人名识别技术,通过实验证明识别效果F1能够达到94%以上。训练出了比较好的藏文词向量,且结合藏文特点设计了检测藏文词向量好坏的方法,并采用了前向传播和随机梯度下降算法,经过多组实验验证了藏文人名识别效果。 展开更多
关键词 神经网络 藏文人名 词向量
下载PDF
藏文人名自动识别研究 被引量:2
4
作者 娘本先 安见才让 《电子技术与软件工程》 2015年第19期115-116,共2页
目前的藏文人名识别研究大多通过英语、汉语等语种的方法来研究藏文人名的识别,虽然有着较好的识别效果,但对人名的用词、构词特点及应用藏文文法规则对人名上下文信息特征的分析较浅。本文提出了通过建立藏文人名构成词的成分属性词典... 目前的藏文人名识别研究大多通过英语、汉语等语种的方法来研究藏文人名的识别,虽然有着较好的识别效果,但对人名的用词、构词特点及应用藏文文法规则对人名上下文信息特征的分析较浅。本文提出了通过建立藏文人名构成词的成分属性词典,动态生成人名库,利用传统文法中人名上下文信息特征的文法规则建立藏文人名上下文指示词库对人名自动识别的方法。 展开更多
关键词 藏文人名 自动识别 动态人名 指示词
下载PDF
基于条件随机场的藏文人名识别研究 被引量:2
5
作者 兰义湧 龙从军 赵小兵 《中央民族大学学报(自然科学版)》 2018年第1期34-40,共7页
本文首先分析了藏文人名的特点以及藏文人名识别的难点,在此基础上,利用条件随机场模型,分别提出了采用基于亚音节标注的藏文人名识别方法和分词与词性标注一体化的藏文人名识别方法.
关键词 藏文人名 条件随机场 亚音节 分词 词性标注 一体化
下载PDF
最大熵和条件随机场模型相融合的藏文人名识别 被引量:21
6
作者 加羊吉 李亚超 +1 位作者 宗成庆 于洪志 《中文信息学报》 CSCD 北大核心 2014年第1期107-112,共6页
藏文人名识别是藏文信息处理领域研究的难点之一,其识别效果直接影响到藏文自动分词的精度和相关应用系统的性能,包括藏汉翻译、藏文信息检索、文本分类等。该文在分析藏文人名构成规律和特点的基础上,提出了一种最大熵和条件随机场相... 藏文人名识别是藏文信息处理领域研究的难点之一,其识别效果直接影响到藏文自动分词的精度和相关应用系统的性能,包括藏汉翻译、藏文信息检索、文本分类等。该文在分析藏文人名构成规律和特点的基础上,提出了一种最大熵和条件随机场相融合的藏文人名识别方法。实验表明,该方法可以获取较好的识别效果,在我们的测试集上F-测度值到达了93.08%。 展开更多
关键词 藏文人名识别 最大熵 条件随机场
下载PDF
统计与规则相结合的藏文人名自动识别研究 被引量:9
7
作者 窦嵘 加羊吉 黄伟 《长春工程学院学报(自然科学版)》 2010年第2期113-115,共3页
提出了一种基于统计与规则相结合的藏文人名自动识别方法。该方法充分挖掘了人名与上下文信息的关联程度,引入互信息对关联程度进行了定量的描述。根据大规模语料(30.2 M文本语料)的统计数据所建立的规则极大地提高了识别算法的准确率;... 提出了一种基于统计与规则相结合的藏文人名自动识别方法。该方法充分挖掘了人名与上下文信息的关联程度,引入互信息对关联程度进行了定量的描述。根据大规模语料(30.2 M文本语料)的统计数据所建立的规则极大地提高了识别算法的准确率;在处理汉族音译人名情况时,采用姓氏驱动的方法,很好地解决了藏文文本中汉族人名的识别问题。实验结果表明,该方法具有较高的准确率和召回率。 展开更多
关键词 藏文人名识别 互信息 格助词 人名词典
下载PDF
基于置信度的藏文人名识别的主动学习模型研究 被引量:4
8
作者 王志娟 刘飞飞 +1 位作者 赵小兵 宋伟 《中文信息学报》 CSCD 北大核心 2019年第8期53-59,共7页
训练语料的标注成本是资源稀缺语言处理研究面临的一个重要问题,通过主动学习(active learning)方法可以选择信息量大、无冗余的语料供人工标注,进而大大降低语料标注成本。该文基于CRF模型给出的标注置信度提出了四种主动学习方法,并... 训练语料的标注成本是资源稀缺语言处理研究面临的一个重要问题,通过主动学习(active learning)方法可以选择信息量大、无冗余的语料供人工标注,进而大大降低语料标注成本。该文基于CRF模型给出的标注置信度提出了四种主动学习方法,并通过实验确定了这四种主动学习方法的相关参数。实验显示:选择置信度低于0.7的语料进行人工标注,直到新旧模型标注结果的差异度小于0.01%时,仅需6轮迭代;人工标注3.2MB的语料,藏文人名识别的F值可以达到88%,若要达到该识别效果,基于CRF的监督式学习模型需要标注约10MB的语料,该主动学习方法降低了约66%的语料标注规模。 展开更多
关键词 藏文人名识别 主动学习 置信度
下载PDF
CRF与规则相结合的藏文人名识别方法 被引量:1
9
作者 加羊吉 李亚超 于洪志 《西北民族大学学报(自然科学版)》 2016年第3期41-45,共5页
文章就藏文人名本身的特性分析了人名识别的难点,提出了CRF与规则相结合的藏文人名识别方法.该方法首先以CRF作为机器学习模型,充分利用藏文人名的各类特征,然后针对人名不能全面召回的问题,利用规则方法进行后处理,最终建立了一种优势... 文章就藏文人名本身的特性分析了人名识别的难点,提出了CRF与规则相结合的藏文人名识别方法.该方法首先以CRF作为机器学习模型,充分利用藏文人名的各类特征,然后针对人名不能全面召回的问题,利用规则方法进行后处理,最终建立了一种优势互补的识别模型.实验结果表明,该文提出的方法具有较好的性能,F-值可达91.55. 展开更多
关键词 藏文人名识别 命名实体 CRF模型 规则
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部