-
题名藏语句法功能组块的边界识别
被引量:10
- 1
-
-
作者
李琳
龙从军
江荻
-
机构
中国社会科学院研究生院
中国社会科学院民族学与人类学研究所
中央民族大学民族语言监测分中心
-
出处
《中文信息学报》
CSCD
北大核心
2013年第6期165-168,共4页
-
基金
基于本体的多策略民汉机器翻译研究项目资助(61132009)
-
文摘
藏语句法功能组块能够很好地描述藏语句子的基本骨架,是连接句法结构与语义描述的重要桥梁。根据藏语句法特点,该文作者提出五种句法功能组块及功能组块边界识别策略。首先描述了藏语句法功能组块的基本特点和标注体系,然后在此基础上提出了一种基于条件随机域(CRFs)模型的功能组块边界识别算法。小规模训练语料的实验结果表明,该方法可以有效的识别出功能组块边界,值得进一步研究。
-
关键词
藏语句法功能组块
组块边界识别
条件随机域模型
-
Keywords
Tibetan functional chunks
chunks boundary detectiom CRFs
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于词位的藏文黏写形式的切分
被引量:6
- 2
-
-
作者
康才畯
龙从军
江荻
-
机构
上海师范大学人文与传播学院
中国社科院民族研究所
中央民族大学民族语言监测分中心
-
出处
《计算机工程与应用》
CSCD
2014年第11期218-222,共5页
-
基金
国家自然科学基金(No.61132009)
-
文摘
基于词位的统计分析方法识别并切分现代藏语文本中的黏写形式,其最大特点是减少了未登录词对识别效果的影响。首先根据藏文自身的特点,将常用的四词位扩充为六词位,再利用条件随机场模型作为标注建模工具来进行训练和测试,并根据规则对识别结果进行后处理。从实验结果来看,该方法有较高的识别正确率,具有进一步研究的价值。下一步的改进需要扩充训练语料,并对模型选用的特征集进行优化。
-
关键词
藏文黏写形式
词位
条件随机场
特征模板
后处理
-
Keywords
Tibetan abbreviated forms
word position
Conditional Random Field(CRF)
feature template
post process
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名藏语判断、存在动词识别策略
被引量:2
- 3
-
-
作者
李琳
龙从军
-
机构
中国社会科学院民族学与人类学研究所
中国社会科学院研究生院
中央民族大学民族语言监测分中心
-
出处
《中文信息学报》
CSCD
北大核心
2013年第4期59-62,69,共5页
-
基金
国家自然科学基金资助项目(61132009)
-
文摘
判断动词与存在动词在藏语中使用频度高,兼类现象频繁,在不同语境下具有不同的含义。既可以表示判断、存在和领有意义,也可作为语法标记表达复杂的体貌、示证意义。判断、存在动词的多功能性给藏文文本分词标注、句型识别等工作带来较大的困难。借助藏语语法的研究成果和真实藏文文本,我们对这两类词的上下文语境进行了分析和归纳,进而提出了辨别这两类词的方法。首先,考察判断动词和存在动词在不同语境下的左右特征词;然后,建立了识别规则库,从肯定与否定两个方面判别其词性并标注。
-
关键词
藏语
判断动词
存在动词
自动识别
-
Keywords
Tibetan
linking verb
existential verb
automatic recognition
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-