-
题名基于判别式的藏语依存句法分析
被引量:17
- 1
-
-
作者
华却才让
赵海兴
-
机构
青海师范大学藏文信息研究中心
陕西师范大学计算机科学学院
-
出处
《计算机工程》
CAS
CSCD
2013年第4期300-304,共5页
-
基金
国家自然科学基金资助项目(61063033
61163018)
+1 种基金
国家"973"计划前期研究专项基金资助项目(2010CB334708)
青海省科技基金资助项目(2011-Z-752)
-
文摘
现有藏语句法体系复杂,不利于藏文自然语言处理的应用。为此,提出基于判别式的藏语依存句法分析方法,采用感知机方法训练句法分析模型,CYK自底向上算法解码生成最大生成树。实验结果表明,在人工标注的测试集上,句法分析正确率达到81.2%,可实际应用到藏语依存树库的构建和其他自然语言处理中。
-
关键词
藏语依存句法
句法标注规范
最大生成树
特征模板
依存句法
感知机
-
Keywords
tibetan dependency syntax
syntax tagging specification
maximum-spanning tree
feature template
dependency syntax
perceptron
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于词对依存分类的藏语树库半自动构建研究
被引量:8
- 2
-
-
作者
华却才让
姜文斌
赵海兴
刘群
-
机构
青海师范大学 藏文信息研究中心
陕西师范大学计算机学院
中国科学院计算技术研究所智能信息处理重点实验室
青海师范大学藏文信息研究中心
中国科学院 计算技术研究所智能信息处理重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2013年第5期166-172,共7页
-
基金
国家自然科学基金资助项目(61063033,61163018,61363055)
教育部“春晖计划”合作科研资助项目(Z2012102)
-
文摘
依据依存句法理论,该文制订了藏语句法标注体系及层次结构。通过分析构建藏语依存树库中存在的问题,提出了半自动依存树库构建模式,针对藏语特性提出了融合丰富特征的词对依存分类模型和依存边标注模型,实现了依存树库构建可视化工具,校对构建了1.1万句藏语依存句法树后,在基线系统下经实验验证,依存识别正确率提高了3%,使构建藏语依存树库工作取得了有效进展。
-
关键词
藏语依存句法
词对依存分类
藏语树库
藏语依存标注工具
-
Keywords
tibetan dependency syntax
word-pair dependency classification
tibetan Treebank
tibetan dependency annotation tool
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-