-
题名基于组块分割的无监督藏文句法分析方法研究
- 1
-
-
作者
卓玛扎西
才让加
色差甲
班玛宝
-
机构
青海师范大学计算机学院
藏语智能信息处理及应用国家重点实验室
青海省藏文信息处理工程技术研究中心
-
出处
《计算机仿真》
北大核心
2022年第5期278-282,328,共6页
-
基金
国家自然科学基金资助项目(61662061,61063033)
青海省藏文信息处理与机器翻译重点实验室(2020-ZJ-Y05)。
-
文摘
由于藏文句法树库的构建在藏语自然语言处理中是一项专业性强及费时费力的工作,目前还没有公开的藏文句法树库,这一现状导致有监督方法在藏文句法分析任务中的运用存在较大困难。鉴于此,提出了一种基于组块分割的无监督藏文句法分析方法,首先对藏文组块进行了定义和分割,然后在此基础上提出无监督藏文句法分析方法并设计了藏文句法优化算法。提出的方法在不同句子长度和不同领域分布的各类测试集上都取得了显著效果,优于基准方法的结果,证实了提出的方法在缺少标记数据的设定下的有效性。
-
关键词
自然语言处理
组块分割
无监督
藏文句法分析
-
Keywords
NLP
Chunk segmentation
Unsupervised
Tibetan syntactic analysis
-
分类号
TP391.9
[自动化与计算机技术—计算机应用技术]
-