-
题名基于Bi-LSTM的藏文依存句法分析研究
被引量:2
- 1
-
-
作者
李铂钧
项秀才让
德吉卡卓
群诺
-
机构
西藏大学信息科学技术学院
西藏信息化省部共建协同创新中心
藏文信息技术教育部工程研究中心
-
出处
《计算机仿真》
北大核心
2023年第7期300-304,共5页
-
基金
国家自然科学基金(62162057)
西藏大学研究生高水平人才培养计划项目(2019-GSP-S116)
+1 种基金
西藏大学珠峰学科建设计划项目(zf22002001)
国家级教育部产学合作协同育人项目(202101 001017)。
-
文摘
藏语句法分析目前的研究集中在藏语言的成分句法分析。采用深度学习的方式进行藏语依存句法分析的研究方面基本处于空白状态。基于转移的依存句法分析是一种快速有效的依存句法分析方法,当句子输入到基于转移依存解析器后,解析器从左到右预测一系列解析动作。结合藏文的特点,构建了CoNLL-U格式的藏文依存树库,提出了一种基于双向LSTM的依存句法解析器,并采用注意力机制学习转移解析过程中解析器状态的表示,通过捕获更多的信息特征来对解析器的全局状态进行建模。在构建的藏文依存树库上进行实验,将堆栈信息、词性信息、历史转移动作信息作为模型的辅助信息,进行更深层次句法特征信息学习。实验表明上述模型对藏文的依存句法分析有较为显著的效果。
-
关键词
双向长短期记忆网络
注意力机制
藏文句法分析
依存句法分析
-
Keywords
Bi-LSTM
Attention mechanism
Tibetan syntactic analysis
Dependency parsing
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于组块分割的无监督藏文句法分析方法研究
- 2
-
-
作者
卓玛扎西
才让加
色差甲
班玛宝
-
机构
青海师范大学计算机学院
藏语智能信息处理及应用国家重点实验室
青海省藏文信息处理工程技术研究中心
-
出处
《计算机仿真》
北大核心
2022年第5期278-282,328,共6页
-
基金
国家自然科学基金资助项目(61662061,61063033)
青海省藏文信息处理与机器翻译重点实验室(2020-ZJ-Y05)。
-
文摘
由于藏文句法树库的构建在藏语自然语言处理中是一项专业性强及费时费力的工作,目前还没有公开的藏文句法树库,这一现状导致有监督方法在藏文句法分析任务中的运用存在较大困难。鉴于此,提出了一种基于组块分割的无监督藏文句法分析方法,首先对藏文组块进行了定义和分割,然后在此基础上提出无监督藏文句法分析方法并设计了藏文句法优化算法。提出的方法在不同句子长度和不同领域分布的各类测试集上都取得了显著效果,优于基准方法的结果,证实了提出的方法在缺少标记数据的设定下的有效性。
-
关键词
自然语言处理
组块分割
无监督
藏文句法分析
-
Keywords
NLP
Chunk segmentation
Unsupervised
Tibetan syntactic analysis
-
分类号
TP391.9
[自动化与计算机技术—计算机应用技术]
-