-
题名基于语料库的古藏文文献字符统计研究
- 1
-
-
作者
三智多杰
祁坤钰
久仙加
-
机构
西北民族大学中国民族信息技术研究院
西北民族大学中国语言文学学部
-
出处
《西北民族大学学报(自然科学版)》
2023年第1期54-62,共9页
-
基金
国家自然科学基金项目“敦煌古藏文文献中唐代汉藏文化交流研究”(Z21100)
中央高校基本科研业务费专项资金“藏语句法树库构建及句法分析模型研究”(31920190113)
甘肃省优秀研究生“创新之星”项目“大数据背景下敦煌藏文文献语料库字频统计研究”(2022CXZX-186)。
-
文摘
古藏文字符统计研究能够对机器翻译以及从海量文本中快速定位核心内容、情报收集工作等有着重要意义.目前,藏文字符统计研究主要依据现代藏文语料库.文章以敦煌藏文文献为主,构建了古藏文文献标注语料库.在此基础上,应用python语言设计出古藏文频率统计软件,对古藏文和现代藏文的元音、辅音、藏文数字频次等进行对比分析,归纳出古藏文字符的分布特征,以期为古藏文标注语料库的构建和研究提供参考.
-
关键词
敦煌古藏文文献
古藏文语料库
字符统计
-
Keywords
Dunhuang Ancient Tibetan literature
Corpus of ancient Tibetan
Statistical characters
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于敦煌古藏文语料库的字词属性统计研究
- 2
-
-
作者
三智多杰
祁坤钰
久仙加
-
机构
西北民族大学中国民族信息技术研究院
西北民族大学中国寓言文学部
-
出处
《情报工程》
2023年第2期117-127,共11页
-
基金
国家自然科学基金项目敦煌古藏文文献中唐代汉藏文化交流研究(Z21100)
中央高校基本科研业务费专项资金藏语句法树库构建及句法分析模型研究(31920190113)
甘肃省优秀研究生“创新之星”项目大数据背景下敦煌藏文文献语料库字频统计研究(2022CXZX-186)。
-
文摘
[目的/意义]古藏文字符统计研究能够对机器翻译,以及从海量文本中快速定位核心内容,对情报收集工作有着重要意义。目前,藏文字符统计研究主要依据现代藏文语料库,忽视了古藏文语料库的字符统计研究。[方法/过程]本文以敦煌藏文文献为主,构建了古藏文文献标注语料库。在此基础上,应用python语言设计出古藏文频率统计软件,对古藏文和现代藏文的元音、辅音、藏文音节频次等方面进行对比分析。[结果/结论]归纳出古藏文字符的分布特征,以期为古藏文标注语料库构建和藏文文字特征研究提供参考。
-
关键词
敦煌古藏文文献
古藏文语料库
字符统计
-
Keywords
Dunhuang Ancient Tibetan literature
Corpus of ancient Tibetan
Statistical characters
comparison between ancient and modern Tibetan
-
分类号
G35
[文化科学—情报学]
-