摘要
该文介绍了藏文文本分类技术的研究与进展。首先对现阶段常用的文本表示以及文本特征选择方法进行了分析和比较,接着回顾了藏文在机器学习方面的分类算法特点,深入讨论了不同算法应用在藏文文本分类技术上的研究情况,最后指出了当前藏文文本分类所面临的问题和挑战,并对未来的研究提出了建议。
This article introduces the research and development of Tibetan text classification technology.First,it analyzes and com⁃pares the commonly used text representation and text feature selection methods at this stage,then reviews the characteristics of Ti⁃betan classification algorithms in machine learning,and discusses the application of different algorithms in Tibetan text classifica⁃tion technology.Finally,it points out the current problems and challenges of Tibetan text classification,and puts forward sugges⁃tions for future research.
作者
苏慧婧
群诺
SU Hui-jing;QUN Nuo(School of Information Science and Technology,Tibet University,Lhasa 850000,China)
出处
《电脑知识与技术》
2021年第4期190-192,200,共4页
Computer Knowledge and Technology
基金
西藏自治区教育厅“计算机及藏文信息技术国家级团队和重点实验室建设”(藏教财指〔2018〕81号)
国家重点研发计划项目(2017YFB1402200)。
关键词
藏文文本分类
文本表示
特征选择
机器学习
Tibetan text classification
text representation
feature selection
machine learning