摘要
各类办公软件中PDF、Word格式的文档在文字处理和保存等方面的使用率极高,而在藏文PDF文档转换成Word文档中存在乱码和漏读的问题。因此,文章针对此类问题作了相关研究并提出了基于藏文乱码字典的PDF文档转换方法,有效地提高了文本文件转换的正确率。
The use rate of PDF and Word format files are extremely high in various office software such as word processing and storage,and there are problems of garbage characters and missing reading in Tibetan PDF files converted into Word files.There-fore,this paper has done relevant research and proposed solutions to such problems,Effectively improving the accuracy of con-version.
作者
赞拉公
贡保加
完玛道吉
安见才让
ZAN Lagong;GONG Baojia;WAN Madaoji;AN Jiancairang(School of Computer Science of Qinghai Minzu University,Xining Qinghai 810007,China)
出处
《长江信息通信》
2023年第11期117-120,共4页
Changjiang Information & Communications
基金
省部共建藏语智能信息处理及应用国家重点实验室、青海省藏文信息处理与机器翻译重点实验室基金项目(No.2021-Z-001)。