-
题名乌金印刷多字体藏文的文本检测与识别
被引量:2
- 1
-
-
作者
侯闫
高定国
高红梅
-
机构
西藏大学信息科学技术学院
-
出处
《计算机工程与设计》
北大核心
2023年第4期1058-1065,共8页
-
基金
国家自然科学基金项目(62166038)
西藏大学研究生高水平人才培养计划基金项目(2020-GSP-S177)。
-
文摘
为解决乌金印刷多字体藏文的文本识别以字丁识别为主、识别字体类别单一或较少、无法实现端到端的藏文文本行识别等问题,根据藏文文字的书写特点,在基于分割的文本检测方法DBNet上,对比在MobileNetV3和ResNet34两种骨干网络下CRNN、Rosetta和RARE这3种端到端的文本识别算法;提出一种将常用74个藏文字符作为端到端文字识别的转录字典策略,提出一个针对藏文文本识别的评价指标。实验结果表明,以ResNet34为骨干网络的CRNN文本识别方法在测试集上的综合表现最佳。
-
关键词
藏文
乌金字体
多种字体
深度学习
文本检测
文本识别
端到端
-
Keywords
tibetan
Wujin font
multiple fonts
deep learning
text detection
text recognition
end to end
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于双注意力YOLOv5的场景藏文检测
- 2
-
-
作者
才让当知
黄鹤鸣
范玉涛
樊永红
-
机构
青海师范大学计算机科学与技术学院
青海师范大学省部共建藏语智能信息处理及应用国家重点实验室
青海师范大学藏文信息处理教育部重点实验室
-
出处
《计算机工程与设计》
北大核心
2023年第11期3411-3419,共9页
-
基金
国家自然科学基金项目(62066039、62166034)
青海省自然科学基金项目(2022-ZJ-925)。
-
文摘
为有效提高场景藏文文本检测性能,提出一种基于双注意力YOLOv5的场景藏文检测框架,简称为YOLOv5 Dual-attention。通过在YOLOv5模型上下采样层之间采用背景抑制模块,聚合多尺度的初始特征,抑制卷积特征中的背景干扰;在YOLOv5的颈部和检测头中间嵌入卷积注意力提高卷积提取特征的能力,使网络具有精确推断文本的能力。实验结果表明,在二分类MSTD500测试集上,改进后的模型YOLOv5x Dual-attention+α-IoU对单类藏文场景文本检测的F1达到了84.65%,比目前最好的同类检测结果高出12.65个百分点,有效降低了文本目标漏检和误检可能性。
-
关键词
藏文检测
场景文本检测
通道注意力
空间注意力
双注意力
损失函数
小目标文本检测
-
Keywords
tibetan text detection
scene text detection
channel attention
spatial attention
dual-attention
loss function
small target text detection
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名手写多字体藏文古籍文本检测方法研究
被引量:4
- 3
-
-
作者
芷香香
高定国
-
机构
西藏大学信息科学技术学院
-
出处
《高原科学研究》
CSCD
2022年第2期89-101,共13页
-
基金
国家自然科学基金项目(62166038)
西藏大学研究生高水平人才培养计划项目(00060701).
-
文摘
为更好利用和挖掘藏文古籍文献内容,文章首先研究了手写藏文古籍文本的特点,按照其字形大小构建了3种数据集;其次采用PSENet、PixelLink、PANNet 3种基于分割的深度学习文本检测算法对多种字体的手写藏文古籍文本进行了检测;再评估了3种算法对手写藏文古籍文本的检测性能,分析了3种算法检测多种手写藏文古籍字体和字形大小的效果,指出了在同库实验中PSENet和PANNet性能优于Pixel⁃Link,跨库实验中PixelLink性能优于PSENet和PANNet。
-
关键词
藏文古籍
多字体
文本检测
PSENet
PixelLink
PANNet
-
Keywords
tibetan ancient books
multifont
text detection
PSENet
PixelLink
PANNet
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-