-
题名基于分段线性激活的多任务行人目标检测识别算法研究
- 1
-
-
作者
朱亚旋
张达明
尹荣彬
吴继超
-
机构
一汽(南京)科技开发有限公司
-
出处
《汽车文摘》
2024年第4期38-43,共6页
-
文摘
通过在已有检测网络结构的基础上增加解耦预测支路,实现了车载摄像头下行人位置、人头位置、行人年龄与遮挡属性识别任务,经过试验论证了分类支路在不同网络位置对检测性能的影响。针对网络部署中一些非线性激活函数算子不受工程环境支持这一问题,提出了一种使用分段线性函数来拟合非线性激活函数的方法。经过验证表明,该方法既提升了网络识别的性能又为工程部署提供了便捷性。
-
关键词
多任务识别
解耦预测
拟合非线性
激活函数
-
Keywords
Multi-task recognition
Decoupling prediction
Nonlinear fitting
Activation function
-
分类号
TP277
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名融合字符结构特征的多任务老挝语文字识别研究
- 2
-
-
作者
陈琢
周兰江
郝永彬
张建安
-
机构
昆明理工大学信息工程与自动化学院
战略支援部队信息工程大学三院昆明大队
-
出处
《中文信息学报》
CSCD
北大核心
2023年第4期34-44,共11页
-
基金
国家自然科学基金(61662040)。
-
文摘
老挝语属于资源稀缺型语言,直接从互联网中获取老挝语文本语料较为困难,老挝语文字识别研究可在有限的图片文本资源中获取更多的老挝语文本语料。在开展老挝文字光学字符识别的研究工作中,针对老挝单字符误切分、上/下位元音以及音调识别位置存在偏差和相似老挝字符的识别问题,该文研究了老挝字符书写等级和下位辅音,提出一种有效融合老挝字符结构特征的多任务字符识别方法。首先,利用深度残差网络提取字符图片中的老挝字符结构特征,通过边框回归矫正单字符包围框;其次,将已矫正切分结果和提取的字符特征作为联合输入,通过双向长短时记忆网络预测老挝字符序列,利用连接主义时间分类对预测结果进行序列对齐;最后,根据老挝字符固定组合优化模型预测结果。实验结果表明:该方法可以精确识别已切分的老挝字符序列,字符错误率指标低至13.06%。
-
关键词
老挝印刷字符识别
老挝字符结构特征
多任务识别
端到端模型
-
Keywords
Lao printed characters'recognition
Lao characters structural features
multi-task recognition
end-to-end model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-