-
题名基于双塔结构的场景文字检测模型
被引量:2
- 1
-
-
作者
施漪涵
仝明磊
张魁
姚宏扬
-
机构
上海电力大学电子与信息工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2022年第3期242-248,共7页
-
基金
上海市自然科学基金(16ZR1413300)。
-
文摘
当图像中文字区域形状复杂多变时,传统锚点方法难以精确定位文字,针对这一问题,提出一种具有双塔结构的文字分割检测算法。在网络中增加自下而上的特征增强路径以充分提炼语义信息,与上一级自上而下的结构形成双金字塔模型;接着新增一条路径缩短较底层与最顶层特征之间的距离,同时使用膨胀卷积,增大卷积核的感受野;在损失函数的设计中引入γ参数,改变图像中正负样本的权重分配,使网络更关注困难样本。在标准数据集ICDAR2015和ICDAR2017上进行评估,实验结果表明提出的双塔结构模型能有效提高网络对文字区域的检测准确度。
-
关键词
卷积神经网络
特征融合
文字检测
图像分割
-
Keywords
convolutional neural network
feature fusion
text detection
image segmentation
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
TP18
[自动化与计算机技术—计算机科学与技术]
-
-
题名具有仿射变换锚点的文字检测方法
被引量:1
- 2
-
-
作者
仝明磊
姚宏扬
-
机构
上海电力大学电子与信息工程学院
-
出处
《上海电力大学学报》
CAS
2021年第1期99-103,共5页
-
文摘
针对现实场景图片中的文字区域具有仿射变换和多方向的问题,设计了一种带有仿射变换锚点,能够生成仿射变换文本预测框的文本检测网络。按照常见文字实例的仿真变换形状,给定了6种固定角度和5个固定变换量。检测过程中对预测候选框的角度和偏移值进行了调整拟合,最后对边框进行了回归,让检测结果更适应真实文字区域的边界框。与以往的文字检测网络相比,该检测方法能够有效适应文字区域,在检测精度和平均指标上分别有了7%和10%的提升。
-
关键词
自然场景
文字检测
仿射变换
锚点
卷积网络
-
Keywords
natural scene
text detection
affine transformation
anchor
convolutional network
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名影响拓展训练在高校中发展的因素分析
被引量:1
- 3
-
-
作者
孟凡会
王浩
姚宏扬
-
机构
黑龙江八一农垦大学军事体育部
东北石油大学体育部
大庆市文体旅集团
-
出处
《当代体育科技》
2014年第19期20-21,共2页
-
基金
黑龙江哲学社会科学基金资助项目
项目编号:13C036
-
文摘
拓展训练作为一种适合现代生活的体育训练方式,对提升体育教学的吸引力和实效性产生良好的推动作用,但目前高校在探索中遇到了困难,本文在充分阐述其价值的基础上,从安全、资金、师资等方面对制约因素进行分析,并针对性地提出改革措施,以促进拓展训练在高校的普及与推广。
-
关键词
高校体育
拓展训练
研究
-
分类号
G807.4
[文化科学—体育训练]
-
-
题名浅析现代化多媒体技术与高校教育的深度融合
- 4
-
-
作者
姚宏扬
-
机构
新疆医科大学医学工程技术学院
-
出处
《中文科技期刊数据库(全文版)教育科学》
2023年第9期153-155,共3页
-
文摘
现代化信息通信与多媒体的发展促进教育形式的多样化,丰富多彩的知识表达形式从多种方式让学生感知和接受。基于现有理论和实际教学实践,现代化多媒体的教育形式目前主要采用多媒体影音教学、虚拟现实课堂和线上慕课课程三种形式,体现了由传统教育教学模式向科技助力现代化教育的时代趋势。三种形式经历了不同的发展历程,改进了教育教学环境、创新教学模式,优化了教师与学生的沟通交流,通过多媒体技术提供更多知识展示形式,突出现代化教育的便捷学习、高效学习、全面学习,形成稳定发展的现代化创新教育教学体系的同时为未来教育提供无限潜能。
-
关键词
现代化教育
多媒体
虚拟现实
慕课
-
分类号
G642
[文化科学—高等教育学]
-
-
题名面向多角度文字检测的旋转交并比神经网络
- 5
-
-
作者
姚宏扬
仝明磊
施漪涵
-
机构
上海电力大学电子与信息工程学院
-
出处
《计算机应用与软件》
北大核心
2023年第2期230-235,共6页
-
文摘
边界框回归是文字检测中关键的步骤,为了更好地预测边界框和收敛网络参数,在Faster RCNN目标检测算法的基础上提出一种利用旋转交并比损失函数的神经网络。该损失函数根据文字检测的评价指标而设计,增加预测框的角度参数,将其与宽和高的参数一起代入损失函数的惩罚项,代替了原版用于边界框回归的smooth L1损失函数,转化为交并比的损失向神经网络进行反向传播,并着重优化边界框的方向信息,通过设计与角度惩罚项相同的阈值运算作为非极大值抑制来输出检测结果。在公开文字检测数据集ICDAR2015上的实验结果表明,该方法有效提高了网络的收敛速度和检测精准度,比原方法综合提升11百分点左右。
-
关键词
文字检测
神经网络
损失函数
边界框回归
交并比
-
Keywords
Text detection
Neural networks
Loss function
Bounding box regression
Intersection over union ratio
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-