一种改进HRNetV2和聚合注意力的场景解析方法

Scene parsing based on improved HRNetV2 and convergent attention perception

下载PDF

导出

摘要智能化环境和服务的重要基础在于能够对环境进行视觉建模,使其具有视觉识别和理解能力。为此,提出一种用于智能服务机器人的场景解析深度网络模型Shuffle-HRNet以实现自主移动和服务。设计一种Shuffle模块并引入HRNetV2网络,实现不同通道之间的信息交互,降低模型参数量并提高计算效率;提出一种聚合注意力感知模块,使网络关注每个通道中不同的有效特征信息、抑制不相关特征;在SmartLib数据集上对Shuffle-HRNet和主流分割方法进行了对比和消融实验。实验结果表明,Shuffle-HRNet能够对内部环境实现场景解析和准确分割。相比其他方法,Shuffle-HRNet具有更高的分割效率和更低的参数量,可部署于机器人以实现室内场景自主移动进而提供多元化服务。 The key foundation of intelligent service is to be able to visually model a environment and allow robots to possess visual recognition and parsing ability.Scene parsing can be widely applied in such fields as unmanned driving,image retrieval,and medical diagnosis.With the scene parsing technology,the semantic contours of targets in a scene can be detected and segmented.Then the specific semantics of the contours can be identified.Currently,ample research on intelligent libraries has been made based on new generation of information technologies including artificial intelligence.Intelligent robots in libraries can easily perform such tasks as identity recognition,reader guidance,book and informationretrieval,book inventory,reader information query,and intelligent consultation,which are of great value in the application research of intelligent libraries.How to use visual systems to achieve scene parsing and then navigate and act autonomously to achieve intelligent services has important research significance.However,intelligent warehousing for intelligent libraries,automatic inventory robots,and navigation robots,etc.still largely rely on infrared rays,ultrasound,Wi-Fi,Bluetooth,and other technologies for modeling.True intelligence is still far away.In addition,the varied indoor layout of intelligent libraries,the more complex environment and high reader mobility pose other challenges.Existing visual scene parsing technologies are still confronted with issues in terms of high resolution,low latency,lightweight,and edge computing deployment.In recent years,the attention mechanism has developed rapidly in the field of computer vision based on deep learning.By imitating the human visual and cognitive systems,it enables deep learning models to selectively focus on relevant data,thereby efficiently allocating limited computational resources and improving efficiency.This paper presents a scene parsing method Shuffle-HRNet of intelligent library based on convergent attention perception,which allows intelligent service robo

作者张岩孙英伟 ZHANG Yan;SUN Yingwei(Library,Qingdao University of Science and Technology,Qingdao 266000,China;College of Mechanical and Electrical Engineering,Qingdao University of Science and Technology,Qingdao 266000,China)

机构地区青岛科技大学图书馆青岛科技大学机电工程学院

出处《重庆理工大学学报（自然科学）》北大核心 2023年第10期136-145,共10页 Journal of Chongqing University of Technology：Natural Science

基金山东省自然科学基金项目(ZR2019MEE066)。

关键词智慧图书馆场景解析聚合注意力感知计算机视觉人工智能 smart library scene parsing convergent attention perception computer vision artificial intelligence

分类号 TP391.4 [自动化与计算机技术—计算机应用技术] G258.6 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献7

1张晗,郭晶.基于ALA案例分析的北美地区图书馆新兴技术实践及启示[J].图书馆学研究,2021(22):92-100. 被引量：3
2韦景竹,叶彦君.日本图书馆人工智能研究与应用前沿[J].图书馆论坛,2022,42(8):51-61. 被引量：8
3初景利,张国瑞.面向智慧图书馆的馆员能力建设[J].图书馆理论与实践,2022(4):1-4. 被引量：45
4申悦.人工智能机器人在图书馆的设计与实现--以国家图书馆数字图书馆体验区为例[J].图书馆,2020(6):37-41. 被引量：25
5沈奎林,邵波,陈力军.图书馆智能盘点机器人定位研究[J].图书情报导刊,2020,5(7):34-40. 被引量：8
6张海明,史涛.基于改进Faster R-CNN的目标检测算法研究[J].重庆理工大学学报（自然科学）,2022,36(9):179-186. 被引量：11
7巢娅,肖南峰.基于语义分割与脑机接口的机械手抓取方法研究[J].重庆理工大学学报（自然科学）,2020,34(3):128-136. 被引量：3

二级参考文献50

1郑少武,李巍华,胡坚耀.基于激光点云与图像信息融合的交通环境车辆检测[J].仪器仪表学报,2019,40(12):143-151. 被引量：39
2李文汉.美国图书馆协会(ALA)召开第102次年会[J].图书馆学研究,1984(4):148-148. 被引量：1
3甘.美国图书馆学会举行第一百次年会,中国图书馆学会应邀派代表团参加[J].图书情报工作,1981,25(5):45-45. 被引量：1
4庞文尧,钞海洋,罗小平,韦巍.基于超声波的室内移动机器人局部环境建模研究[J].机床与液压,2006,34(7):42-46. 被引量：2
5韦婷,肖南峰.基于数据手套的仿人机械手控制系统[J].计算机工程与设计,2009,30(7):1707-1711. 被引量：8
6王琨,骆敏舟,赵江海.室内移动机器人导航中信息获取方法研究综述[J].机器人技术与应用,2010(2):38-42. 被引量：9
7严向东.美国图书馆协会年会可持续发展因素探析[J].国家图书馆学刊,2012,21(4):88-94. 被引量：7
8伊安·约翰逊,陈旭炎(译).智慧城市、智慧图书馆与智慧图书馆员[J].图书馆杂志,2013,32(1):4-7. 被引量：176
9Johnson,L.,AdamsBecker,S.,Cummins,M.,Estrada,V.,Freeman,A.,Ludgate,H.,张铁道,殷丙山,殷蕾,白晓晶.国际教育信息化2013地平线报告(高等教育版)[J].北京广播电视大学学报,2013(2):7-29. 被引量：50
10李恺.RDA、FRBR和BIBFRAME的最新进展:2013年ALA年会参会笔记[J].数字图书馆论坛,2013(9):32-37. 被引量：10

共引文献95

1尚子娟,莫一梅.元宇宙赋能智慧图书馆的实践逻辑与推进路径[J].理论观察,2024(1):120-125.
2崔秋丽.智慧社会背景下智慧馆员的角色研究[J].传媒论坛,2022,5(22):111-113. 被引量：2
3罗睿,杨恒.再论Windows NT内存堆问题[J].电脑编程技巧与维护,2000(4):34-35.
4高雅平,詹华清.基于人工智能的图书馆建设研究[J].数字图书馆论坛,2020(11):20-26. 被引量：14
5祝婷婷.基于智能机器人技术的智慧图书馆建设研究[J].现代信息科技,2020,4(21):127-129. 被引量：4
6闫慧,高家擎,闫新战,于艺浩.2020年中国图书情报与档案管理领域研究热点回顾[J].情报资料工作,2021,42(2):8-13. 被引量：8
7张敬,朱相丽.中国图书情报档案领域智能技术研究演化分析——基于CiteSpace[J].科学观察,2021,16(3):63-76. 被引量：2
8侯志江.人工智能在图书馆的实施路径研究[J].图书馆工作与研究,2021(6):82-88. 被引量：10
9王大颜,瞿珏.基于脑电指标的指控系统人机界面评价研究[J].兵器装备工程学报,2021,42(11):196-203.
10张精理,巩媛媛,何成竹.智慧图书馆建设和分层结构探讨[J].中华医学图书情报杂志,2021,30(6):70-74. 被引量：2

1张大伟,田抑阳,徐培娟,钟琛.基于E-HRNet的路面破损区域识别方法[J].北京交通大学学报,2023,47(4):110-119. 被引量：2
2张蓓蓓.“互联网+”驱动下医院综合档案多元化服务策略探究[J].黑龙江档案,2023(4):207-209. 被引量：3
3徐广,吴星辰.基于LSA-HRnet网络的人体姿态估计方法在太极拳运动中的应用[J].中南民族大学学报（自然科学版）,2023,42(6):839-845. 被引量：1
4杨红燕.试析图书馆电子阅览室的未来发展[J].中国科技纵横,2023(14):163-165.
5刘治田.多元化服务主体激发公共服务新活力[J].创意世界,2023(10):36-39.
6王婷.主流媒体助力现代化建设[J].文化产业,2023(31):89-91.
7许利恒,江洁,马岩.基于陨石坑的视觉导航技术综述[J].激光与光电子学进展,2023,60(11):172-192.
8张旭.大思政背景下的大学生网络素养创新机制研究[J].中文科技期刊数据库（全文版）教育科学,2023(11):15-17.
9庄旖旎.开放共享的城市生态综合体规划设计——以沂南界湖公园为例[J].城市建筑空间,2023,30(9):31-33.
10陈浩.京铁生达父母食堂运营庆典暨启动仪式在京举办[J].食品界,2023(11):22-22.

重庆理工大学学报（自然科学）

2023年第10期

浏览历史

内容加载中请稍等...

一种改进HRNetV2和聚合注意力的场景解析方法

参考文献7

二级参考文献50

共引文献95

相关作者

相关机构

相关主题

浏览历史