基于自注意力机制增强的深度学习图像压缩被引量：3

A Self-attention Mechanism Augmented Deep Learning Model for Images Compression

下载PDF

导出

摘要提出了一种基于自注意力机制增强的深度学习模型,用于无人机侦察图像的压缩与解压。与现有方法相比,提出的深度学习模型有两个显著特点:其一,模型由四部分组成(编码器、二值化器、量化器和解码器),并且可以通过端到端的优化提高模型的压缩和解压效率;其二,量化器是基于自注意力机制增强的多层前馈神经网络,它能充分利用图像的上下文信息对图像进行压缩。在公开数据集Kodak和Tecnick的实验结果表明,提出模型的压缩率-保真率曲线优于传统的图像压缩标准和现有的深度学习模型。对于常规大小的图像,在保持图像质量MS-SSIM为85%~95%的前提下,图像压缩比BPP能达到7%~15%,并且在普通CPU上其处理速度达0.48秒/张,能显著降低影像的数据大小且不牺牲处理速度。 A self-attention mechanism augmented deep learning model is proposed to compress and decompress the UAV reconnaissance image in this paper.Compared with the existing methods,the proposed deep learning model in this paper has two significant characteristics.Firstly,the model consists of four parts(encoder,binarizer,quantizer and decoder),and the compression and decompression efficiency of the model can be improved through end-to-end optimization.Secondly,the quantizer is a self-attention mechanism augmented multi-layer feedforward neural network,which can make full use of the context information to compress the image.Experimental results on public data sets such as Kodak and Tecnick show that the Bits Per Pixel-Peak Signalto Noise Ratial(BPP-PSNR)curve of the proposed model is better than that of the traditional image compression standards and existing deep learning models.For images with commonly used size,the compression ratio of the model,e.g.BPP,can reach 7%~15%while maintaining the MS-SSIM of 85%~95%,and the processing speed can reach 0.48 s/sheet on the ordinary CPU.The model proposed in this paper can significantly reduce the data size of the compressed image without sacrificing the processing speed.

作者展亚南施晓东孙镱诚丁阳杨万扣 ZHAN Ya-nan;SHI Xiao-dong;SUN Yi-cheng;DING Yang;YANG Wan-kou(The 28th Research Institute of China Electronics Technology Group Corporation,Nanjing 210007,China;School of Automation,Southeast University,Nanjing 211189,China)

机构地区中国电子科技集团公司第二十八研究所东南大学自动化学院

出处《控制工程》 CSCD 北大核心 2022年第3期536-541,共6页 Control Engineering of China

基金装备预先研究项目(301021302)。

关键词图像压缩深度学习自注意力机制端到端多层前馈神经网络 Image compression deep learning self-attention mechanism end-to-end multi-layer feedforward neural network

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献5

1刘东,王叶斐,林建平,马海川,杨闰宇.端到端优化的图像压缩技术进展[J].计算机科学,2021,48(3):1-8. 被引量：7
2曲海成,田小容,刘腊梅,石翠萍.多尺度显著区域检测图像压缩[J].中国图象图形学报,2020,0(1):31-42. 被引量：10
3穆克,李文娜.基于模糊C均值聚类的医学图像压缩算法[J].控制工程,2016,23(5):706-710. 被引量：6
4郭剑,韩崇,施金宏,薛浩天,孙力娟.基于稀疏采样的无线多媒体传感网图像压缩算法[J].太原理工大学学报,2021,52(1):76-82. 被引量：7
5黄迪,刘畅.智能决策系统的深度神经网络加速与压缩方法综述[J].指挥信息系统与技术,2019,10(2):8-13. 被引量：5

二级参考文献23

1Oppelt A. Imaging system for medical diagnostics[M]. Erlangen: Publicis corporate publishing, 2005. 被引量：1
2DICOM Standards committee. Digital imaging and communications in medicine[M]. 2006. 被引量：1
3Bhaskaran V, Konstantinides K.. Image and video compression standards: algorithms and architectures[M]. Boston: Kluwer academic publishers, 1997. 被引量：1
4M.K. Mandal. Multimedia signals and systems[M]. Boston: Kluwer academic publisher, 2002. 被引量：1
5Evgeeny Gershikov, Emilia Lavi-Burlak, and Moshe Porat. Correlation-based approach to color image compression. Signal processing-image Communication[J], 22(2007)9: 719-733. 被引量：1
6Yalon Roterman and Moshe Porat. Color image coding using regional correlation of primary colors[J]. Image and vision computing, 25(2007)5: 637-651. 被引量：1
7European society of radiology (ESR). Usability of irreversible image compression in radiological imaging[J]. A position paper by the European society of radiology (ESR). Insights imaging, 2(2011)2: 103-115. 被引量：1
8M.S. Yang, Y.J. Hu Karen, C.R. Lin, et al. Segmentation techniques for tissue differentiation in MRI of ophthalmology using fuzzy clustering algorithms[J]. Magnetic resonance imaging, 20(2002)2: 173-179. 被引量：1
9GC. Kannakar and L.S. Dooley. A generic fuzzy rule based image segmentation algorithm[J]. Pattern recognition letters, 23(2002)10: 1215-1227. 被引量：1
10Thyagarajan K S. Still image and video compression with Matlab[M]. Hoboken, New Jersey: John Wiley & Sons, Inc., 2011. 被引量：1

共引文献30

1徐曼,谢维,姚斌荣.基于CycleGAN的HDR重建方法研究[J].智能计算机与应用,2023,13(8):180-185.
2张丽娜,鲍蓉,李子龙.网络远程视频图像传输准确性提取仿真[J].计算机仿真,2018,35(4):158-161. 被引量：2
3李亚.多遥测图像数据流的自动拼接与自动优选技术[J].电子技术与软件工程,2018(9):153-153. 被引量：2
4宫海晓,贺杰,耿德志.低码率分形视频图像分层压缩方法仿真[J].计算机仿真,2018,35(7):135-138. 被引量：7
5王晗,施佺,许致火,魏明,邵叶秦.基于模板概率密度函数的车牌定位方法[J].控制工程,2019,26(5):947-951. 被引量：8
6陆明龙,祁玉,孙靖.基于K-shell与贪心策略的社交网络影响力最大化研究[J].江苏科技信息,2019,36(30):40-43.
7包翔,汪满容,刘桂锋.基于小波分解的图书馆图像压缩应用研究[J].数字图书馆论坛,2020(8):56-62.
8季曹婷,马伟锋,陈喆,马来宾,楼姣.个性需求驱动的汽车造型风格智能设计方法[J].浙江科技学院学报,2020,32(6):531-540. 被引量：1
9邱淼淼,柴雄力,邵枫.一种立体全景图像显著性检测模型[J].激光与光电子学进展,2021,58(8):55-66. 被引量：4
10黄河清,胡嘉沛,李震,魏志威,吕石磊.基于模型剪枝改进FCOS的实时柑橘检测研究[J].河南农业大学学报,2021,55(3):453-459. 被引量：3

同被引文献35

1邬群勇,胡振华,张红.基于多源轨迹数据的城市交通状态精细划分与识别[J].交通运输系统工程与信息,2020,20(1):83-90. 被引量：16
2宋廷强,李继旭,张信耶.基于深度学习的高分辨率遥感图像建筑物识别[J].计算机工程与应用,2020,56(8):26-34. 被引量：46
3戴学臻,苑仁腾,王少玲,吴智伟.不同时间间隔下的道路交通状态判别[J].公路交通科技,2020,37(6):112-119. 被引量：5
4徐建闽,韦佳,首艳芳.基于博弈论-云模型的城市道路交通运行状态综合评价[J].广西师范大学学报（自然科学版）,2020,38(4):1-10. 被引量：11
5阚涛,高哲,杨闯.采用分数阶动量的卷积神经网络随机梯度下降法[J].模式识别与人工智能,2020,33(6):559-567. 被引量：18
6花思齐,赵伟,刘建业.基于改进滤波器和图像多尺度变换的背景抑制算法[J].系统工程与电子技术,2020,42(8):1679-1684. 被引量：6
7张波,周芳,李强.基于LSTM模型的北京首都国际机场路面交通拥堵预测[J].数理统计与管理,2020,39(5):761-770. 被引量：14
8谭兆海,李育林,张璇,孙宁,刘文文,杨苏.块LBP-TOP稀疏表示表情与车辆检测技术研究[J].电子技术应用,2020,46(12):53-56. 被引量：1
9刘东,王叶斐,林建平,马海川,杨闰宇.端到端优化的图像压缩技术进展[J].计算机科学,2021,48(3):1-8. 被引量：7
10刘正男,梁美玉.基于腐蚀和分块处理的Criminisi修复算法[J].海南热带海洋学院学报,2021,28(2):73-80. 被引量：2

引证文献3

1崔素萍,卜崇阳.深度学习下交通拥堵路段信息自动识别仿真[J].计算机仿真,2023,40(7):100-104. 被引量：2
2赵美利.基于深度SR模型的加密数字图像压缩与重构[J].成都工业学院学报,2024,27(2):47-51.
3黄梅娟,王永梅.基于尺度特征融合的极低比特率三维复杂图像无损压缩[J].海南热带海洋学院学报,2024,31(5):59-66.

二级引证文献2

1崔金魁.基于深度学习和大数据分析的智慧交通流量预测模型研究[J].信息化研究,2024,50(3):16-22. 被引量：1
2黄嘉怡,汤银英,郭赫臣,李建国,傅健.基于深度学习的铁路货场作业安全状态识别与监控技术研究[J].铁道货运,2024,42(8):41-49.

1无.柯达/迈日伦推出PureFlexo技术拓展柔印疆域[J].广东印刷,2021(5):70-71.
2王炳月,贾连印,范瑶,孙劭文.一种优化的灰度图像压缩算法[J].电视技术,2022,46(5):17-23.
3王海琳,韩正昊,李力,裘溯,金伟其.基于残差和高频替换的SONY-RGBW阵列彩色重构方法[J].激光与光电子学进展,2021,58(20):58-70. 被引量：3
4李高平.分形与压缩感知理论相结合的图像编码算法研究[J].西南民族大学学报（自然科学版）,2022,48(3):297-302. 被引量：1
5陈鹏宇.率真与含蓄--浅谈韦庄词的艺术风格[J].名作欣赏（评论版）（中旬）,2022(6):60-63.
6韩玮栋,王长建.基于优化BP神经网络的钻井事故预测研究[J].中国石油和化工标准与质量,2022,42(8):118-120.
7黄文俊,元辉,李富勇,魏锡彦.Bayer图像的无损压缩算法及其硬件实现[J].电子设计工程,2022,30(11):183-188.
8王顺江,欧秀容,李志伟,辛红伟,祝国强.多机励磁电力系统自适应输出反馈量化控制[J].控制工程,2022,29(5):781-788.
9赵杨俊,胡冰,杨建功.柯达全胜CTP使用心得[J].印刷工业,2021(6):49-50.
10陈世明,姜根兰,张正.通信受限的多智能体系统二分实用一致性[J].自动化学报,2022,48(5):1318-1326. 被引量：9

控制工程

2022年第3期

浏览历史

内容加载中请稍等...

基于自注意力机制增强的深度学习图像压缩被引量：3

参考文献5

二级参考文献23

共引文献30

同被引文献35

引证文献3

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于自注意力机制增强的深度学习图像压缩 被引量：3

参考文献5

二级参考文献23

共引文献30

同被引文献35

引证文献3

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于自注意力机制增强的深度学习图像压缩被引量：3