期刊文献+
共找到37篇文章
< 1 2 >
每页显示 20 50 100
亨利·詹姆斯《德莫福夫人》中的全景敞视与医学凝视
1
作者 王跃洪 郝天昕 《上海理工大学学报(社会科学版)》 2018年第3期236-240,共5页
亨利·詹姆斯早期短篇小说《德莫福夫人》反映了作者对女性的关注,表现了对意识中心叙事手法的实验性运用,该作品中女主人公的故事是在他人的"凝视"下展开的。运用米歇尔·福柯的凝视理论,从空间结构、全景敞视和医... 亨利·詹姆斯早期短篇小说《德莫福夫人》反映了作者对女性的关注,表现了对意识中心叙事手法的实验性运用,该作品中女主人公的故事是在他人的"凝视"下展开的。运用米歇尔·福柯的凝视理论,从空间结构、全景敞视和医学凝视等角度解读《德莫福夫人》中女性作为附属品被父权社会物化的地位。詹姆斯在该小说中描写了不甘于被男性操控、争取将命运掌握在自己手中的德莫福夫人的女性形象,体现了詹姆斯对女性地位的人文关怀以及对父权社会的批判。 展开更多
关键词 米歇尔·福柯的凝视理论 亨利·詹姆斯 《德莫福夫人》 全景敞视 医学凝视
下载PDF
科层式规训:政府排名的设置逻辑与作用机制 被引量:7
2
作者 毛庆铎 甘甜 《公共行政评论》 CSSCI 北大核心 2022年第2期60-77,196,197,共20页
排名不仅是我国推动政策落实的常见政策工具,更是形成组织关系的权力表征。在科层制理论框架下,理想化的权威类型与现实中的支配方式之间存在张力。如何调和化解这一张力?为此,论文引入规训权力视角,通过构建“科层式规训”框架予以解... 排名不仅是我国推动政策落实的常见政策工具,更是形成组织关系的权力表征。在科层制理论框架下,理想化的权威类型与现实中的支配方式之间存在张力。如何调和化解这一张力?为此,论文引入规训权力视角,通过构建“科层式规训”框架予以解释。这一目标主要通过两方面的过程实现:规训技术一方面能使权威的行使变得更加潜在和巧妙,另一方面则能使权力的运行更有效地嵌入科层结构中。排名是此框架下最具代表性的规训技术。通过全景敞视、分配权力、知识权力三条设置逻辑和层级监视、规范性裁决、检查三条作用机制,权威基础与科层制之间的内在张力被缓解。研究尝试联结科层制与规训理论,既能在经验上解释政府排名的功能意涵,也对后现代公共行政的潮流作出回应。 展开更多
关键词 排名 权力 科层制 规训 全景敞视
下载PDF
Panoptic UAV:Panoptic Segmentation of UAV Images for Marine Environment Monitoring
3
作者 Yuling Dou Fengqin Yao +7 位作者 Xiandong Wang Liang Qu Long Chen Zhiwei Xu Laihui Ding Leon Bevan Bullock Guoqiang Zhong Shengke Wang 《Computer Modeling in Engineering & Sciences》 SCIE EI 2024年第1期1001-1014,共14页
UAV marine monitoring plays an essential role in marine environmental protection because of its flexibility and convenience,low cost and convenient maintenance.In marine environmental monitoring,the similarity between... UAV marine monitoring plays an essential role in marine environmental protection because of its flexibility and convenience,low cost and convenient maintenance.In marine environmental monitoring,the similarity between objects such as oil spill and sea surface,Spartina alterniflora and algae is high,and the effect of the general segmentation algorithm is poor,which brings new challenges to the segmentation of UAV marine images.Panoramic segmentation can do object detection and semantic segmentation at the same time,which can well solve the polymorphism problem of objects in UAV ocean images.Currently,there are few studies on UAV marine image recognition with panoptic segmentation.In addition,there are no publicly available panoptic segmentation datasets for UAV images.In this work,we collect and annotate UAV images to form a panoptic segmentation UAV dataset named UAV-OUC-SEG and propose a panoptic segmentation method named PanopticUAV.First,to deal with the large intraclass variability in scale,deformable convolution and CBAM attention mechanism are employed in the backbone to obtain more accurate features.Second,due to the complexity and diversity of marine images,boundary masks by the Laplacian operator equation from the ground truth are merged into feature maps to improve boundary segmentation precision.Experiments demonstrate the advantages of PanopticUAV beyond the most other advanced approaches on the UAV-OUC-SEG dataset. 展开更多
关键词 panoptic segmentation UAV marine monitoring attention mechanism boundary mask enhancement
下载PDF
Segmentation Based Real Time Anomaly Detection and Tracking Model for Pedestrian Walkways
4
作者 B.Sophia D.Chitra 《Intelligent Automation & Soft Computing》 SCIE 2023年第6期2491-2504,共14页
Presently,video surveillance is commonly employed to ensure security in public places such as traffic signals,malls,railway stations,etc.A major chal-lenge in video surveillance is the identification of anomalies that... Presently,video surveillance is commonly employed to ensure security in public places such as traffic signals,malls,railway stations,etc.A major chal-lenge in video surveillance is the identification of anomalies that exist in it such as crimes,thefts,and so on.Besides,the anomaly detection in pedestrian walkways has gained significant attention among the computer vision communities to enhance pedestrian safety.The recent advances of Deep Learning(DL)models have received considerable attention in different processes such as object detec-tion,image classification,etc.In this aspect,this article designs a new Panoptic Feature Pyramid Network based Anomaly Detection and Tracking(PFPN-ADT)model for pedestrian walkways.The proposed model majorly aims to the recognition and classification of different anomalies present in the pedestrian walkway like vehicles,skaters,etc.The proposed model involves panoptic seg-mentation model,called Panoptic Feature Pyramid Network(PFPN)is employed for the object recognition process.For object classification,Compact Bat Algo-rithm(CBA)with Stacked Auto Encoder(SAE)is applied for the classification of recognized objects.For ensuring the enhanced results better anomaly detection performance of the PFPN-ADT technique,a comparison study is made using Uni-versity of California San Diego(UCSD)Anomaly data and other benchmark data-sets(such as Cityscapes,ADE20K,COCO),and the outcomes are compared with the Mask Recurrent Convolutional Neural Network(RCNN)and Faster Convolu-tional Neural Network(CNN)models.The simulation outcome demonstrated the enhanced performance of the PFPN-ADT technique over the other methods. 展开更多
关键词 panoptic segmentation object detection deep learning tracking model anomaly detection pedestrian walkway
下载PDF
告状:一种全景敞视的“恶” 被引量:3
5
作者 刘晓静 《基础教育》 CSSCI 2014年第4期13-18,共6页
政治思想家汉娜·阿伦特认为二战期间阿道夫·艾希曼之徒的行为是"平庸之恶"。此类人不是恶魔,不是虐待狂,却帮助纳粹完成了屠杀犹太人的"任务"。告状作为日常生活之一现象,告状者并非十恶不赦之人,只是芸... 政治思想家汉娜·阿伦特认为二战期间阿道夫·艾希曼之徒的行为是"平庸之恶"。此类人不是恶魔,不是虐待狂,却帮助纳粹完成了屠杀犹太人的"任务"。告状作为日常生活之一现象,告状者并非十恶不赦之人,只是芸芸众生之一,但他完成了全景敞视的"庸俗的恶"之功能。此全景敞视的恶,由教育生产与再生产而来,亦有其深刻的社会-文化根源:对人性的善恶评价、集体主义的极权统治。能否逃逸出该全景敞视的"监狱",如何逃逸?是个永久的问号也是一个警示。或许对"群"的再思考乃可能之途径。 展开更多
关键词 告状 全景敞视 庸俗的恶 教育再生产 权力
下载PDF
“Where Angels Fear to Tread, Fools Will.” Who Is in Control of Your Sexual Health? A Discursive Examination of Self-Surveillance in an HIV and AIDS Prevention Campaign
6
作者 Irene M.M.Segopolo 《Language and Semiotic Studies》 2018年第4期65-83,共19页
The global community witnessed vigorous and aggressive campaigns in the past three decades since the advent of HIV and AIDS. Various strategies have been used in this regard in order to advocate safer sex practices am... The global community witnessed vigorous and aggressive campaigns in the past three decades since the advent of HIV and AIDS. Various strategies have been used in this regard in order to advocate safer sex practices among the youth. The article argues that although three decades later, HIV infections are reported to be declining in the regions that were worst hard hit, specifically southern Africa, and there is still a need to promote condom-use among youth aged between 15 and 25. Through text and reception analysis, the article examines discourses of sexual self-responsibility in a purposively selected poster(advocating condom-use) from a host of HIV and AIDS prevention posters and banners advocating HIV and AIDS prevention in 2006-2009, from the University of KwaZulu-Natal, South Africa. Informed by Foucault's notion of the "panoptic gaze" and "techniques of the self", an in-depth textual analysis of the posters is conducted. Norman Fairclough's CDA, augmented by Thompson's ideologies and Kress and van Leeuwen's The Grammar of Visual Design, are used to reveal the language and visual strategies used by the originators of the posters to reveal risk governmentality that may be subsumed in the interplay between the verbal and non-verbal features used in the texts. Furthermore, Hall's reception theory is employed to reveal responses of the students through Focus Group Discussions. The article analyses the discursive self "I" and the second-person deictic pronoun "You" as strategies employed by the campaigns to promote self-surveillance and individual agency. The article argues for continued efforts in condom promotion to reduce HIV infections and while doing so, for the inclusion of youth in designing prevention messages. 展开更多
关键词 risk SELF RESPONSIBILITY discourse analysis panoptic GAZE
原文传递
The Plural in the Singular, Cities and Disciplinary Batallions? -- Interdisciplinary Approaches Facing Nowadays Environmental Challenges 被引量:2
7
作者 Christian Sallenave 《Journal of Civil Engineering and Architecture》 2012年第12期1635-1640,共6页
Towns' and cities' stories show their multidisciplinary richness and their complexity between professional skills and ways of life and residence of inhabitants by the analysis of the towns' changes. Through two pro... Towns' and cities' stories show their multidisciplinary richness and their complexity between professional skills and ways of life and residence of inhabitants by the analysis of the towns' changes. Through two protocols of research, during ten years from 2003 to 2012 and so on, of metropolitan changes in Bordeaux and travels in French and European cities, Christian Sallenave shows that: When everyone can write, tell and recognize his own story of town's changes, the cities know the best conditions for their sustainable development; Neither particular, nor general, but both in their specific dialectic; Neither panoptical and sovereign disciplines nor judgmental dopes, but both in their coming and goings and their "patriotic" property and register. The towns' stories are always written and marked in the same time in plural and singular, of arts, sciences and knowledge and pragmatic ways of life and residence. 展开更多
关键词 Sustainable development judgmental dopes panoptical and sovereign disciplines towns' stories plural and singular arts sciences professional skills and pragmatic ways of life and residence.
下载PDF
A Fast Panoptic Segmentation Network for Self-Driving Scene Understanding
8
作者 Abdul Majid Sumaira Kausar +1 位作者 Samabia Tehsin Amina Jameel 《Computer Systems Science & Engineering》 SCIE EI 2022年第10期27-43,共17页
In recent years,a gain in popularity and significance of science understanding has been observed due to the high paced progress in computer vision techniques and technologies.The primary focus of computer vision based... In recent years,a gain in popularity and significance of science understanding has been observed due to the high paced progress in computer vision techniques and technologies.The primary focus of computer vision based scene understanding is to label each and every pixel in an image as the category of the object it belongs to.So it is required to combine segmentation and detection in a single framework.Recently many successful computer vision methods has been developed to aid scene understanding for a variety of real world application.Scene understanding systems typically involves detection and segmentation of different natural and manmade things.A lot of research has been performed in recent years,mostly with a focus on things(a well-defined objects that has shape,orientations and size)with a less focus on stuff classes(amorphous regions that are unclear and lack a shape,size or other characteristics Stuff region describes many aspects of scene,like type,situation,environment of scene etc.and hence can be very helpful in scene understanding.Existing methods for scene understanding still have to cover a challenging path to cope up with the challenges of computational time,accuracy and robustness for varying level of scene complexity.A robust scene understanding method has to effectively deal with imbalanced distribution of classes,overlapping objects,fuzzy object boundaries and poorly localized objects.The proposed method presents Panoptic Segmentation on Cityscapes Dataset.Mobilenet-V2 is used as a backbone for feature extraction that is pre-trained on ImageNet.MobileNet-V2 with state-of-art encoder-decoder architecture of DeepLabV3+with some customization and optimization is employed Atrous convolution along with Spatial Pyramid Pooling are also utilized in the proposed method to make it more accurate and robust.Very promising and encouraging results have been achieved that indicates the potential of the proposed method for robust scene understanding in a fast and reliable way. 展开更多
关键词 panoptic segmentation instance segmentation semantic segmentation deep learning computer vision scene understanding autonomous applications atrous convolution
下载PDF
全景分割研究综述 被引量:8
9
作者 徐鹏斌 瞿安国 +1 位作者 王坤峰 李大字 《自动化学报》 EI CAS CSCD 北大核心 2021年第3期549-568,共20页
在计算机视觉领域,全景分割是一个新颖且重要的研究主题,它是机器感知、自动驾驶等新兴前沿技术的基石,具有十分重要的研究意义.本文综述了基于深度学习的全景分割研究的最新进展,首先总结了全景分割任务的基本处理流程,然后对已发表的... 在计算机视觉领域,全景分割是一个新颖且重要的研究主题,它是机器感知、自动驾驶等新兴前沿技术的基石,具有十分重要的研究意义.本文综述了基于深度学习的全景分割研究的最新进展,首先总结了全景分割任务的基本处理流程,然后对已发表的全景分割工作基于其网络结构特点进行分类,并进行了全面的介绍与分析,最后对全景分割任务目前面临的问题以及未来的发展趋势做出了分析,并针对所面临的问题提出了一些切实可行的解决思路. 展开更多
关键词 全景分割 语义分割 实例分割 深度学习
下载PDF
基于分组卷积进行特征融合的全景分割算法 被引量:8
10
作者 冯兴杰 张天泽 《计算机应用》 CSCD 北大核心 2021年第7期2054-2061,共8页
针对图像全景分割任务对于实践应用中现有网络结构运算不够快速的问题,提出一种基于分组卷积进行特征融合的全景分割算法。首先,通过自底向上的方式选择经典残差网络结构(ResNet)进行特征提取,并采用不同扩张率的空洞卷积空间金字塔池... 针对图像全景分割任务对于实践应用中现有网络结构运算不够快速的问题,提出一种基于分组卷积进行特征融合的全景分割算法。首先,通过自底向上的方式选择经典残差网络结构(ResNet)进行特征提取,并采用不同扩张率的空洞卷积空间金字塔池化操作(ASPP)对提取到的特征进行语义分割与实例分割的多尺度特征融合;然后,通过提出一种单路分组卷积上采样方法,整合语义与实例特征进行上采样特征融合至指定大小;最后,通过对语义分支、实例分支以及实例中心点这三个分支进行损失函数运算以得到更加精细的全景分割输出结果。该模型在CityScapes数据集上与注意力引导的联合全景分割网络(AUNet)、全景特征金字塔网络(Panoptic FPN)、亲和金字塔单阶段实例分割算法(SSAP)、联合全景分割网络(UPSNet)、Panoptic-DeepLab等方法进行了实验对比。实验结果表明,与对比方法中表现最好的Panoptic-DeepLab模型相比,所提模型在极大减少了解码网络参数量的情况下,全景分割质量(PQ)值为0.565,仅下降了0.003,在建筑物、火车、自行车等物体的分割质量上有0.3~5.5的提升,平均精确率(AP)、目标IoU阈值超过50%的平均精确率(AP50)分别提升了0.002与0.014,平均交并比(mIoU)值提升了0.06。可见该方法能提升图像全景分割速度,在PG、AP、mIoU三个指标上均有较好的精度,可以有效地完成全景分割任务。 展开更多
关键词 图像全景分割 语义分割 实例分割 分组卷积 空洞卷积 空间金字塔池化
下载PDF
基于卷积神经网络的全景分割Transformer模型 被引量:3
11
作者 毛琳 任凤至 +1 位作者 杨大伟 张汝波 《软件学报》 EI CSCD 北大核心 2023年第7期3408-3421,共14页
提出一种基于卷积神经网络的Transformer模型来解决全景分割任务,方法借鉴CNN在图像特征学习方面的先天优势,避免了Transformer被移植到视觉任务中所导致的计算量增加.基于卷积神经网络的Transformer模型由执行特征域变换的映射器和负... 提出一种基于卷积神经网络的Transformer模型来解决全景分割任务,方法借鉴CNN在图像特征学习方面的先天优势,避免了Transformer被移植到视觉任务中所导致的计算量增加.基于卷积神经网络的Transformer模型由执行特征域变换的映射器和负责特征提取的提取器这两种基本结构构成,映射器和提取器的有效结合构成了该模型的网络框架.映射器由一种Lattice卷积模型实现,通过对卷积滤波器进行设计和优化来模拟图像的空间关系.提取器由链式网络实现,通过链式单元堆叠提高特征提取能力.基于全景分割的结构和功能,构建了基于CNN的全景分割Transformer网络.在MS COCO和Cityscapes数据集的实验结果表明,所提方法具有优异的性能. 展开更多
关键词 全景分割 卷积神经网络 TRANSFORMER 语义分割 实例分割
下载PDF
多尺度注意力引导的全景分割网络
12
作者 付都 瞿绍军 付亚 《计算机工程与应用》 CSCD 北大核心 2023年第22期223-232,共10页
全景分割是近年来新提出的图像分割任务。现有全景分割模型大都对前景实例对象和背景未定形区采用不同的方式进行特征表示,因此需要额外的后处理和融合操作来处理各种实例重叠和语义冲突问题。全卷积全景分割网络实现了统一的特征表示,... 全景分割是近年来新提出的图像分割任务。现有全景分割模型大都对前景实例对象和背景未定形区采用不同的方式进行特征表示,因此需要额外的后处理和融合操作来处理各种实例重叠和语义冲突问题。全卷积全景分割网络实现了统一的特征表示,省去了这些复杂操作,但其对于前景实例对象的分割准确率不高,对图像中远距离小目标的分割效果不是很理想。针对这些问题,基于全卷积全景分割网络进行改进优化,提出一种多尺度注意力引导的全景分割网络。首先改进特征提取网络,通过在主干网中添加一条自底向上的辅助路径来增强模型的多尺度特征获取能力。其次提出一种注意力模块,通过将空洞空间金字塔池化与通道注意力融合,来引导卷积核更新,生成更匹配的权重。在Cityscapes数据集上与全卷积全景分割网络进行对比实验,图像实例级全景分割质量提高了2.74个百分点,背景未定形区全景分割质量和综合全景分割质量分别提高了1.36个百分点和1.94个百分点,对于交通灯和摩托车等小物体的类别检测准确率分别提高了4.4个百分点和8.3个百分点。提出的全景分割网络综合了全卷积全景分割网络、多尺度特征及注意力机制的优点,使得图像实例级全景分割准确率更高。 展开更多
关键词 图像分割 全景分割 全卷积全景分割网络 多尺度特征 注意力模块 空洞空间金字塔池化
下载PDF
信息政治经济学批判 被引量:6
13
作者 陈世华 《南昌大学学报(人文社会科学版)》 CSSCI 北大核心 2016年第3期91-97,共7页
传播政治经济学对信息和信息技术的本质、价值和影响提出替代性的理论视野,形成信息政治经济学流派。信息政治经济学认为信息和信息科技是一种强大的社会控制手段,批判了信息的商品化、私有化和移动化,提出"信息补贴"的概念... 传播政治经济学对信息和信息技术的本质、价值和影响提出替代性的理论视野,形成信息政治经济学流派。信息政治经济学认为信息和信息科技是一种强大的社会控制手段,批判了信息的商品化、私有化和移动化,提出"信息补贴"的概念来反映信息源对信息生产和流通的控制。信息政治经济学关注信息行业中劳动和劳动力的角色,用"全景分类"来反映资本主义社会对个人的控制。信息政治经济学阐明了信息和信息科技的矛盾特质,值得我们反复探究和研读。 展开更多
关键词 信息政治经济学 信息补贴 全景分类 知识劳动力
下载PDF
K-Query:基于关键点查询的全景分割方法 被引量:1
14
作者 姚治成 王卅 包云岗 《计算机学报》 EI CAS CSCD 北大核心 2023年第8期1693-1708,共16页
全景分割是图像语义分割与实例分割的融合,在自动驾驶、机器人应用等领域有重要应用价值.在当前基于深度学习的全景分割方法中,基于“查询”的方法在分割流程上统一了语义分割任务和实例分割任务,取得了当前最优全景分割效果.该类方法... 全景分割是图像语义分割与实例分割的融合,在自动驾驶、机器人应用等领域有重要应用价值.在当前基于深度学习的全景分割方法中,基于“查询”的方法在分割流程上统一了语义分割任务和实例分割任务,取得了当前最优全景分割效果.该类方法将自然语言处理中的注意力机制应用到了图像分割领域,然而由于输入图片数据量远大于文本句子数据量,该方法无法直接采用输入数据作为查询向量,为此构建了固定数量的静态向量作为“查询”.但是,该静态查询设计存在查询向量个数不好确定,容易出现实例表示混淆等问题.在基于静态查询的设计中,需要人为地根据经验去设定实例查询向量的个数,但是在实际情况中,输入图片中实例的个数不是固定的,在动态变化.如果把需要的查询向量个数设置的太少,少于图片中的实例数,则多的实例就无法表示.且由于每一个查询向量在解析过程中都会生成一张对应的掩码图片,多一倍的查询向量就会多一倍的资源开销,因此如果设置了太多的查询向量,在一些图片输入下就可能导致大量的资源浪费.另一方面,由于静态设置的查询向量和需要解析的输入图片不相关,在某些情况下,一个静态查询向量可能会得到多个事物的掩码,或者多个静态查询向量得到相同物体的掩码,导致查询向量在事物表示上发生混淆.为了解决该问题,我们期望查询向量是动态的,和输入图片中待查询的事物相关,且每个查询向量之间都具有一定的可区分性,为此本文提出了一种基于目标物体关键点的动态查询全景分割方法,称之为K-Query.为了让实例查询向量与图片中的实例直接关联,并在它们之间具有一定的区分距离,本方法首先将图片中的实例通过深度神经网络映射为可区分的高维嵌入编码,并保证同一个物体对应像素点的编码距离足够近,不同物体间 展开更多
关键词 深度学习 图像分割 聚类 实例分割 全景分割
下载PDF
融合改进ASPP和极化自注意力的自底向上全景分割 被引量:1
15
作者 李新叶 陈丁 《中国图象图形学报》 CSCD 北大核心 2023年第8期2410-2419,共10页
目的针对ASPP(atrous spatial pyramid pooling)在空洞率变大时空洞(atrous)卷积效果会变差的情况,以及图像分类经典模型ResNet(residual neural network)并不能有效地适用于细粒度图像分割任务的问题,提出一种基于改进ASPP和极化自注... 目的针对ASPP(atrous spatial pyramid pooling)在空洞率变大时空洞(atrous)卷积效果会变差的情况,以及图像分类经典模型ResNet(residual neural network)并不能有效地适用于细粒度图像分割任务的问题,提出一种基于改进ASPP和极化自注意力的自底向上全景分割方法。方法重新设计ASPP模块,将小空洞率卷积的输出与原始输入进行拼接(concat),将得到的结果作为新的输入传递给大空洞率卷积,然后将不同空洞率卷积的输出结果拼接,并将得到的结果与ASPP中的其他模块进行最后拼接,从而改善ASPP中因空洞率变大导致的空洞卷积效果变差的问题,达到既获得足够感受野的同时又能编码多尺度信息的目的;在主干网络的输出后引入改进的极化自注意力模块,实现对图像像素级的自我注意强化,使其得到的特征能直接适用于细粒度像素分割任务。结果本文在Cityscapes数据集的验证集上进行测试,与复现的基线网络Panoptic-DeepLab(58.26%)相比,改进ASPP模块后分割精度PQ(panoptic quality)(58.61%)提高了0.35%,运行时间从103 ms增加到124 ms,运行速度没有明显变化;通过进一步引入极化自注意力,PQ指标(58.86%)提高了0.25%,运行时间增加到187 ms;通过对该注意力模块进一步改进,PQ指标(59.36%)在58.86%基础上又提高了0.50%,运行时间增加到192 ms,速度略有下降,但实时性仍好于大多数方法。结论本文采用改进ASPP和极化自注意力模块,能够更有效地提取适合细粒度像素分割的特征,且在保证足够感受野的同时能编码多尺度信息,从而提升全景分割性能。 展开更多
关键词 全景分割 语义分割 实例分割 极化自注意力 ASPP
原文传递
基于深度学习的图像全景分割综述 被引量:1
16
作者 毕阳阳 郑远帆 +2 位作者 史彩娟 张昆 刘健 《计算机科学与探索》 CSCD 北大核心 2023年第11期2605-2619,共15页
随着深度学习与图像分割的不断发展,图像全景分割已经成为计算机视觉领域的一个研究热点,许多图像全景分割方法被提出。综述了基于深度学习的图像全景分割研究方法,首先介绍了图像全景分割国内外的研究现状,对已有图像全景分割的方法,... 随着深度学习与图像分割的不断发展,图像全景分割已经成为计算机视觉领域的一个研究热点,许多图像全景分割方法被提出。综述了基于深度学习的图像全景分割研究方法,首先介绍了图像全景分割国内外的研究现状,对已有图像全景分割的方法,根据网络架构优化任务的不同进行分类阐述,主要包括特征提取优化的图像全景分割、子任务分割优化的图像全景分割、子任务融合优化的图像全景分割、其他图像全景分割;其次简单介绍图像全景分割中常用的MS COCO、PASCAL VOC、Cityscapes、ADE20K和Mapillary Vistas五个数据集以及全景质量(PQ)和解析覆盖(PC)两种评价准则;然后对典型图像全景分割方法在不同数据集上进行了性能比较;接着列举了图像全景分割在医学、自动驾驶、无人机、农业、畜牧业、军事等领域的应用;最后指出了现有方法在复杂场景应用、实时性、冲突等方面存在的不足与挑战,并探讨了基于简单统一框架的图像全景分割、实时的高质量图像全景分割、复杂应用场景下图像全景分割等未来研究方向。 展开更多
关键词 图像全景分割 深度学习 特征提取 子任务分割 子任务融合
下载PDF
基于语义信息的三维点云全景分割方法研究
17
作者 任不凡 黄小燕 +2 位作者 吴思东 蒋涛 袁建英 《成都信息工程大学学报》 2023年第5期535-542,共8页
针对端到端点云全景分割网络精度不足的问题,设计一种基于点云语义信息的全景分割算法。首先利用语义分割模型获取点云数据语义信息,然后结合点云语义和空间信息,对前景目标(车、人等)进行聚类。具体地,为避免同类别相邻目标被聚类为一... 针对端到端点云全景分割网络精度不足的问题,设计一种基于点云语义信息的全景分割算法。首先利用语义分割模型获取点云数据语义信息,然后结合点云语义和空间信息,对前景目标(车、人等)进行聚类。具体地,为避免同类别相邻目标被聚类为一个目标,提出融合法向量夹角特征、空间位置、语义信息的聚类算法进行准确的前景实例分割。最后,提出一种新的类别划分方法,在不影响后续决策处理情况下,显著增加分割质量。SemanticKITTI数据集上的实验结果表明,提出的方法在全景质量、分割质量、识别质量、平均交并比4个指标上取得了较好的效果,分别达到56.6%、82.3%、68.2%、68.1%,并保持较快的速度(175 ms),充分证明其有效性和实用性。 展开更多
关键词 全景分割 深度学习 三维点云 聚类算法
下载PDF
基于递归层聚合结构的全景分割网络
18
作者 贾博慧 雷海卫 +1 位作者 李鸣野 吴倩 《中北大学学报(自然科学版)》 CAS 2023年第3期247-255,共9页
现有全景分割算法大都存在计算量开销大、精度不足的问题,EfficientPS(Efficient Panoptic Segmentation)网络提供了一种解决方案,但性能依旧有提升的空间。本文在此基础上提出了基于递归层聚合结构的全景分割网络(Recursive Layer Aggr... 现有全景分割算法大都存在计算量开销大、精度不足的问题,EfficientPS(Efficient Panoptic Segmentation)网络提供了一种解决方案,但性能依旧有提升的空间。本文在此基础上提出了基于递归层聚合结构的全景分割网络(Recursive Layer Aggregation Panoptic Segmentation,RLAPS)以提升全景分割效果。主干网络的结构改用递归层聚合结构的残差网络,在不增加冗余的情况下更好地重用浅层网络提取的特征,具有更好的学习图像中结构信息的能力;同时,主干网络中双向特征金字塔网络(Feature Pyramid Networks,FPN)结构后增加了通道多样化模块,弥补了卷积网络随着层数加深关注点集中在少数主要通道特征的问题,增强了主干网络提取特征的能力。语义分割头部分增加了跳跃连接和全局注意力模块组合的分支,以使提取到的特征能够关联全局信息。实验表明,该网络相较于EfficientPS的全景分割质量提升了0.9%。同时,前景实例目标和背景填充区域的分割精度分别提升了0.5%和1.3%。 展开更多
关键词 全景分割 层聚合机制 通道注意力机制 全局注意力机制
下载PDF
基于注意力机制的语义增强损失函数与全景分割
19
作者 郑立冬 滕书华 +2 位作者 谭志国 元志安 马燕新 《激光与红外》 CAS CSCD 北大核心 2023年第9期1449-1456,共8页
全景分割是计算机视觉中重要的研究方向。考虑到不同应用场景对语义分割精度的要求不同,本文提出一种基于注意力机制的语义增强损失函数和全景分割方法。首先将语义类别按照重要程度分组,加入注意力机制来对不同语义信息进行区分,并通... 全景分割是计算机视觉中重要的研究方向。考虑到不同应用场景对语义分割精度的要求不同,本文提出一种基于注意力机制的语义增强损失函数和全景分割方法。首先将语义类别按照重要程度分组,加入注意力机制来对不同语义信息进行区分,并通过对损失权重的设计有效抑制了分类失衡问题;其次设计一种全景分割网络,利用MaskR CNN网络作为实例分割子分支并加入FPN结构作为语义分割基准,提高了所需物体种类的分割精度;最后通过设计重叠结果剔除规则避免了网络结构中的实例和语义分割分支输出的重叠问题。通过对COCO数据集的对比实验表明,本文提出的语义增强损失函数有效提高了优先级较高语义类别的分割效果,为不同应用场景的全景分割提供了更加高质量的语义信息。 展开更多
关键词 损失函数 注意力机制 全景分割 实例分割 语义分割
下载PDF
基于改进特征金字塔的遥感图像全景分割
20
作者 幸羚 朱雯婕 徐昇 《计算机与数字工程》 2023年第4期893-898,905,共7页
把全景分割技术应用于蕴含着复杂地物信息的遥感图像更能满足实际需求,但迄今全景分割模型大多采用不同的方式表征背景未定形区和前景实例对象,利用两个独立的网络分别实现语义和实例分割任务,导致需要融合操作。全景特征金字塔网络通... 把全景分割技术应用于蕴含着复杂地物信息的遥感图像更能满足实际需求,但迄今全景分割模型大多采用不同的方式表征背景未定形区和前景实例对象,利用两个独立的网络分别实现语义和实例分割任务,导致需要融合操作。全景特征金字塔网络通过单一网络实现了联合任务,简化复杂操作,但其对实例对象中的小目标分割效果不够理想,边缘信息比较模糊。论文针对以上问题进行改进。首先,在不同大小的残差网络(ResNet50、ResNet101)上添加特征金字塔网络,改善多尺度的特征提取。然后在上采样时利用双线性插值法使得边缘信息更加清晰。最后,通过调整损失函数的权重,重新加权,得到具有更高全景质量的两个模型R50-FPN、R101-FPN。在COCO数据集上与全景质量为41.3%的OANet模型相比,模型R50-FPN、R101-FPN全景质量分别提高了0.2%和1.7%。此外,分别比较两模型在遥感图像和街景图像上的全景分割表现,实验表明两个模型在街景图像上的分割精度都更高。而模型R101-FPN相比于R50-FPN在边缘处理上更加精准,全景质量提高了1.5%。 展开更多
关键词 全景分割 遥感图像 特征金字塔网络 双线性插值
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部