-
题名基于无人船的双分支解码轻量型分割网络研究
- 1
-
-
作者
刘丹
张建杰
-
机构
新疆大学机械工程学院
-
出处
《激光杂志》
CAS
北大核心
2024年第3期175-181,共7页
-
基金
新疆维吾尔自治区重点研发项目(No.2022B02038)。
-
文摘
为保证水面无人艇(USVs)进行水上任务时能够顺利航行,需要对河道信息进行精确的提取,因此,对河道语义分割的网络模型进行了研究。针对河道图像分割中类间不一致和类内不一致的问题,文中提出了分割网络DBDL-Net,网络中设计双分支解码结构和双重损失函数,分别把握语义信息和空间信息;同时在编码部分设计了多尺度残差的轻量模块,一方面减少参数,一方面以不同的比例捕捉特征信息。最后在USVIn-land数据集上对模型进行消融和对比实验,实验结果表明:DBDL-Net的精确度和平均交并比最终达到了93.619%和87.682%,与其他先进分割网络相比,DBDL-Net也具有更佳的综合表现。
-
关键词
水面无人艇
DBDL-Net
双分支解码结构
双重损失函数
多尺度残差的轻量模块
-
Keywords
unmanned surface vessels
DBDL-Net
dual branch decoding structure
double loss function
lightweight module with multiscale residuals
-
分类号
TN911
[电子电信—通信与信息系统]
-
-
题名采用语义一致性编码网络的跨模态语音关键词检索
被引量:2
- 2
-
-
作者
齐梅
刘则芬
樊浩
李升
-
机构
安徽开放大学信息与建筑工程学院
-
出处
《宜宾学院学报》
2022年第12期6-13,共8页
-
基金
安徽省高校自然科学研究重点项目(KJ20211255)
安徽开放大学青年研究项目(QN202111)。
-
文摘
针对跨模态的语音-文本检索框架中的语义特征判别性不足问题,为了缩小语音和文本之间的异质性语义差距,提升检索精度,提出采用语义一致性编码神经网络(Semantics-Consistent Coding Network,SCCN)的跨模态语音关键词检索方法:分别利用梅尔倒谱系数特征(Mel-frequency cepstrum,MFCC)提取语音特征、利用BERT提取文本特征,搭建深度卷积神经网络,联合双重损失(语义一致性损失和检索损失)函数构造语义编码网络模型,提取语音和文本的共享特征获得一致性语义特征表达,同时考虑语音关键词检索任务的实时性需求,最后将检索任务视为多分类任务,通过余弦距离计算语义向量之间的距离,快速匹配检索结果.在公共数据集上的实验测试,取得了超过基线方法7%的精度,验证了SCCN方法有效性.
-
关键词
语义一致性特征
编码网络
语音关键词
跨模态检索
双重损失函数
-
Keywords
semantic-consistent features
coding networks
speech keywords
cross-modal retrieval
dual loss function
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名面向装修案例智能匹配的跨模态检索方法
被引量:2
- 3
-
-
作者
亢洁
刘威
-
机构
陕西科技大学电气与控制工程学院
-
出处
《智能系统学报》
CSCD
北大核心
2022年第4期714-720,共7页
-
基金
陕西省重点研发计划项目(2021GY-022)
西安市科技计划项目(2019216514GXRC001CG002-GXYD1.7)
国家留学基金项目(201708615011)。
-
文摘
根据用户输入的文本信息为其实时推送相应风格的装修案例是家装客服系统中的重要功能。然而,目前该功能的实现主要依赖于人工方式,不仅不能满足用户对咨询服务快捷、及时的需求,还增加了企业的人力成本。为此,提出了一种面向装修案例智能匹配的跨模态检索方法。针对现有算法难以直接建立文本与装修案例之间的对应关系这一问题,设计了一种风格聚合模块,可以获取一组装修案例统一的风格特征,从而便于后续网络建立文本与装修案例之间的潜在语义关联,实现两者间的跨模态匹配。同时,在关注图像模态中难易样本分类问题的基础上,构建了一种双重损失函数对模型进行训练。实验结果表明,本文提出的方法在装修案例多模态数据集上取得了较好的检索效果。
-
关键词
文本信息
风格
装修案例
家装客服系统
智能匹配
跨模态检索
风格聚合
双重损失函数
-
Keywords
text information
style
decoration cases
the customer service system for home decoration
intelligent matching
crossmodal retrieval
style aggregation
dual loss function
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名多分辨率融合输入的U型视网膜血管分割算法
被引量:3
- 4
-
-
作者
梁礼明
詹涛
雷坤
冯骏
谭卢敏
-
机构
江西理工大学电气工程与自动化学院
-
出处
《电子与信息学报》
EI
CSCD
北大核心
2023年第5期1795-1806,共12页
-
基金
国家自然科学基金(51365017,61463018)
江西省自然科学基金面上项目(20192BAB205084)
江西省教育厅科学技术研究重点项目(GJJ170491)。
-
文摘
针对视网膜血管拓扑结构不规则、形态复杂和尺度变化多样的特点,该文提出一种多分辨率融合输入的U型网络(MFIU-Net),旨在实现视网膜血管精准分割。设计以多分辨率融合输入为主干的粗略分割网络,生成高分辨率特征。采用改进的ResNeSt代替传统卷积,优化血管分割边界特征;将并行空间激活模块嵌入其中,捕获更多的语义和空间信息。构架另一U型精细分割网络,提高模型的微观表示和识别能力。一是底层采用多尺度密集特征金字塔模块提取血管的多尺度特征信息。二是利用特征自适应模块增强粗、细网络之间的特征融合,抑制不相关的背景噪声。三是设计面向细节的双重损失函数融合,以引导网络专注于学习特征。在眼底数据用于血管提取的数字视网膜图像(DRIVE)、视网膜结构分析(STARE)和儿童心脏与健康研究(CHASE_DB1)上进行实验,其准确率分别为97.00%,97.47%和97.48%,灵敏度分别为82.73%,82.86%和83.24%,曲线下的面积(AUC)值分别为98.74%,98.90%和98.93%。其模型整体性能优于现有算法。
-
关键词
视网膜血管分割
U型网络
并行空间激活模块
多尺度密集特征金字塔模块
双重损失函数融合
-
Keywords
Retinal vessel segmentation
U-shaped network
Parallel space activation module
Multiscale dense feature pyramid module
Double loss function fusion
-
分类号
R318
[医药卫生—生物医学工程]
TP391
[医药卫生—基础医学]
-