期刊文献+
共找到76篇文章
< 1 2 4 >
每页显示 20 50 100
基于情感的图像检索研究综述 被引量:15
1
作者 陆泉 丁恒 《情报理论与实践》 CSSCI 北大核心 2013年第2期119-124,共6页
文章全面梳理了基于情感的图像检索领域的已有研究工作,总结了基于情感的图像检索的关键性问题,包括情感信息研究、图像语义模型、情感语义、图像情感模型,归纳比较了已有的图像情感标注方法,简要介绍了基于情感的图像检索系统框架,进... 文章全面梳理了基于情感的图像检索领域的已有研究工作,总结了基于情感的图像检索的关键性问题,包括情感信息研究、图像语义模型、情感语义、图像情感模型,归纳比较了已有的图像情感标注方法,简要介绍了基于情感的图像检索系统框架,进而指出基于情感的图像检索研究的发展方向。 展开更多
关键词 图像情感检索 情感语义 情感标注 检索系统 语义标注
原文传递
国内外语义标注研究进展分析 被引量:13
2
作者 邱均平 牟楠 +1 位作者 楼雯 赵蓉英 《情报理论与实践》 CSSCI 北大核心 2014年第5期12-16,6,共6页
文章通过文献计量法对国内外语义标注研究的文献进行统计分析,包括时间分布、研究力量(机构、作者)分布以及研究内容分布等多个方面,总结对比了国内外语义标注的研究进展。结果表明,语义标注受到越来越多学者的关注。国内外语义标注研... 文章通过文献计量法对国内外语义标注研究的文献进行统计分析,包括时间分布、研究力量(机构、作者)分布以及研究内容分布等多个方面,总结对比了国内外语义标注的研究进展。结果表明,语义标注受到越来越多学者的关注。国内外语义标注研究都形成了一批具有影响力的期刊、机构和作者,研究方向也大致相同,都是作为语义网的关键技术之一,利用本体来进行语义标注,而且都在图像标注和Web服务两个领域应用较为广泛。 展开更多
关键词 语义标注 文献计量方法 可视化分析
原文传递
基于PLSA学习概率分布语义信息的多标签分类算法 被引量:9
3
作者 王一宾 郑伟杰 +1 位作者 程玉胜 曹天成 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2021年第1期75-89,共15页
多标签算法大多利用特征与标签嵌入等方法挖掘标签空间的语义信息,但这类方法没有利用特征与标签间可能存在的某种联系.类属属性的提出较好地诠释了特征与标签的联系,即标签可能对应一组自身的特征,然而这类方法未能给出特征与标签间可... 多标签算法大多利用特征与标签嵌入等方法挖掘标签空间的语义信息,但这类方法没有利用特征与标签间可能存在的某种联系.类属属性的提出较好地诠释了特征与标签的联系,即标签可能对应一组自身的特征,然而这类方法未能给出特征与标签间可能存在的逻辑关系,也未证实标签与实例间可能存在同样的逻辑关系.因此,提出基于PLSA(Probabilistic Latent Semantic Analysis)学习概率分布语义信息的新型多标签分类算法.首先认为样本矩阵存在一种隐含变量作为标签,利用PLSA模型获取特征⁃标签与标签⁃实例条件概率分布矩阵,以条件概率分布的形式解释它们之间可能存在的联系;其次,建立模型学习概率分布矩阵中存在的语义信息,并应用于多标签算法的标签预测与分类;最后在13个公开的多标签文本类型的数据集上进行实验与统计假设检验,并与其他多标签分类算法对比.实验结果表明,提出的学习概率分布语义信息用于提高多标签算法的性能存在一定的合理性. 展开更多
关键词 多标签学习 概率分布 语义分析 标签相关性
下载PDF
基于语义标签生成和偏序结构的图像层级分类 被引量:8
4
作者 顾广华 曹宇尧 +1 位作者 李刚 赵耀 《软件学报》 EI CSCD 北大核心 2020年第2期531-543,共13页
智能电子设备和互联网的普及,使得图像数据爆炸性膨胀.为了有效管理复杂图像资源,提出一种基于加权语义邻近集和形式概念偏序结构的图像层级分类方法.首先,根据图像语义相关分数,对不同程度语义设定自适应权系数,从训练图库中构建加权... 智能电子设备和互联网的普及,使得图像数据爆炸性膨胀.为了有效管理复杂图像资源,提出一种基于加权语义邻近集和形式概念偏序结构的图像层级分类方法.首先,根据图像语义相关分数,对不同程度语义设定自适应权系数,从训练图库中构建加权语义邻近集,通过对语义邻近集中图像的词频分布进行判决,自动生成图像的多个语义标签;然后,以每幅图像为对象,以每幅图像自动生成的语义标签为属性,构建形式背景,通过偏序结构算法对复杂图像集进行有效的层级分类.该方法可以得到图像库中图像之间明确的结构关系和图像类别之间的从属关系,为复杂图像大数据进行层级分类管理提供了有效的思路.对Corel5k、Esp Game和Iaprtc12这3个数据库进行了图像标注实验,证明了标注的语义完整性和主要语义的准确性;并对Corel5k数据库进行了图像的层级分类实验,结果表明,层级分类效果显著. 展开更多
关键词 加权语义邻近集 词频分布 语义标签 偏序结构 层级分类
下载PDF
浙派古琴艺术记谱技法研究和乐谱数据结构及标记文本转换分析 被引量:7
5
作者 陈根方 章怡雯 张云良 《杭州师范大学学报(自然科学版)》 CAS 2012年第6期561-565,共5页
分析了浙派古琴的演奏技法,对古琴乐谱所包含的语义信息进行了分类,利用计算机技术对乐谱中的独立语义信息进行数据结构设计,提出了基于文本标记表示古琴乐谱的方法,解决了人机无法同时表示与阅读古琴乐谱的问题.实验结果显示:古琴的文... 分析了浙派古琴的演奏技法,对古琴乐谱所包含的语义信息进行了分类,利用计算机技术对乐谱中的独立语义信息进行数据结构设计,提出了基于文本标记表示古琴乐谱的方法,解决了人机无法同时表示与阅读古琴乐谱的问题.实验结果显示:古琴的文本乐谱能完整地重现原有乐谱的音乐信息,谱字的平均字节数为4.08;带标记的文本乐谱适合于计算机进行统计分析、智能打谱、乐谱文本语料库建设等,为古琴艺术的数字化和信息化提供了一种切实可行的方法. 展开更多
关键词 浙派古琴 语义信息 减字谱 文本乐谱 标记 语料库 智能打谱
下载PDF
一个图像语义可视化交互标注研究平台——以“情感语义标注”为例 被引量:6
6
作者 陆泉 刘高 陈静 《情报理论与实践》 CSSCI 北大核心 2014年第8期111-116,共6页
针对当前图像语义标注存在的局限性以及缺乏有效的标注研究平台等问题,文章将用户认知心理研究与可视化及图像标注技术相结合,设计并实现了一种将用户对信息的感性认知与计算机语义处理相结合的图像语义可视化标注研究平台(ISARP),该平... 针对当前图像语义标注存在的局限性以及缺乏有效的标注研究平台等问题,文章将用户认知心理研究与可视化及图像标注技术相结合,设计并实现了一种将用户对信息的感性认知与计算机语义处理相结合的图像语义可视化标注研究平台(ISARP),该平台支持标签打分、单标签可视化交互标注以及多标签可视化交互标注3种图像语义标注模式,同时,还为研究人员综合运用问卷调查法、日志分析法、观察法及出声思维法等方法研究用户的标注行为提供了全面支持。可为图像语义及图像用户行为研究提供基础平台与有力工具。 展开更多
关键词 图像检索 语义标注 可视化 模型
原文传递
大规模主题词自动标引方法 被引量:5
7
作者 韩红旗 桂婕 +3 位作者 张运良 翁梦娟 薛陕 悦林东 《情报学报》 CSSCI CSCD 北大核心 2022年第5期475-485,共11页
现有的主题标引方法一般只能抽取文本中出现的词汇,无法从几万或数十万主题词中选择语义关联强且未出现的词汇;基于机器学习的多标签分类算法则需要每一个标签下有训练数据,限制了它们在主题标引上的应用。面向大规模主题词在海量文献... 现有的主题标引方法一般只能抽取文本中出现的词汇,无法从几万或数十万主题词中选择语义关联强且未出现的词汇;基于机器学习的多标签分类算法则需要每一个标签下有训练数据,限制了它们在主题标引上的应用。面向大规模主题词在海量文献上的标引需求,提出一个基于分布式词向量的混合型自动标引方法,利用大规模语料训练的词向量生成同维度的主题词表示向量和文本表示向量,实现主题词与文本语义相似度的计算。基于大规模语料构建主题词与普通词的映射表,使文本向量只和少量的语义强相关主题词向量比较,大大减少了计算量,提高了标引效率。开发的自动标引工具对近亿篇文献进行了主题标引,达到了较高的速度。与结巴关键词的实验对比结果显示,本文方法抽取的主题词与作者关键词重合度较低,且在去除结巴关键词中的非主题词后,取得了比结巴关键词更高的标引准确率;与人工标引的实验对比结果显示,随着人工标引词数量的增加,本文方法的效果、结果与人工标引结果的一致性在不断增加。 展开更多
关键词 主题标引 分布式词向量 多标签文本分类 关键词抽取 语义标签
下载PDF
数字图书馆中跨媒体检索模型的设计及优化探索 被引量:5
8
作者 李广丽 张红斌 移梦阳 《情报理论与实践》 CSSCI 北大核心 2013年第2期104-108,共5页
首先对当前数字图书馆中多媒体信息检索的现状进行分析,然后讨论了跨媒体检索的优点及应用前景。挑选以澳大利亚国家图书馆"Trove系统"为代表的传统跨媒体检索模型和浙江大学开发的"百万册图书馆"项目为代表的改进... 首先对当前数字图书馆中多媒体信息检索的现状进行分析,然后讨论了跨媒体检索的优点及应用前景。挑选以澳大利亚国家图书馆"Trove系统"为代表的传统跨媒体检索模型和浙江大学开发的"百万册图书馆"项目为代表的改进的跨媒体检索模型分别进行深入分析。重点分析这两大模型的实现原理、技术方案。最后,对比这两大模型的优缺点,并从3个角度就模型的改进和优化提出了构思及实现方案,并对这些方案进行定性分析。 展开更多
关键词 数字图书馆 跨媒体检索 检索模型 语义标注
原文传递
面向功能语义增强与标签关联的Web服务标签推荐
9
作者 刘庆雪 王荔芳 +1 位作者 潘国庆 胡强 《计算机应用研究》 CSCD 北大核心 2024年第9期2678-2684,共7页
为了提升标签推荐的质量,提出一种面向功能语义增强与标签关联的Web服务标签推荐方法。将语境权重融入TextRank模型,提取与服务功能契合度高的关键词,用于构建功能语义增强的服务表征向量;建立标签关联图,基于改进的GraphSAGE模型生成... 为了提升标签推荐的质量,提出一种面向功能语义增强与标签关联的Web服务标签推荐方法。将语境权重融入TextRank模型,提取与服务功能契合度高的关键词,用于构建功能语义增强的服务表征向量;建立标签关联图,基于改进的GraphSAGE模型生成标签关联向量;利用KNN算法获取推荐的主标签与候选标签集合,面向服务表征向量和标签关联向量构建融合适配度与关联度的标签推荐方法。实验表明,所提方法在accuracy与F_(1)-score指标上优于当前流行的标签推荐方法,标签推荐质量得到提升。 展开更多
关键词 WEB服务 语境权重 语义增强 标签关联 标签推荐
下载PDF
面向分布式复杂数据样本的联邦语义分割方法综述
10
作者 董成荣 姚俊萍 +2 位作者 李晓军 苏逸 周志杰 《计算机应用研究》 CSCD 北大核心 2024年第6期1610-1617,共8页
语义分割在医学图像分析、战场态势感知等领域起着重要作用,但单一客户端通常无法为模型提供足够数量与多样性的训练数据,因此从复杂多变的分布式数据中训练语义分割模型是有必要的。为了不泄露数据隐私和保护数据安全,应用联邦学习在... 语义分割在医学图像分析、战场态势感知等领域起着重要作用,但单一客户端通常无法为模型提供足够数量与多样性的训练数据,因此从复杂多变的分布式数据中训练语义分割模型是有必要的。为了不泄露数据隐私和保护数据安全,应用联邦学习在多客户端协同训练语义分割模型成为领域研究热点。在联邦语义分割定义基础上,围绕分布式复杂数据样本的数据异质性、标签缺失两个关键特征,开展联邦语义分割的问题描述、技术路径、典型模型实例等综述分析,评估不同方法的适用性及特点,梳理当前应用成果,提出针对该问题的潜在研究机会。研究为开展面向分布式复杂数据样本的联邦语义分割方法及相关研究提供借鉴和参考。 展开更多
关键词 语义分割 联邦学习 协同训练 数据异质性 标签缺失
下载PDF
Well Logging Stratigraphic Correlation Algorithm Based on Semantic Segmentation
11
作者 Wang Cai-zhi Wei Xing-yun +4 位作者 Pan Hai-xia Han Lin-feng Wang Hao Wang Hong-qiang and Zhao Han 《Applied Geophysics》 SCIE CSCD 2024年第4期650-666,878,共18页
Well logging curves serve as indicators of strata attribute changes and are frequently utilized for stratigraphic analysis and comparison.Deep learning,known for its robust feature extraction capabilities,has seen con... Well logging curves serve as indicators of strata attribute changes and are frequently utilized for stratigraphic analysis and comparison.Deep learning,known for its robust feature extraction capabilities,has seen continuous adoption by scholars in the realm of well logging stratigraphic correlation tasks.Nonetheless,current deep learning algorithms often struggle to accurately capture feature changes occurring at layer boundaries within the curves.Moreover,when faced with data imbalance issues,neural networks encounter challenges in accurately modeling the one-hot encoded curve stratifi cation positions,resulting in signifi cant deviations between predicted and actual stratifi cation positions.Addressing these challenges,this study proposes a novel well logging curve stratigraphic comparison algorithm based on uniformly distributed soft labels.In the training phase,a label smoothing loss function is introduced to comprehensively account for the substantial loss stemming from data imbalance and to consider the similarity between diff erent layer data.Concurrently,spatial attention and channel attention mechanisms are incorporated into the shallow and deep encoder stages of U²-Net,respectively,to better focus on changes in stratifi cation positions.During the prediction phase,an optimized confi dence threshold algorithm is proposed to constrain stratifi cation results and solve the problem of reduced prediction accuracy because of occasional layer repetition.The proposed method is applied to real-world well logging data in oil fi elds.Quantitative evaluation results demonstrate that within error ranges of 1,2,and 3 m,the accuracy of well logging curve stratigraphic division reaches 87.27%,92.68%,and 95.08%,respectively,thus validating the eff ectiveness of the algorithm presented in this paper. 展开更多
关键词 Well logging curve stratigraphic comparison semantic segmentation label smoothing Attention mechanism
下载PDF
社会化标注系统的语义标签资源导航构建 被引量:4
12
作者 陈婷 胡改丽 陈福集 《图书馆建设》 CSSCI 北大核心 2015年第1期78-83,共6页
社会化标签的资源导航可以为用户提供个性化的信息服务。主题图不仅能解决一般社会化标注系统中标签云的语义缺失和语义模糊问题,还可以实现资源导航的可视化。基于社会化标签与主题图技术的资源导航可通过以下3个步骤实现:采集与预处... 社会化标签的资源导航可以为用户提供个性化的信息服务。主题图不仅能解决一般社会化标注系统中标签云的语义缺失和语义模糊问题,还可以实现资源导航的可视化。基于社会化标签与主题图技术的资源导航可通过以下3个步骤实现:采集与预处理用户标签;形成具有明确架构和语义关系的知识网络;实现资源导航的可视化。 展开更多
关键词 社会化标注系统 资源导航 主题图 语义标签
下载PDF
Enhancing Deep Learning Semantics:The Diffusion Sampling and Label-Driven Co-Attention Approach
13
作者 ChunhuaWang Wenqian Shang +1 位作者 Tong Yi Haibin Zhu 《Computers, Materials & Continua》 SCIE EI 2024年第5期1939-1956,共18页
The advent of self-attention mechanisms within Transformer models has significantly propelled the advancement of deep learning algorithms,yielding outstanding achievements across diverse domains.Nonetheless,self-atten... The advent of self-attention mechanisms within Transformer models has significantly propelled the advancement of deep learning algorithms,yielding outstanding achievements across diverse domains.Nonetheless,self-attention mechanisms falter when applied to datasets with intricate semantic content and extensive dependency structures.In response,this paper introduces a Diffusion Sampling and Label-Driven Co-attention Neural Network(DSLD),which adopts a diffusion sampling method to capture more comprehensive semantic information of the data.Additionally,themodel leverages the joint correlation information of labels and data to introduce the computation of text representation,correcting semantic representationbiases in thedata,andincreasing the accuracyof semantic representation.Ultimately,the model computes the corresponding classification results by synthesizing these rich data semantic representations.Experiments on seven benchmark datasets show that our proposed model achieves competitive results compared to state-of-the-art methods. 展开更多
关键词 semantic representation sampling attention label-driven co-attention attention mechanisms
下载PDF
Multi-label text classification model based on semantic embedding 被引量:2
14
作者 Yan Danfeng Ke Nan +2 位作者 Gu Chao Cui Jianfei Ding Yiqi 《The Journal of China Universities of Posts and Telecommunications》 EI CSCD 2019年第1期95-104,共10页
Text classification means to assign a document to one or more classes or categories according to content. Text classification provides convenience for users to obtain data. Because of the polysemy of text data, multi-... Text classification means to assign a document to one or more classes or categories according to content. Text classification provides convenience for users to obtain data. Because of the polysemy of text data, multi-label classification can handle text data more comprehensively. Multi-label text classification become the key problem in the data mining. To improve the performances of multi-label text classification, semantic analysis is embedded into the classification model to complete label correlation analysis, and the structure, objective function and optimization strategy of this model is designed. Then, the convolution neural network(CNN) model based on semantic embedding is introduced. In the end, Zhihu dataset is used for evaluation. The result shows that this model outperforms the related work in terms of recall and area under curve(AUC) metrics. 展开更多
关键词 MULTI-label TEXT classification CONVOLUTION NEURAL network semantic analysis
原文传递
语义标注工具的特征分析及其适用性研究 被引量:3
15
作者 尹长余 毕强 王传清 《情报理论与实践》 CSSCI 北大核心 2014年第12期111-116,共6页
自动化语义标注工具的出现,为开放语义网环境下数字图书馆资源描述、知识关联、智能检索和可视化呈现等方面提供了先进的技术支持和系统保障。在对国内外语义标注技术和工具的相关研究和实践进行梳理的基础上,选取semanticweb.org上收... 自动化语义标注工具的出现,为开放语义网环境下数字图书馆资源描述、知识关联、智能检索和可视化呈现等方面提供了先进的技术支持和系统保障。在对国内外语义标注技术和工具的相关研究和实践进行梳理的基础上,选取semanticweb.org上收录的部分常用自动化语义标注工具,从标注对象、标注语言、本体来源、使用的本体语言、本体元素以及文件格式等方面进行比较和特征分析,在此基础上探讨数字图书馆选择自动化语义标注工具时的适用性考量要素,为数字图书馆创新服务中自动化语义标注工具的应用提供借鉴。 展开更多
关键词 数字图书馆 语义标注 知识组织 知识服务 标注工具
原文传递
一种基于弱标签的三维模型语义自动标注方法 被引量:3
16
作者 田枫 沈旭昆 +2 位作者 刘贤梅 周凯 杜睿山 《系统仿真学报》 CAS CSCD 北大核心 2012年第9期1873-1876,1881,共5页
随着三维应用的普及,三维模型大量产生并广泛传播。由于三维模型广泛应用于计算机辅助设计、三维游戏、电影特效制作等诸多领域,已经形成了大量的三维模型数据库。三维模型语义标注的目的是给出描述其语义的标注词,是三维模型管理和基... 随着三维应用的普及,三维模型大量产生并广泛传播。由于三维模型广泛应用于计算机辅助设计、三维游戏、电影特效制作等诸多领域,已经形成了大量的三维模型数据库。三维模型语义标注的目的是给出描述其语义的标注词,是三维模型管理和基于文本的三维检索的关键技术。针对互联网大量存在的弱标签三维模型现状,提出一种基于弱标签的三维模型语义标注方法LPMLL,首先,采用半监督学习方法进行标签传播,得到标注词置信度,达到提升训练集的目的。然后,采用一种基于最大后验概率准则的方法进行多标签学习,得到最终标注词。实验数据表明了该方法的有效性。 展开更多
关键词 三维模型自动标注 语义标注 半监督学习 弱标签
下载PDF
基于词语语义差异性的多标签罪名预测 被引量:3
17
作者 王加伟 张虎 +3 位作者 谭红叶 王元龙 赵红燕 李茹 《中文信息学报》 CSCD 北大核心 2019年第10期127-134,共8页
罪名预测是智慧司法领域中的一项重要研究内容,其旨在依据犯罪事实自动预测出犯罪主体触犯的罪名。犯罪事实是案件的真实客观描述,犯罪事实中各词语的语义重要性在不同罪名的判决中有所差异,而现有方法在对犯罪事实建模的过程中往往忽... 罪名预测是智慧司法领域中的一项重要研究内容,其旨在依据犯罪事实自动预测出犯罪主体触犯的罪名。犯罪事实是案件的真实客观描述,犯罪事实中各词语的语义重要性在不同罪名的判决中有所差异,而现有方法在对犯罪事实建模的过程中往往忽略了这种语义差异性,且缺乏对数罪并罚情形的处理。为此,该文在对犯罪事实的建模过程中将词语的语义差异融入注意力机制;并将数罪并罚情形下的多标签罪名预测转化为多个独立的单标签罪名预测。实验结果表明,该文基于词语语义差异性建模和多标签转化策略均有利于提升罪名预测的效果,在“中国法研杯”2018司法人工智能挑战赛公布的数据集上达到了88.0%的F1值。 展开更多
关键词 罪名预测 语义差异性 多标签
下载PDF
使用基于SVM的否定概率和法的图像标注 被引量:2
18
作者 路晶 金奕江 +1 位作者 马少平 茹立云 《智能系统学报》 2006年第1期62-66,共5页
在基于内容的图像检索中,建立图像底层视觉特征与高层语义的联系是个难题.对此提出了一种为图像提供语义标签的标注方法.先建立小规模图像库为训练集,库中每个图像标有单一的语义标签,再利用其底层特征,以SVM为子分类器,“否定概率和”... 在基于内容的图像检索中,建立图像底层视觉特征与高层语义的联系是个难题.对此提出了一种为图像提供语义标签的标注方法.先建立小规模图像库为训练集,库中每个图像标有单一的语义标签,再利用其底层特征,以SVM为子分类器,“否定概率和”法为合成方法构建基于成对耦合方式(PWC)的多类分类器,并对未标注的图像进行分类,结果以N维标注向量表示,实验表明,与一对多方式(OPC)的多类分类器及使用概率和法的PWC相比,“否定概率和”法性能更好. 展开更多
关键词 语义标签 否定概率和法 成对耦合 标注向量
下载PDF
基于改进ATN的句法分析
19
作者 李海军 张蕾 《计算机技术与发展》 2006年第1期41-43,46,共4页
句法分析是自然语言处理中的关键一环,目前的句法分析一般是依据句子中词的词性标记来进行的。而汉语单纯依据词性很难确定词之间正确的句法关系。在词类这个平面上进行句法分析存在着难以排除的结构歧义现象,因而使用语义知识排除结构... 句法分析是自然语言处理中的关键一环,目前的句法分析一般是依据句子中词的词性标记来进行的。而汉语单纯依据词性很难确定词之间正确的句法关系。在词类这个平面上进行句法分析存在着难以排除的结构歧义现象,因而使用语义知识排除结构歧义的方法更显重要。文中提出基于ATN(Augmented Translation Networks)的句法分析的新方法,对ATN进行相应的改进,利用《知网》的语义知识资源对其成分进行各种特性的标注。 展开更多
关键词 句法分析 结构歧义 语义知识 标注 扩充转换网络
下载PDF
融合语义标签和噪声先验的图像生成 被引量:2
20
作者 张素素 倪建成 +1 位作者 周子力 侯杰 《计算机应用》 CSCD 北大核心 2020年第5期1431-1439,共9页
针对现有生成模型难以直接从复杂语义标签生成高分辨率图像的问题,提出了融合语义标签和噪声先验的生成对抗网络(SLNP-GAN)。首先,直接输入语义标签(包含形状、位置和类别等信息),使用全局生成器对其进行编码,并结合噪声先验来学习粗粒... 针对现有生成模型难以直接从复杂语义标签生成高分辨率图像的问题,提出了融合语义标签和噪声先验的生成对抗网络(SLNP-GAN)。首先,直接输入语义标签(包含形状、位置和类别等信息),使用全局生成器对其进行编码,并结合噪声先验来学习粗粒度的全局属性,初步合成低分辨率图像;然后,基于注意力机制,使用局部细化生成器来查询低分辨率图像子区域对应的高分辨率子标签,获取细粒度信息,从而生成纹理清晰的复杂图像;最后,采用改进的引入动量的Adam算法(AMM)算法来优化对抗训练。实验结果表明,与现有方法text2img相比,所提方法的像素精确度(PA)在COCO_Stuff和ADE20K数据集上分别提高了23.73%和11.09%;相较于Adam算法,AMM算法收敛速度提升了约一倍,且损失值波幅较小。可见,SLNP-GAN能高效地获取全局特征和局部纹理,生成细粒度、高质量的图像。 展开更多
关键词 语义标签 噪声先验 注意力机制 引入动量的Adam算法 生成对抗网络
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部