期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
图文数据的多级关系分析与挖掘方法 被引量:1
1
作者 郭瑞萍 王海荣 王栋 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第2期684-694,共11页
如何高效挖掘多模态数据间隐藏的语义关联是当前多模态知识抽取的重点任务之一,为更细粒度地挖掘图像与文本数据间关系,提出了一种多级关系分析与挖掘(MRAM)方法,引入BERT-Large模型,提取文本特征构建文本连接图,利用Faster-RCNN网络提... 如何高效挖掘多模态数据间隐藏的语义关联是当前多模态知识抽取的重点任务之一,为更细粒度地挖掘图像与文本数据间关系,提出了一种多级关系分析与挖掘(MRAM)方法,引入BERT-Large模型,提取文本特征构建文本连接图,利用Faster-RCNN网络提取图像特征来学习空间位置关系和语义关系并构建图像连接图,进而完成单模态内部语义关系计算,在此基础上,使用节点切分方法和带多头注意力机制的图卷积网络(GCN-MA)进行局部和全局的图文关系融合。此外,为提升关系挖掘效率,采用了基于注意力机制的连边权重剪枝策略,用以增强重要分支表示,减少冗余信息干扰。在公开的Flickr30K、MSCOCO-1K、MSCOCO-5K数据集上进行方法实验,并与11种方法进行实验结果的对比分析,所提方法在Flickr30K上的平均召回率提高了0.97%和0.57%,在MSCOCO-1K上的平均召回率提高了0.93%和0.63%,在MSCOCO-5K上的平均召回率提高了0.37%和0.93%,实验结果验证了所提方法的有效性。 展开更多
关键词 关系挖掘 多级关系 注意力机制 图卷积网络 图文数据
下载PDF
基于图文数据的非遗跨模态知识图谱构建方法研究 被引量:1
2
作者 夏立新 陈欢 +1 位作者 李雪漫 翟姗姗 《情报资料工作》 CSSCI 北大核心 2024年第5期73-81,共9页
[目的/意义]在多模态信息资源日益丰富的背景下,跨模态信息组织方式对非遗信息资源序化存储与共享利用具有重要价值。文章提出一种基于图文数据的非遗跨模态知识图谱构建方法。[方法/过程]文章通过结合多模态信息抽取与知识图谱技术对... [目的/意义]在多模态信息资源日益丰富的背景下,跨模态信息组织方式对非遗信息资源序化存储与共享利用具有重要价值。文章提出一种基于图文数据的非遗跨模态知识图谱构建方法。[方法/过程]文章通过结合多模态信息抽取与知识图谱技术对非遗数字资源进行知识重组。首先,从非遗项目内容与模态维度设计非遗跨模态知识图谱模式层,为图文数据组织提供顶层设计;其次,分别讨论面向非遗领域的图像与文本资源的知识抽取方案,获取图文模态下的非遗知识,并验证知识抽取方法的有效性;最后,通过面向不同场景下的一系列跨模态知识链接方法抽取非遗图文实体间的跨模态关系。[结果/结论]以楚剧非遗项目为例,通过多数据源、多技术结合的方式构建楚剧跨模态知识图谱,验证了文章所提出构建方法的可行性,对非遗数字化建设具有一定参考价值。 展开更多
关键词 非物质文化遗产 跨模态 知识图谱 图文数据 知识抽取
原文传递
基于知识图谱构建的面料图像多样化检索系统
3
作者 魏萌瑶 张宁 潘如如 《棉纺织技术》 CAS 2024年第4期40-45,共6页
为了提高纺织行业筛选面料的效率,满足用户多样化的检索需求,解决面料检索结果单一、耗时久、精度低等问题,通过知识建模将面料的文本信息结构化表示,构建面料图文数据集,导入图数据库中实现面料知识图谱可视化。基于知识图谱构建了面... 为了提高纺织行业筛选面料的效率,满足用户多样化的检索需求,解决面料检索结果单一、耗时久、精度低等问题,通过知识建模将面料的文本信息结构化表示,构建面料图文数据集,导入图数据库中实现面料知识图谱可视化。基于知识图谱构建了面料图像多样化检索系统,该系统将用户提供的检索字段和知识图谱中的面料节点匹配,输出相应面料实体及其一阶近邻实体,实现了面料图像检索多样化。选取了50个文本关键词进行检索试验,结果表明:前8幅图像的查准率为80.7%,mAP值为0.852,平均多样性值为5.8,检索的平均响应时间仅为2.26 s,验证了该系统的有效性和可行性。 展开更多
关键词 知识建模 知识图谱 面料图像 图文数据 图像检索
下载PDF
多模态语义协同交互的图文联合命名实体识别方法 被引量:4
4
作者 钟维幸 王海荣 +1 位作者 王栋 车淼 《广西科学》 CAS 北大核心 2022年第4期681-690,共10页
针对现有多模态命名实体识别(Multimodal Named Entity Recognition, MNER)研究中存在的噪声影响和图文语义融合不足问题,本文提出一个多模态语义协同交互的图文联合命名实体识别(Image-Text Joint Named Entity Recognition, ITJNER)... 针对现有多模态命名实体识别(Multimodal Named Entity Recognition, MNER)研究中存在的噪声影响和图文语义融合不足问题,本文提出一个多模态语义协同交互的图文联合命名实体识别(Image-Text Joint Named Entity Recognition, ITJNER)模型。ITJNER模型加入图像描述作为额外特征丰富了多模态特征表示,图像描述可以帮助过滤掉从图像特征中引入的噪声并以文本形式总结图像语义信息;还构建了多模态协同交互的多模态语义融合模型,可以加强多模态信息融合,并减少图像信息的语义偏差。在Twitter-2015和Twitter-2017数据集上进行方法实验,分析实验结果并与AdaCAN、UMT、UMGF、Object-AGBAN等方法进行对比。相较于对比方法中的最优方法UMGF,本方法在Twitter-2017数据集上的准确率、召回率、F1值分别提高了0.67%、2.26%、0.93%;在Twitter-2015数据集上,召回率提高了0.19%。实验结果验证了本方法的有效性。 展开更多
关键词 多模态命名实体识别 图文数据 多模态注意力 图像描述 语义融合
下载PDF
基于机器学习的福建泉州世界文化遗产景观感知研究
5
作者 任维 李巧婷 +1 位作者 詹开元 傅伟聪 《风景园林》 北大核心 2024年第11期120-129,共10页
【目的】既有的遗产景观感知研究多存在数据类型单一且融合度不足、机器学习等新技术方法应用尚不充分等问题,制约了遗产景观感知研究的维度与深度,因此亟待探索多模态数据有效融合的新方法及多种机器学习模型集成的新技术。【方法】以... 【目的】既有的遗产景观感知研究多存在数据类型单一且融合度不足、机器学习等新技术方法应用尚不充分等问题,制约了遗产景观感知研究的维度与深度,因此亟待探索多模态数据有效融合的新方法及多种机器学习模型集成的新技术。【方法】以福建泉州世界文化遗产的12处遗产点为对象,基于100292份有效网络图文数据,通过系统集成潜在狄利克雷分配(latent Dirichlet allocation,LDA)主题聚类模型、多模态统一(one-for-all,OFA)图像描述模型和长短期记忆网络(long short-term memory,LSTM)情感分析模型等机器学习技术方法,从遗产点热度时空演变、遗产景观感知维度、遗产景观感知网络、遗产景观感知情感倾向4个方面进行景观感知研究。【结果】1)在遗产点热度时空演变上,遗产点热度与游客景观感知度受政策与事件驱动呈协同快速增长趋势,但存在显著的时空差异性,梯度由“高—低”两阶向“高—中—低”三阶过渡。2)在遗产景观感知维度与遗产景观感知网络上,多元融合是景观感知的文化内核,并衍生出层次丰富、以文化价值为主导的景观感知体系。遗产景观感知维度有三大类、七小类,涵盖共性及差异化感知内容;整体上,12处遗产点主题数量占比为文化价值>风景游赏>特色体验>物质载体;各遗产点差异显著,形成由各感知维度主导的4类群组。遗产景观感知高频词分布在物质载体、风景游赏、文化价值3个维度;语义网络呈“中心区域—边缘区域”结构,且中心均质、边缘松散;4个语义网络集群与LDA主题聚类感知维度匹配度高。3)在遗产景观感知情感倾向上,游客有效感知到了泉州世界文化遗产景观及其深厚的历史文化底蕴与遗产属性。遗产景观感知情感倾向整体为中性偏积极,且文本情感倾向比图像描述文本更积极;各遗产点情感指数差异大,可达性、聚集度是根� 展开更多
关键词 景观感知 世界遗产 遗产景观 机器学习 网络图文数据 泉州
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部