期刊文献+
共找到44篇文章
< 1 2 3 >
每页显示 20 50 100
基于深度学习和知识图谱的变电站设备故障智能诊断 被引量:44
1
作者 肖发龙 吴岳忠 +2 位作者 沈雪豪 何震凯 秦烨 《电力建设》 CSCD 北大核心 2022年第3期66-74,共9页
及时发现并诊断变电站运行中设备存在的问题,是保障电网安全运行的关键手段之一。基于深度网络与知识图谱技术,提出一种关联变电站设备多模态信息的故障智能诊断方法。利用深度学习技术和知识图谱方法对采集的多模态数据进行知识提取和... 及时发现并诊断变电站运行中设备存在的问题,是保障电网安全运行的关键手段之一。基于深度网络与知识图谱技术,提出一种关联变电站设备多模态信息的故障智能诊断方法。利用深度学习技术和知识图谱方法对采集的多模态数据进行知识提取和融合,构建一个多模态信息融合的语义知识图谱;使用YOLOv4算法对故障样本聚类并提取先验框参数;将多模态知识图谱和YOLOv4视觉检测相结合,应用到变电站场景中,实现变电站设备的自主预警诊断。实验表明,该模型可以实现故障诊断决策智能化的目标,从而提高电网的日常运行、维护和管理效率。 展开更多
关键词 多模态 智能诊断 深度学习 知识图谱
原文传递
多模态知识图谱构建与应用研究综述 被引量:41
2
作者 陈烨 周刚 卢记仓 《计算机应用研究》 CSCD 北大核心 2021年第12期3535-3543,共9页
为了总结前人工作,给相关研究者提供思路,首先讨论了当前多模态知识图谱的基本概念,然后从图数据库和知识图谱这两个角度介绍了多模态知识图谱的构建工作,并总结了两种主要方法的思路。还分析了多模态知识图谱的构建和应用中的关键技术... 为了总结前人工作,给相关研究者提供思路,首先讨论了当前多模态知识图谱的基本概念,然后从图数据库和知识图谱这两个角度介绍了多模态知识图谱的构建工作,并总结了两种主要方法的思路。还分析了多模态知识图谱的构建和应用中的关键技术和相关工作,如多模态信息提取、表示学习和实体链接。此外,列举了多模态知识图谱在四种场景中的应用,包括推荐系统、跨模态检索、人机交互和跨模态数据管理。最后,从四个方面展望了多模态知识图谱的发展前景。 展开更多
关键词 多模态 知识图谱 构建 应用
下载PDF
多模态教学知识图谱的构建与应用 被引量:10
3
作者 李直旭 何芙珍 刘安 《福建电脑》 2019年第8期5-8,共4页
以《数据结构(c++)》这门课为例,本文探讨了面向本科生教学的多模态知识图谱的构建与应用,详细阐述了构建多模态知识图谱的方法和主要步骤,以及以该图谱为基础设计并实现的课堂教学应用.在构建阶段,老师带领学生以教材、大纲、网络资源... 以《数据结构(c++)》这门课为例,本文探讨了面向本科生教学的多模态知识图谱的构建与应用,详细阐述了构建多模态知识图谱的方法和主要步骤,以及以该图谱为基础设计并实现的课堂教学应用.在构建阶段,老师带领学生以教材、大纲、网络资源等为依据,对知识点进行分类汇总,并从中抽取预先定义好的一些属性的值.为了改进传统知识图谱只以纯文字形式呈现的弊端,本文还重点收集了图片、音频、视频等形式的多模态资源,整合成一张多模态知识图谱.接着,以构建好的多模态知识图谱为基础,展示了设计并实现的知识点检索与可视化、智能化课堂教学、个性化学习与教学等应用,利用这些应用能够更好地辅助教师实现智慧课堂的教学,"因材施教"的理念也更加能够落到实处. 展开更多
关键词 多模态 知识图谱 智慧课堂 个性化学习
下载PDF
多媒体交叉参照检索系统研究 被引量:8
4
作者 庄越挺 吴聪苗 +1 位作者 吴飞 刘翔 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2005年第4期834-839,共6页
描述并实现了一个面向数字图书馆的多媒体交叉参照检索系统该系统将对多模态数据的检索无缝地融合到一个系统中,基于交叉参照图模型,多模态交叉参照搜索引擎综合计算媒体对象与查询之间在语义和内容层上的相似度;系统还支持用户相关反... 描述并实现了一个面向数字图书馆的多媒体交叉参照检索系统该系统将对多模态数据的检索无缝地融合到一个系统中,基于交叉参照图模型,多模态交叉参照搜索引擎综合计算媒体对象与查询之间在语义和内容层上的相似度;系统还支持用户相关反馈调整交叉参照图模型实验结果表明。 展开更多
关键词 多模态检索 交叉参照图 相关反馈
下载PDF
多模态知识图谱增强葡萄种植问答对的答案选择模型 被引量:6
5
作者 杨硕 李书琴 《农业工程学报》 EI CAS CSCD 北大核心 2023年第14期207-214,共8页
针对传统答案选择模型仅依靠问答对自身信息进行匹配的问题,该研究提出了一种使用多模态知识图谱来增强问答对的答案选择模型。该模型通过设计基于ComplEx(complex embedding)图谱嵌入的方法学习多模态知识图谱嵌入,引入上下文注意力机... 针对传统答案选择模型仅依靠问答对自身信息进行匹配的问题,该研究提出了一种使用多模态知识图谱来增强问答对的答案选择模型。该模型通过设计基于ComplEx(complex embedding)图谱嵌入的方法学习多模态知识图谱嵌入,引入上下文注意力机制并使用CNN网络获取多模态知识图谱的特征表示,使用知识感知注意力方法,将多模态知识图谱提供的背景知识与问答对的文本语义信息融合。以葡萄种植为例,通过搭建葡萄种植多模态知识图谱和构造葡萄种植问答数据集开展试验,试验结果表明:使用多模态知识图谱有助于模型获取更多信息从而达到更好的效果,在葡萄问答数据集中正确答案的平均倒数排名和平均准确率分别达到了85.02%、84.21%,与其他模型相比,平均倒数排名提高2.57个百分点,平均准确率提高了3.96个百分点。该答案选择模型利用多模态知识图谱的知识提高答案选择效果,可为搜索、问答等下游任务提供技术基础。 展开更多
关键词 农业 知识图谱 葡萄种植 答案选择 多模态 图谱表示 自然语言处理
下载PDF
基于改进的Zernike矩的局部描述符与图割离散优化的非刚性多模态脑部图像配准 被引量:7
6
作者 王丽芳 王雁丽 +2 位作者 蔺素珍 秦品乐 高媛 《计算机应用》 CSCD 北大核心 2019年第2期582-588,共7页
针对脑部图像中存在噪声和强度失真时,基于结构信息的方法不能同时准确提取图像强度信息和边缘、纹理特征,并且连续优化计算复杂度相对较高的问题,根据图像的结构信息,提出了基于改进Zernike距的局部描述符(IZMLD)和图割(GC)离散优化的... 针对脑部图像中存在噪声和强度失真时,基于结构信息的方法不能同时准确提取图像强度信息和边缘、纹理特征,并且连续优化计算复杂度相对较高的问题,根据图像的结构信息,提出了基于改进Zernike距的局部描述符(IZMLD)和图割(GC)离散优化的非刚性多模态脑部图像配准方法。首先,将图像配准问题看成是马尔可夫随机场(MRF)的离散标签问题,并且构造能量函数,两个能量项分别由位移矢量场的像素相似性和平滑性组成。其次,采用变形矢量场的一阶导数作为平滑项,用来惩罚相邻像素间有较大变化的位移标签;用基于IZMLD计算的相似性测度作为数据项,用来表示像素相似性。然后,在局部邻域中用图像块的Zernike矩来分别计算参考图像和浮动图像的自相似性并构造有效的局部描述符,把描述符之间的绝对误差和(SAD)作为相似性测度。最后,将整个能量函数离散化,并且使用GC的扩展优化算法求最小值。实验结果表明,与基于结构表示的熵图像的误差平方和(ESSD)、模态独立邻域描述符(MIND)和随机二阶熵图像(SSOEI)的配准方法相比,所提算法目标配准误差的均值分别下降了18. 78%、10. 26%和8. 89%,并且比连续优化算法缩短了约20 s的配准时间。所提算法实现了在图像存在噪声和强度失真时的高效精确配准。 展开更多
关键词 多模态 图像配准 自相似性 ZERNIKE矩 图割
下载PDF
基于建筑信息模型数据驱动的铁路设备运维多模态知识图谱构建 被引量:3
7
作者 林海香 胡娜娜 +2 位作者 何乔 赵正祥 白万胜 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第2期166-173,共8页
铁路信号设备是保障行车安全、提高运输效率的核心装备,加强信号设备智能运维是降低铁路运行风险的必要基础保障。目前,针对我国基于建筑信息模型(BIM)的智能运维平台存在不能精准映射各设备的行为规律和相互之间互馈作用的机理,须同时... 铁路信号设备是保障行车安全、提高运输效率的核心装备,加强信号设备智能运维是降低铁路运行风险的必要基础保障。目前,针对我国基于建筑信息模型(BIM)的智能运维平台存在不能精准映射各设备的行为规律和相互之间互馈作用的机理,须同时依靠经验知识进行推断等问题。首先构建了铁路设备运维文本知识图谱;其次构建卷积神经网络(CNN)-团组图卷积神经网络(cgGCN)模型对BIM图像模态数据进行处理,完成对20种铁路信号设备零件图信息的标注,实验结果表明模型准确率达到95.38%,精确率和召回率的调和平均值F1达到95.58%;最后将BIM图像信息以视觉模态嵌入运维文本知识图谱,利用Neo4j图数据库实现多模态知识图谱可视化展示,从而精准映射各信号设备相互之间互馈作用的机理,为后续现场铁路运维人员实施安全管理和运维决策提供在线服务和指导。 展开更多
关键词 铁路信号设备 建筑信息模型(BIM) 运维 多模态 知识图谱
下载PDF
基于预训练语言模型的知识图谱研究综述
8
作者 曾泽凡 胡星辰 +2 位作者 成清 司悦航 刘忠 《计算机科学》 北大核心 2025年第1期1-33,共33页
大语言模型时代,知识图谱作为一种结构化的知识表示方式,在提升人工智能的可靠性、安全性和可解释性方面发挥着不可替代的作用,具有重要的研究价值和实际应用前景。近年来,凭借在语义理解和上下文学习方面的优越性能,预训练语言模型已... 大语言模型时代,知识图谱作为一种结构化的知识表示方式,在提升人工智能的可靠性、安全性和可解释性方面发挥着不可替代的作用,具有重要的研究价值和实际应用前景。近年来,凭借在语义理解和上下文学习方面的优越性能,预训练语言模型已经成为了知识图谱研究的主要手段。系统梳理了基于预训练语言模型的知识图谱研究的相关工作,包括知识图谱构建、表示学习、推理、问答等,介绍了相关模型和方法的核心思路,并依据技术路径建立了分类体系,对不同类型方法的优缺点进行了对比分析。此外,对预训练语言模型在事件知识图谱和多模态知识图谱这两种新型知识图谱中的应用现状进行了综述。最后,总结了当前基于预训练语言模型的知识图谱研究面临的挑战,展望了未来的研究方向。 展开更多
关键词 知识图谱 预训练语言模型 大语言模型 多模态 事件知识图谱
基于图神经网络多模态融合的语音情感识别模型 被引量:4
9
作者 李紫荆 陈宁 《计算机应用研究》 CSCD 北大核心 2023年第8期2286-2291,2310,共7页
目前,基于多模态融合的语音情感识别模型普遍存在无法充分利用多模态特征之间的共性和互补性、无法借助样本特征间的拓扑结构特性对样本特征进行有效地优化和聚合,以及模型复杂度过高的问题。为此,引入图神经网络,一方面在特征优化阶段... 目前,基于多模态融合的语音情感识别模型普遍存在无法充分利用多模态特征之间的共性和互补性、无法借助样本特征间的拓扑结构特性对样本特征进行有效地优化和聚合,以及模型复杂度过高的问题。为此,引入图神经网络,一方面在特征优化阶段,将经过图神经网络优化后的文本特征作为共享表示重构基于声学特征的邻接矩阵,使得在声学特征的拓扑结构特性中包含文本信息,达到多模态特征的融合效果;另一方面在标签预测阶段,借助图神经网络充分聚合当前节点的邻接节点所包含的相似性信息对当前节点特征进行全局优化,以提升情感识别准确率。同时为防止图神经网络训练过程中可能出现的过平滑问题,在图神经网络训练前先进行图增强处理。在公开数据集IEMOCAP和RAVDESS上的实验结果表明,所提出的模型取得了比基线模型更高的识别准确率和更低的模型复杂度,并且模型各个组成部分均对模型性能提升有所贡献。 展开更多
关键词 语音情感识别 多模态特征 图神经网络 图增强
下载PDF
离散制造中基于多源多模数据的产品指标联合分析
10
作者 吕弢 陈璟 薛善烨 《空天防御》 2024年第5期110-119,126,共11页
针对航天产品离散制造过程中,装配过程繁复、制造工艺复杂、技术状态多变等短板给数据管理带来的一系列问题,如多源异构数据集成难、产品状态监测准确性不足等,本文提出一套基于多源多模数据进行产品质量自动分析的常态化流程,以物料清... 针对航天产品离散制造过程中,装配过程繁复、制造工艺复杂、技术状态多变等短板给数据管理带来的一系列问题,如多源异构数据集成难、产品状态监测准确性不足等,本文提出一套基于多源多模数据进行产品质量自动分析的常态化流程,以物料清单(BOM)为图谱组织数据,运用数据平台组件,通过单指标成功包络与多指标联合关联分析,实现多批产品质量状态的实时监控和预警,从而精准提升产品质量与一致性。此举为各类产品质量预测与控制提供了理论支撑,并为后续品质分析及复检工作指明方向。 展开更多
关键词 离散制造 多源数据 多模融合 BOM图谱 多维关联 产品质量
下载PDF
基于有向图模型的多模态新闻图像检索研究 被引量:4
11
作者 相子喜 吕学强 张凯 《科学技术与工程》 北大核心 2016年第3期78-84,99,共8页
不同模态特征描述网络新闻数据各具优势。为充分利用不同模态特征的优点,提高网络新闻图像检索准确率,提出了一种基于有向图理论模型的多模态特征融合检索方法。首先对新闻图像进行预处理,提升新闻图像兴趣点对比度,之后对新闻文本提取... 不同模态特征描述网络新闻数据各具优势。为充分利用不同模态特征的优点,提高网络新闻图像检索准确率,提出了一种基于有向图理论模型的多模态特征融合检索方法。首先对新闻图像进行预处理,提升新闻图像兴趣点对比度,之后对新闻文本提取关键词,然后对新闻图像进行场景辨别,结合图像人物特征,将文本、场景、人物特征依据有向图理论模型进行融合,形成基于有向图理论模型的多模态融合检索。在10万条新闻数据上测试,实验结果表明,本文提出的方法检索准确率达到了69%,查全率达到70%,效果提升了5%。 展开更多
关键词 多模态 有向图模型 新闻图像 语义相似度 特征融合
下载PDF
基于知识图谱增强的领域多模态实体识别
12
作者 李华昱 张智康 +1 位作者 闫阳 岳阳 《计算机工程》 CAS CSCD 北大核心 2024年第8期31-39,共9页
针对特定领域中文命名实体识别存在的局限性,提出一种利用学科图谱和图像提高实体识别准确率的模型,旨在利用领域图谱和图像提高计算机学科领域短文本中实体识别的准确率。使用基于BERT-BiLSTMAttention的模型提取文本特征,使用ResNet15... 针对特定领域中文命名实体识别存在的局限性,提出一种利用学科图谱和图像提高实体识别准确率的模型,旨在利用领域图谱和图像提高计算机学科领域短文本中实体识别的准确率。使用基于BERT-BiLSTMAttention的模型提取文本特征,使用ResNet152提取图像特征,并使用分词工具获得句子中的名词实体。通过BERT将名词实体与图谱节点进行特征嵌入,利用余弦相似度查找句子中的分词在学科图谱中最相似的节点,保留到该节点距离为1的邻居节点,生成最佳匹配子图,作为句子的语义补充。使用多层感知机(MLP)将文本、图像和子图3种特征映射到同一空间,并通过独特的门控机制实现文本和图像的细粒度跨模态特征融合。最后,通过交叉注意力机制将多模态特征与子图特征进行融合,输入解码器进行实体标记。在Twitter2015、Twitter2017和自建计算机学科数据集上同基线模型进行实验比较,结果显示,所提方法在领域数据集上的精确率、召回率和F1值分别可达88.56%、87.47%和88.01%,与最优基线模型相比,F1值提高了1.36个百分点,表明利用领域知识图谱能有效提升实体识别效果。 展开更多
关键词 命名实体识别 多模态 领域 知识图谱 跨模态特征融合 注意力机制
下载PDF
基于双融合图注意力网络多模态知识图谱链路预测
13
作者 张冬 梁平 顾进广 《计算机技术与发展》 2024年第7期123-130,共8页
知识图谱链路预测是一种根据知识图谱已存在的事实去预测缺失事实的任务,旨在解决知识图谱不完整性问题。但是现有的知识图谱链路预测有一定的缺陷,传统方法只使用单一的数据模态,没有充分利用不同数据模态的丰富信息,并且在图神经网络... 知识图谱链路预测是一种根据知识图谱已存在的事实去预测缺失事实的任务,旨在解决知识图谱不完整性问题。但是现有的知识图谱链路预测有一定的缺陷,传统方法只使用单一的数据模态,没有充分利用不同数据模态的丰富信息,并且在图神经网络中孤立地看待实体和关系,没有考虑到不同邻域实体关系权重的不同。为了解决上述缺陷,提出了基于双融合图注意力网络的多模态知识图谱链路预测模型。首先,使用了图像、文本和属性3种模态,同时为了保证数据模态特征的一致性和互补性,设计了一个基于早期融合和晚期融合结合的双融合机制对多模态信息进行融合;然后,为了加强知识图中实体关系的融合以及邻域关系,同时考虑了实体以及关系的多样性,融合了实体表示和关系表示,并通过图注意力网络进行聚合以加强实体的特征表示。通过在4个公开的数据集FB15K-237、WN18RR、DB15K以及YAGO15K进行模拟实验,结果表明,提出的多模态知识图谱链路预测方法具有较好的性能。 展开更多
关键词 多模态 知识图谱 链路预测 模态融合 图注意力网络
下载PDF
Multi-modal knowledge graph inference via media convergence and logic rule
14
作者 Feng Lin Dongmei Li +5 位作者 Wenbin Zhang Dongsheng Shi Yuanzhou Jiao Qianzhong Chen Yiying Lin Wentao Zhu 《CAAI Transactions on Intelligence Technology》 SCIE EI 2024年第1期211-221,共11页
Media convergence works by processing information from different modalities and applying them to different domains.It is difficult for the conventional knowledge graph to utilise multi-media features because the intro... Media convergence works by processing information from different modalities and applying them to different domains.It is difficult for the conventional knowledge graph to utilise multi-media features because the introduction of a large amount of information from other modalities reduces the effectiveness of representation learning and makes knowledge graph inference less effective.To address the issue,an inference method based on Media Convergence and Rule-guided Joint Inference model(MCRJI)has been pro-posed.The authors not only converge multi-media features of entities but also introduce logic rules to improve the accuracy and interpretability of link prediction.First,a multi-headed self-attention approach is used to obtain the attention of different media features of entities during semantic synthesis.Second,logic rules of different lengths are mined from knowledge graph to learn new entity representations.Finally,knowledge graph inference is performed based on representing entities that converge multi-media features.Numerous experimental results show that MCRJI outperforms other advanced baselines in using multi-media features and knowledge graph inference,demonstrating that MCRJI provides an excellent approach for knowledge graph inference with converged multi-media features. 展开更多
关键词 logic rule media convergence multi-modal knowledge graph inference representation learning
下载PDF
加权多模态融合的服装搭配预测
15
作者 李艳 蒋亲亲 《福建电脑》 2024年第5期53-57,共5页
现有的服装搭配方法仅用图像模态或文本模态来进行服装搭配的预测。为解决多种模态间信息交互的问题,本文提出了基于带权重的多模态融合的服装搭配预测方法。该方法首先提取服装图像特征作为视觉特征,同时提取服装描述中的文本信息作为... 现有的服装搭配方法仅用图像模态或文本模态来进行服装搭配的预测。为解决多种模态间信息交互的问题,本文提出了基于带权重的多模态融合的服装搭配预测方法。该方法首先提取服装图像特征作为视觉特征,同时提取服装描述中的文本信息作为文本特征,然后将提取的特征加权融合,最终将融合的特征输入图神经网络模型中进行服装搭配预测。结果显示,融合后的特征将最重要的服装特征捕捉到服装表示中,能够有效提升服装搭配预测准确率。 展开更多
关键词 多模态融合 服装搭配 图神经网络 视觉特征 文本特征
下载PDF
基于多模态知识图谱的水稻施肥期判别方法
16
作者 袁立存 周俊 +1 位作者 戈为溪 郑彭元 《农业机械学报》 EI CAS CSCD 北大核心 2024年第9期163-173,共11页
目前水稻施肥时间的确定依赖于传统经验与人工巡田观察的综合判断,难以满足当前农业智能化的发展。为此,提出了一种基于多模态知识图谱的水稻施肥期判别方法,综合利用了文本形式的经验信息和图像形式的视觉信息进行施肥期确定。首先构... 目前水稻施肥时间的确定依赖于传统经验与人工巡田观察的综合判断,难以满足当前农业智能化的发展。为此,提出了一种基于多模态知识图谱的水稻施肥期判别方法,综合利用了文本形式的经验信息和图像形式的视觉信息进行施肥期确定。首先构建单模态水稻施肥知识图谱,利用依存句法分析提取返青肥、分蘖肥、穗肥、粒肥4个施肥期对应的跨模态特征短语,结合Chinese CLIP模型得到它们与图像的匹配度以及与施肥期节点的权重后组成新的带有跨模态节点的三元组,完成多模态水稻施肥知识图谱的构建;然后基于多模态知识图谱计算输入信息的综合匹配度,使用大田采集的图像进行交叉验证,综合评估判别方法的准确性和稳定性确定各施肥期的判定阈值,实现对该输入的施肥期判别。以实际采集的各施肥期当日及前、后5 d的600幅图像测试判别方法的准确率,结果表明,基于多模态知识图谱的水稻施肥期判别方法总体准确率达到86.2%,其中粒肥时期判别准确率最高,为90.1%。该施肥期判别方法同时利用文本、图像两种模态的信息,提高了信息利用率,在真实场景下具有判别能力,为水稻施肥期自动确定提供参考。 展开更多
关键词 水稻 施肥期 多模态 知识图谱 CLIP模型
下载PDF
Visual Entity Linking via Multi-modal Learning 被引量:3
17
作者 Qiushuo Zheng Hao Wen +1 位作者 Meng Wang Guilin Qi 《Data Intelligence》 EI 2022年第1期1-19,共19页
Existing visual scene understanding methods mainly focus on identifying coarse-grained concepts about the visual objects and their relationships,largely neglecting fine-grained scene understanding.In fact,many data-dr... Existing visual scene understanding methods mainly focus on identifying coarse-grained concepts about the visual objects and their relationships,largely neglecting fine-grained scene understanding.In fact,many data-driven applications on the Web(e.g.,news-reading and e-shopping)require accurate recognition of much less coarse concepts as entities and proper linking them to a knowledge graph(KG),which can take their performance to the next level.In light of this,in this paper,we identify a new research task:visual entity linking for fine-grained scene understanding.To accomplish the task,we first extract features of candidate entities from different modalities,i.e.,visual features,textual features,and KG features.Then,we design a deep modal-attention neural network-based learning-to-rank method which aggregates all features and maps visual objects to the entities in KG.Extensive experimental results on the newly constructed dataset show that our proposed method is effective as it significantly improves the accuracy performance from 66.46%to 83.16%compared with baselines. 展开更多
关键词 Knowledge graph multi-modal learning Entity linking Learning to rank Knowledge graph representation
原文传递
基于多模态知识图谱的中文跨模态实体对齐方法 被引量:2
18
作者 王欢 宋丽娟 杜方 《计算机工程》 CAS CSCD 北大核心 2023年第12期88-95,共8页
多模态数据间交互式任务的出现对综合利用不同模态的知识提出了较高的要求,因此多模态知识图谱应运而生。在多模态知识图谱的构建过程中图像与文本实体是否指代同一对象尤为重要,这要求对中文跨模态实体进行实体对齐。针对该问题,提出... 多模态数据间交互式任务的出现对综合利用不同模态的知识提出了较高的要求,因此多模态知识图谱应运而生。在多模态知识图谱的构建过程中图像与文本实体是否指代同一对象尤为重要,这要求对中文跨模态实体进行实体对齐。针对该问题,提出一种基于多模态知识图谱的中文跨模态实体对齐方法。将图像信息引入实体对齐任务,面向领域细粒度图像和中文文本,设计单双流交互预训练语言模型(CCMEA)。基于自监督学习方法,利用视觉和文本编码器提取视觉和文本特征,并通过交叉编码器进行精细建模,最终采用对比学习方法计算图像和文本实体的匹配度。实验结果表明,在MUGE和Flickr30k-CN数据集上,CCMEA模型的平均召回率(MR)相比于WukongViT-B基线模型分别提升了3.20和11.96个百分点,并在自建的TEXTILE数据集上MR达到94.3%。上述实验结果证明了该方法可以有效对齐中文跨模态实体,并且具有较高的准确性和实用性。 展开更多
关键词 多模态 知识图谱 实体对齐 自监督 纺织行业
下载PDF
基于LEBERT的多模态领域知识图谱构建 被引量:3
19
作者 李华昱 付亚凤 +1 位作者 闫阳 李家瑞 《计算机系统应用》 2022年第11期79-90,共12页
多模态知识图谱(multi-modal knowledge graph,MMKG)是近几年新兴的人工智能领域研究热点.本文提供了一种多模态领域知识图谱的构建方法,以解决计算机学科领域知识体系庞大分散的问题.首先,通过爬取计算机学科的相关多模态数据,构建了... 多模态知识图谱(multi-modal knowledge graph,MMKG)是近几年新兴的人工智能领域研究热点.本文提供了一种多模态领域知识图谱的构建方法,以解决计算机学科领域知识体系庞大分散的问题.首先,通过爬取计算机学科的相关多模态数据,构建了一个系统化的多模态知识图谱.但构建多模态知识图谱需要耗费大量的人力物力,本文训练了基于LEBERT模型和关系抽取规则的实体-关系联合抽取模型,最终实现了一个能够自动抽取关系三元组的多模态计算机学科领域知识图谱. 展开更多
关键词 多模态 知识图谱 领域 LEBERT 关系抽取规则 Lexicon Adapter
下载PDF
多模态耦合特征子空间正则的SVDD 被引量:1
20
作者 王闯 胡文军 +1 位作者 刘闯 王余波 《湖州师范学院学报》 2023年第8期51-61,共11页
针对传统支持向量数据描述(SVDD)方法无法用于多模态数据异常检测的问题,提出一种新颖的用于处理多模态数据的SVDD方法.该方法将多模态数据通过投影矩阵映射到公共低维子空间,再利用多模态图正则SVDD来保持模态内与模态间的结构关系,同... 针对传统支持向量数据描述(SVDD)方法无法用于多模态数据异常检测的问题,提出一种新颖的用于处理多模态数据的SVDD方法.该方法将多模态数据通过投影矩阵映射到公共低维子空间,再利用多模态图正则SVDD来保持模态内与模态间的结构关系,同时利用稀疏投影矩阵正则SVDD来降低原始空间中的特征耦合影响.该方法称为耦合特征子空间正则的支持向量数据描述(CFSR-SVDD).实验结果表明,所提出的方法在精度和稳定性上具有更好的优势. 展开更多
关键词 一类分类 多模态数据 支持向量数据描述 子空间学习 多模态图
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部