期刊文献+
共找到46篇文章
< 1 2 3 >
每页显示 20 50 100
基于动态词典匹配的语义增强中文命名实体识别算法 被引量:6
1
作者 陈曙东 罗超 +1 位作者 欧阳小叶 李威 《无线电工程》 北大核心 2021年第7期519-525,共7页
在命名实体识别任务中,运用词典匹配的方法能够添加丰富的文本特征,但匹配到的词组信息多使用静态归一化的方法,缺乏自动推理能力。提出了基于动态词典匹配的语义增强中文命名实体识别方法。对输入句子中的字符,在词典中进行动态词组匹... 在命名实体识别任务中,运用词典匹配的方法能够添加丰富的文本特征,但匹配到的词组信息多使用静态归一化的方法,缺乏自动推理能力。提出了基于动态词典匹配的语义增强中文命名实体识别方法。对输入句子中的字符,在词典中进行动态词组匹配,利用神经网络对词组加权,结合word2vec与ALBERT得到字符的增强特征表示;在序列建模层运用BiLSTM对字符的word2vec向量与字符增强特征进行模型训练;在标签推理层运用条件随机场(Conditional Random Field,CRF)识别命名实体。在中文Resume和Weibo数据集上进行实验,验证结果表明,该方法比传统方法具有更好的效果。 展开更多
关键词 命名实体识别 词典匹配 语义增强 神经网络 ALBERT
下载PDF
基于强化语义的中文广告文本识别技术研究
2
作者 赵伟 邓叶勋 +3 位作者 赵建强 李文瑞 韩冰 欧荣安 《计算机技术与发展》 2021年第3期65-69,110,共6页
互联网是广告推广的重要媒介,但是低质、诈骗、违法等违规广告也大量充斥其中,严重污染网络空间,因此,实现恶意广告的有效甄别对构建安全清朗的网络环境意义重大。针对各类违法违规中文广告内容的识别需求,利用Bert(bidirectional encod... 互联网是广告推广的重要媒介,但是低质、诈骗、违法等违规广告也大量充斥其中,严重污染网络空间,因此,实现恶意广告的有效甄别对构建安全清朗的网络环境意义重大。针对各类违法违规中文广告内容的识别需求,利用Bert(bidirectional encoder representation from transformers)和Word2vec分别提取文本字粒度和词粒度嵌入特征,使用CNN(convolutional neural networks)网络对Bert高层特征做深层抽取,同时将词粒度特征向量输入到双向LSTM(long short-term memory)网络提取全局语义,并采用Attention机制对语义特征强化,将强化特征和Bert字粒度特征进行融合,充分利用动态词向量和静态词向量的语义表征优势,提出一种基于强化语义的中文广告识别模型CARES(Chinese advertisement text recognition based on enhanced semantic)。在真实的社交聊天文本数据集上的实验表明,与使用卷积神经网络、循环神经网络等文本分类模型相比,CARES模型分类性能最优,能更加精确识别社交聊天文本中的广告内容,模型识别的正确率达到97.73%。 展开更多
关键词 广告文本分类 语义强化 特征融合 预训练 注意力机制
下载PDF
基于注意力机制的全景分割网络 被引量:2
3
作者 雷海卫 何方圆 +1 位作者 贾博慧 吴倩 《微电子学与计算机》 2022年第1期39-45,共7页
针对全景分割的背景类实例重叠问题,提出了一种基于注意力机制的全景分割网络(Attention-guided Panoptic Segmentation Network,APSNet)。APSNet基于UPSNet网络进行改进.首先,在残差网络和特征金字塔之间添加一种可以同时在空间注意力... 针对全景分割的背景类实例重叠问题,提出了一种基于注意力机制的全景分割网络(Attention-guided Panoptic Segmentation Network,APSNet)。APSNet基于UPSNet网络进行改进.首先,在残差网络和特征金字塔之间添加一种可以同时在空间注意力和通道注意力上建模的三重态注意力机制,通过学习通道和空间特征信息,增强特征金字塔的特征提取能力;其次,在语义分割部分中,添加一种语义增强注意力机制,通过聚合多层次特征和学习空间特征信息,提升语义分割对于背景和前景的分割效果.对比实验表明,APSNet的全景质量提升了0.8%,实例级全景质量提升了2.7%,同时可以在一定程度上降低全景融合时实例分割与语义分割所发生背景类实例重叠的概率. 展开更多
关键词 全景分割 背景类实例重叠 三重态注意力机制 语义增强注意力机制
下载PDF
融合词向量语义增强和DTM模型的公共政策文本时序建模与演化分析——以“大数据领域”为例 被引量:14
4
作者 闫盛枫 《情报科学》 CSSCI 北大核心 2021年第9期146-154,共9页
【目的/意义】探测特定领域政策文本语义主题,揭示我国政策部署领域与未来发展趋势。【方法/过程】提出一种融合词向量语义增强和DTM模型的公共政策文本时序建模与可视化方法,采用DTM模型实现政策文本的时序切割和主题建模,利用深度学习... 【目的/意义】探测特定领域政策文本语义主题,揭示我国政策部署领域与未来发展趋势。【方法/过程】提出一种融合词向量语义增强和DTM模型的公共政策文本时序建模与可视化方法,采用DTM模型实现政策文本的时序切割和主题建模,利用深度学习Word2vec算法中Skip-gram词嵌入技术可以对上下文词汇进行有效预测,增强其语义表达性和政策解释性,以更为准确地揭示我国公共政策的部署重点。【结果/结论】实验表明本文提出的方法对于公共政策主题识别和政策文本量化具有更好的知识抽取和语义表达能力,对我国公共政策挖掘和信息揭示具有良好的揭示。【创新/局限】提出融合词向量语义增强和DTM模型的公共政策文本时序建模方法,一定程度上提升了政策文本的主题语义表达,未来考虑利用深度学习技术如LSTM算法、BERT模型等识别政策中的领域知识单元和语法结构。 展开更多
关键词 词向量 语义增强 公共政策 政策量化 主题建模 演化分析
原文传递
基于Mask RCNN的桥梁裂缝检测方法设计及研究 被引量:9
5
作者 廖延娜 豆丹阳 《应用光学》 CAS CSCD 北大核心 2022年第1期100-105,118,共7页
裂缝是桥梁道路上常见的一种病害,针对其检测准确率有待提高的问题,提出了基于Mask RCNN(region-based convolutional neural networks)的桥梁裂缝检测算法,设计了语义增强模块(semantic enhancement module,SEM),将该模块与特征金字塔... 裂缝是桥梁道路上常见的一种病害,针对其检测准确率有待提高的问题,提出了基于Mask RCNN(region-based convolutional neural networks)的桥梁裂缝检测算法,设计了语义增强模块(semantic enhancement module,SEM),将该模块与特征金字塔网络(feature pyramid network,FPN)相结合,通过特征融合Add计算得到新的多尺度特征图feature maps。针对裂缝形态复杂多样存在识别困难的问题,将裂缝做了两类划分进行检测,并制定了两种策略进行对比实验。实验结果表明:该文中改进的方法可以得到更好的检测结果,检测准确率Accuracy可达99.8%,平均检测精度(mean average precision,mAP)提高了12.6%。 展开更多
关键词 Mask RCNN算法 特征金字塔 语义增强 裂缝分类
下载PDF
局部表面参数化的实景三角网模型语义增强方法 被引量:9
6
作者 汪利斌 胡翰 +2 位作者 朱庆 丁雨淋 陈敏 《测绘学报》 EI CSCD 北大核心 2020年第2期225-234,共10页
倾斜摄影测量方法已可自动获取城市规模的实景三角网模型,然而散乱的三角网缺乏精细的几何结构和功能语义信息。为克服上述问题,提出一种局部表面参数化的实景三角网模型语义增强方法:将具有语义信息的独立三维部件与实景三角网模型的... 倾斜摄影测量方法已可自动获取城市规模的实景三角网模型,然而散乱的三角网缺乏精细的几何结构和功能语义信息。为克服上述问题,提出一种局部表面参数化的实景三角网模型语义增强方法:将具有语义信息的独立三维部件与实景三角网模型的无缝融合问题,通过定义三维表面结构树,转换为局部区域的三角网替换操作;在待融合区域附近,将原实景三角网模型和替换的三维语义部件,通过局部参数化表达,UV展开为二维平面三角网;在二维平面上构建约束Delaunay三角网(CDT),实现两模型的无缝拼接,逆映射至三维空间并自动重建语义部件。通过深圳某区域的倾斜影像进行的试验证明,本文方法能有效实现具有开放边界和语义信息的部件模型与表面模型的无缝融合。与商业软件Maya对比,这种基于插入、融合的手段对提高建模效率具有实用价值。 展开更多
关键词 三维表面结构树 局部表面参数化 三角网模型 语义增强 倾斜摄影测量
下载PDF
融合语义增强的社交媒体虚假信息检测方法研究 被引量:4
7
作者 王昊 龚丽娟 +2 位作者 周泽聿 范涛 王永生 《数据分析与知识发现》 CSCD 北大核心 2023年第2期48-60,共13页
【目的】通过构建自动化检测模型有效识别社交媒体中的虚假信息,探讨如何解决人工识别、单特征机器学习等现存方法难以兼顾海量数据处理的速度与准确性的问题。【方法】本文以新浪微博社交平台为研究对象,以单一文本特征BFID模型作为实... 【目的】通过构建自动化检测模型有效识别社交媒体中的虚假信息,探讨如何解决人工识别、单特征机器学习等现存方法难以兼顾海量数据处理的速度与准确性的问题。【方法】本文以新浪微博社交平台为研究对象,以单一文本特征BFID模型作为实验基准模型,提出两种融合语义增强的虚假信息检测方法。【结果】以单一文本特征BFID模型的结果为基线,本文提出的融合情感特征的BFID-SEN模型在虚假信息识别的部分准确率上提升约1.59个百分点;融合图片特征的BFID-IMG模型通过结合深度残差网络ResNet,在虚假信息识别的部分准确率上稳定提升约0.78个百分点。【局限】由于融合情感特征的语料数量、情感类别与多模态虚假信息数据集有限,模型训练不充分,因此语义增强的融合效果有限。【结论】本文提出的两种融合语义增强方法均能在一定程度上更好地识别虚假信息。 展开更多
关键词 虚假信息 语义增强 多模态 新浪微博 情感分析
原文传递
记忆建构视角下多模态档案资源融合开发模式研究 被引量:3
8
作者 崔浩男 潘洁敏 《档案学研究》 北大核心 2023年第3期96-103,共8页
数字时代,档案资源形态逐步从单一模态向文字、图像、音频、视频等多模态转变。作为第三记忆的原始素材,多模态档案资源可拓展“记忆场”的时空范围,强化长期记忆的形成。多模态档案资源融合开发模式遵循全程管理、语义增强、协同治理... 数字时代,档案资源形态逐步从单一模态向文字、图像、音频、视频等多模态转变。作为第三记忆的原始素材,多模态档案资源可拓展“记忆场”的时空范围,强化长期记忆的形成。多模态档案资源融合开发模式遵循全程管理、语义增强、协同治理、多维叙事的核心原则,依照多元化采集、语义化组织、可视化呈现、故事化叙述的基本流程,并通过后台完成资源管理,中台实现数据关联,前台提供信息服务。该模式将有助于充分发挥档案资源的价值,实现集体记忆与社会记忆的建构,赋能档案开发利用工作的数字化转型。 展开更多
关键词 多模态 档案资源 第三记忆 语义增强 信息服务
原文传递
国内外语义出版实践研究 被引量:6
9
作者 李娇 寇远涛 +2 位作者 黄永文 薛欢欢 鲜国建 《数字图书馆论坛》 CSSCI 2017年第12期25-31,共7页
本文介绍多种国内外重要语义出版机构/平台的实践进展,并从数字资源描述模型、语义知识增强形态、语义出版发布形式三方面对其进行比较分析,对比国内外语义出版的发展现状,总结现有实践研究的共性特征及其存在问题,并探讨我国科技期刊... 本文介绍多种国内外重要语义出版机构/平台的实践进展,并从数字资源描述模型、语义知识增强形态、语义出版发布形式三方面对其进行比较分析,对比国内外语义出版的发展现状,总结现有实践研究的共性特征及其存在问题,并探讨我国科技期刊语义出版模式的发展对策,以期为我国语义出版的研究和实践提供参考。 展开更多
关键词 语义出版 描述模型 语义知识增强 发布形式
下载PDF
基于特征增强网络的交通场景图像语义分割
10
作者 代文娟 谢刚 张浩雪 《太原科技大学学报》 2024年第3期285-291,共7页
针对当前交通场景图像语义分割时,因特征信息提取不足导致分割精度低的问题,提出了特征增强网络(EFN).首先将网络ResNeXt-101中卷积层5-3的输出输入到多尺度特征注意力模块中进行有针对性的特征提取;然后输出结果与卷积层2-3、卷积层3-... 针对当前交通场景图像语义分割时,因特征信息提取不足导致分割精度低的问题,提出了特征增强网络(EFN).首先将网络ResNeXt-101中卷积层5-3的输出输入到多尺度特征注意力模块中进行有针对性的特征提取;然后输出结果与卷积层2-3、卷积层3-3和卷积层4-3提取的特征图通过特征融合模块进行高效的特征融合,最后利用上采样得到图像分割结果。在数据集CamVid上的实验结果表明特征增强网络可有效提高交通场景图像语义分割的精准度。 展开更多
关键词 语义分割 多尺度特征 注意力机制 特征融合模块 语义增强
下载PDF
基于语义和结构增强的时序知识图谱问答方法
11
作者 黄政霖 董宝良 《计算机与现代化》 2024年第3期15-23,共9页
知识图谱作为自然语言处理领域中的热门研究主题之一,一直受到学术界的广泛关注。在现实中,知识问答过程往往携带时间信息,因此,近年来,应用时序知识图谱来完成知识问答的技术广泛受到学者的青睐。传统的时序知识图谱问答技术主要通过... 知识图谱作为自然语言处理领域中的热门研究主题之一,一直受到学术界的广泛关注。在现实中,知识问答过程往往携带时间信息,因此,近年来,应用时序知识图谱来完成知识问答的技术广泛受到学者的青睐。传统的时序知识图谱问答技术主要通过对问题进行编码来完成推理过程,但其无法处理问题中包含的复杂的实体和时间关系。基于此,提出一种基于语义和结构增强的时序知识图谱问答方法,在推理过程中兼顾问题的语义信息和结构信息,提升对复杂问题正确回答的概率。首先,该方法解析出问题中的隐式时间表达,并基于时序知识图谱中的信息,用直接表达方式改写问题,再根据问题集合中的时间粒度,按照不同的时间粒度聚合时序知识图谱中的时间信息。其次,基于问题中的实体信息和时间信息,对问题语义信息进行表示和融合,以加强对于实体和时间语义的学习。再次,基于提取到的实体完成子图提取,并利用图卷积神经网络提取子图的结构信息。最后,将融合后的问题语义信息与结构信息进行拼接,并对候选答案进行评分,选取评分最高的实体作为答案。在MultiTQ数据集上进行对比测试,实验结果表明,提出的模型优于其他基准模型。 展开更多
关键词 语义增强 结构增强 图神经网络 时序知识图谱问答
下载PDF
融合字词语义信息的猕猴桃种植领域命名实体识别研究 被引量:5
12
作者 李书琴 张明美 刘斌 《农业机械学报》 EI CAS CSCD 北大核心 2022年第12期323-331,共9页
针对猕猴桃种植领域命名实体识别任务中实体词复杂度较高,识别精确率较低的问题,提出一种融合字词语义信息的猕猴桃种植实体识别方法。以BiGRU-CRF为基本模型,融合词级别和字符级别的信息。在词级别上,通过引入词集信息,并使用多头自注... 针对猕猴桃种植领域命名实体识别任务中实体词复杂度较高,识别精确率较低的问题,提出一种融合字词语义信息的猕猴桃种植实体识别方法。以BiGRU-CRF为基本模型,融合词级别和字符级别的信息。在词级别上,通过引入词集信息,并使用多头自注意力(Multiple self-attention mechanisms,MHA)调整词集中不同词的权重;同时使用注意力机制忽略不可靠的词集,将注意力集中在重要的词集上,从而提高实体识别效果;在字符级别上,引入无监督的基于转换器的双向编码表征(Bidirectional encoder representations form transformers,BERT)预训练模型增强字的语义表示。在包含12477条标注样本和7个类别实体的猕猴桃种植领域自制语料上进行了实验,结果表明,本文模型与SoftLexicon模型相比,F1值提高1.58个百分点。此外,本文模型在公开数据集ResumeNER上与Lattice-LSTM、WC-LSTM等模型进行实验对比取得了最佳效果,F1值达到96.17%,表明本文模型具有一定的泛化能力。 展开更多
关键词 猕猴桃种植 命名实体识别 字词融合 语义增强 自注意力机制 预训练语言模型
下载PDF
线性文化遗产数据语义增强机制:认知框架与技术体系
13
作者 孙绍丹 《情报资料工作》 北大核心 2024年第5期64-72,共9页
[目的/意义]在国家文化数字化战略背景下,以线性文化遗产数据为研究对象,从哲学视角审视线性文化遗产数据语义增强机制,推动线性文化遗产数据智慧化建设。[方法/过程]文章主要从“道”“器”“用”三个维度构建线性文化遗产数据语义增... [目的/意义]在国家文化数字化战略背景下,以线性文化遗产数据为研究对象,从哲学视角审视线性文化遗产数据语义增强机制,推动线性文化遗产数据智慧化建设。[方法/过程]文章主要从“道”“器”“用”三个维度构建线性文化遗产数据语义增强机制的认知框架,以信息加工理论和认知图式理论为基础,以用户对线性文化遗产的渐进性认知过程为研究主线,提炼出“用户感知与数据编码”“内容表征与知识联结”“语义拓展与情境解释”三个螺旋上升式认知过程,在此基础上构建线性文化遗产数据语义增强机制的技术体系。[结果/结论]文章提出的认知框架和技术体系,从顶层设计维度为线性文化遗产数据智慧化管理及开发利用提供理论层面的路径参考,为打造线性文化遗产智慧数据基础设施提供坚实的理论基础。 展开更多
关键词 线性文化遗产 语义增强 认知框架 技术体系
原文传递
基于语义增强的网络安全实体识别
14
作者 林宏刚 赵航宇 陈麟 《计算机工程与设计》 北大核心 2024年第9期2584-2590,共7页
从大规模、异构和非结构化的网络空间安全信息文本中识别网络安全实体时,因为实体高频变化和随机性强的特点,导致容易出现实体稀疏的问题,为此提出一种基于语义增强的网络安全实体识别模型。从多维语言学特征增强和语料增强两个方面获... 从大规模、异构和非结构化的网络空间安全信息文本中识别网络安全实体时,因为实体高频变化和随机性强的特点,导致容易出现实体稀疏的问题,为此提出一种基于语义增强的网络安全实体识别模型。从多维语言学特征增强和语料增强两个方面获取语义增强输入矩阵;利用双向长短记忆网络获取输入矩阵的上下文特征;基于注意力机制对输出的特征生成注意力分配系数,用前馈神经网络聚合和编码来自不同空间的特征;使用条件随机场计算生成最优实体识别序列。实验结果表明,该模型对网络安全实体进行识别,结果显著优于通用领域实体识别模型;与其它网络安全实体识别模型相比较,该模型能得到更好的效果。 展开更多
关键词 网络安全 网络威胁情报 实体识别 自然语言处理 预训练 语义增强 注意力机制
下载PDF
语义增强与高阶强交互的SAR图像舰船检测
15
作者 郭伟 杨涵西 +1 位作者 李煜 王春艳 《遥感信息》 CSCD 北大核心 2024年第3期32-39,共8页
合成孔径雷达(synthetic aperture radar,SAR)图像背景信息复杂、舰船目标边缘模糊,且多为容易丢失的小尺度舰船目标。针对上述问题,提出语义增强与高阶强交互的SAR图像舰船检测。该方法利用部分卷积与非对称卷积构建部分非对称卷积聚... 合成孔径雷达(synthetic aperture radar,SAR)图像背景信息复杂、舰船目标边缘模糊,且多为容易丢失的小尺度舰船目标。针对上述问题,提出语义增强与高阶强交互的SAR图像舰船检测。该方法利用部分卷积与非对称卷积构建部分非对称卷积聚合网络,在减少计算复杂度、轻量化主干网络的同时,更好地捕捉多尺度舰船特征,同时在上采样部分引入双层路由注意力,增强对图像上下文信息的利用。另外,通过递归的方式进行特征提取,可以较好解决区域内信息交互的问题,实现不同级别特征之间的高阶交互建模,提升模型检测能力。在公开的HRSID遥感数据集上进行实验的结果表明,该方法的检测精度达到91.23%,相比原模型提升5.13%,准确率与召回率分别提升2.41%和7.16%,与主流算法相比具有较好的检测效果。 展开更多
关键词 合成孔径雷达 目标检测 语义增强 高阶强交互 特征提取
下载PDF
基于语义增强的藏医药命名实体识别研究
16
作者 才让加措 拥措 +2 位作者 拉毛东只 张英 周青 《中国数字医学》 2024年第5期53-58,共6页
针对通用藏文预训练语言模型在处理藏医数据时无法适应且存在词信息损失的问题,提出了一种融合藏医词汇特征与通用藏文预训练模型字特征的方法,以改善对藏医学专有名词的识别,并增强模型对藏医领域的理解能力。该方法通过构建藏医领域... 针对通用藏文预训练语言模型在处理藏医数据时无法适应且存在词信息损失的问题,提出了一种融合藏医词汇特征与通用藏文预训练模型字特征的方法,以改善对藏医学专有名词的识别,并增强模型对藏医领域的理解能力。该方法通过构建藏医领域的特征词典,并利用词典来获取训练数据中每个字潜在的匹配词集,接着将词集特征嵌入字符表示中来增强藏医字符的表征能力。经实验表明,仅使用通用藏文预训练模型会降低对藏医实体识别的性能。融合词集特征后,F1值明显提高了17.19%,验证了此方法不仅能补充预训练模型缺乏的词汇信息,还可以有效缓解模型与藏医数据不匹配的问题。 展开更多
关键词 命名实体识别 藏医学 语义增强 预训练语言模型
下载PDF
基于主题感知和语义增强的作文自动评分方法
17
作者 陈宇航 杨勇 +4 位作者 先木斯亚·买买提明 帕力旦·吐尔逊 樊小超 任鸽 刁宇峰 《计算机工程》 CAS CSCD 北大核心 2024年第8期363-371,共9页
作文自动评分(AES)是教育领域中应用自然语言处理(NLP)技术的重要研究方向之一,其旨在提高评分效率,增强评价的客观性和可靠性。针对主题相关性缺失和长文本信息丢失问题以及预训练语言模型BERT不同层次能够提取不同维度特征的特点,提... 作文自动评分(AES)是教育领域中应用自然语言处理(NLP)技术的重要研究方向之一,其旨在提高评分效率,增强评价的客观性和可靠性。针对主题相关性缺失和长文本信息丢失问题以及预训练语言模型BERT不同层次能够提取不同维度特征的特点,提出一种基于主题感知和语义增强的作文自动评分模型。该模型采用多头注意力机制提取作文的浅层语义特征并感知作文主题特征,同时利用BERT的中间层句法特征和深层语义特征增强对作文语义的理解。在此基础上,融合不同维度的特征并用于作文自动评分。实验结果表明,该模型在公共数据集ASAP的8个子集上均表现出了显著的性能优势,相比于通义千问等基线模型,其能够有效提升作文自动评分性能,平均二次加权的卡帕值(QWK)达到80.25%。 展开更多
关键词 作文自动评分 语义增强 主题感知 特征融合 预训练语言模型
下载PDF
基于深度语义匹配模型的智能客服系统设计
18
作者 吴石松 董召杰 《自动化技术与应用》 2024年第7期176-180,共5页
为保证智能服务的及时性,最大程度提升用户对智能服务的满意度,设计基于深度语义匹配模型的智能客服系统。用户通过交互层智能终端发送服务请求,通过数据层分析请求内容并查询其历史请求记录;将分析结果和查询结果传输至功能层;同时利... 为保证智能服务的及时性,最大程度提升用户对智能服务的满意度,设计基于深度语义匹配模型的智能客服系统。用户通过交互层智能终端发送服务请求,通过数据层分析请求内容并查询其历史请求记录;将分析结果和查询结果传输至功能层;同时利用卷积深度语义匹配模型完成语义增强和匹配,并生成应答对话,将应答结果呈现至交互层,实现服务的交互。测试结果表明:学习率的取值为0.4时,系统可在训练次数为300次时完成训练,损失值接近为0;能够依据用户发送的内容文本识别用户情绪,在实行情绪安抚的同时提供应答服务。 展开更多
关键词 深度语义 匹配模型 智能客服系统 语义增强 系统设计
下载PDF
基于注意力机制语义增强的文档级关系抽取
19
作者 柳先辉 吴文达 +1 位作者 赵卫东 侯文龙 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第5期822-828,共7页
文档级关系抽取旨在从文档中抽取出多个实体对之间的关系,具有较高的复杂性。针对文档级关系抽取中的多实体、关系相关性、关系分布不平衡等问题,提出了一种基于注意力机制(Attention)语义增强的文档级关系抽取方法,能够实现实体对之间... 文档级关系抽取旨在从文档中抽取出多个实体对之间的关系,具有较高的复杂性。针对文档级关系抽取中的多实体、关系相关性、关系分布不平衡等问题,提出了一种基于注意力机制(Attention)语义增强的文档级关系抽取方法,能够实现实体对之间关系的推理。具体来说,首先在数据编码模块改进编码策略,引入更多实体信息,通过编码网络捕获文档的语义特征,获得实体对矩阵;然后,设计了一个基于Attention门控机制的U-Net网络,对实体对矩阵进行局部信息捕获和全局信息汇总,实现语义增强;最后,使用自适应焦点损失函数缓解关系分布不平衡的问题。在4个公开的文档级关系抽取数据集(DocRED、CDR、GDA和DWIE)上评估了Att-DocuNet模型并取得了良好的实验结果。 展开更多
关键词 文档级关系抽取 注意力机制 语义增强 焦点损失
下载PDF
基于深度多模态关联学习的短视频多标签分类研究
20
作者 李云 卢志翔 +3 位作者 刘姝伊 王粟 吕梓民 井佩光 《数据分析与知识发现》 EI CSCD 北大核心 2024年第7期77-88,共12页
【目的】充分利用模态互补性,增强模态之间和模态与标签之间的相关性,实现高度准确的分类效果。【方法】提出一种基于多模态语义增强及图卷积网络的短视频多标签分类算法,利用短视频中的多模态信息进行多标签分类任务。【结果】算法分... 【目的】充分利用模态互补性,增强模态之间和模态与标签之间的相关性,实现高度准确的分类效果。【方法】提出一种基于多模态语义增强及图卷积网络的短视频多标签分类算法,利用短视频中的多模态信息进行多标签分类任务。【结果】算法分类精度达87.15%,比最优的基准算法提升了6.82个百分点。【局限】模态融合增强信息存在冗余信息,这些冗余掩盖了模态之间的相关性;此外,基于多模态的多标签分类研究较为有限。【结论】本文算法能够提高模态之间的互补性,增强模态与类别之间的相关性,提高分类准确性。 展开更多
关键词 多模态融合 语义增强 图卷积网络 短视频
原文传递
上一页 1 2 3 下一页 到第
使用帮助 返回顶部