期刊文献+
共找到32篇文章
< 1 2 >
每页显示 20 50 100
深度自动编码器的研究与展望 被引量:41
1
作者 曲建岭 杜辰飞 +2 位作者 邸亚洲 高峰 郭超然 《计算机与现代化》 2014年第8期128-134,共7页
深度学习是机器学习的一个分支,开创了神经网络发展的新纪元。作为深度学习结构的主要组成部分之一,深度自动编码器主要用于完成转换学习任务,同时在无监督学习及非线性特征提取过程中也扮演着至关重要的角色。首先介绍深度自动编码器... 深度学习是机器学习的一个分支,开创了神经网络发展的新纪元。作为深度学习结构的主要组成部分之一,深度自动编码器主要用于完成转换学习任务,同时在无监督学习及非线性特征提取过程中也扮演着至关重要的角色。首先介绍深度自动编码器的发展由来、基本概念及原理,然后介绍它的构建方法以及预训练和精雕的一般步骤,并对不同类型深度自动编码器进行总结,最后在深入分析深度自动编码器目前存在的问题的基础上,对其未来发展趋势进行展望。 展开更多
关键词 深度学习 深度自动编码器 预训练 精雕 神经网络
下载PDF
一种基于自演化预训练的多变量时间序列预测算法 被引量:11
2
作者 万晨 李文中 +3 位作者 丁望祥 张治杰 叶保留 陆桑璐 《计算机学报》 EI CAS CSCD 北大核心 2022年第3期513-525,共13页
时间序列预测是典型的时间序列分析任务,对于辅助决策、资源配置、提前采取止损措施等方面有重要意义,在包括电力、气象、交通、商业等领域有广泛应用.近年来,时间序列预测算法一直是机器学习的热门研究领域,其中多变量时间序列预测是... 时间序列预测是典型的时间序列分析任务,对于辅助决策、资源配置、提前采取止损措施等方面有重要意义,在包括电力、气象、交通、商业等领域有广泛应用.近年来,时间序列预测算法一直是机器学习的热门研究领域,其中多变量时间序列预测是一个具有挑战性的任务.本文研究多变量时间序列预测的局部变量预测精度问题,即多变量预测需要在提升整体预测性能的同时保证局部单变量的预测精度.针对现有多变量时间序列预测算法不能保障局部变量预测精度的局限性,我们设计并实现了一种基于自演化预训练的多变量时间序列预测算法SEPNets.基于预训练的思想,SEPNets首先构建和训练单变量时间序列模型作为后续建模的基准.然后,通过拓展时序卷积网络和长短记忆(LSTM)单元来建模变量间复杂的时序依赖关系.通过将预训练模型和拓展模型进行融合再训练,SEPNets可以保障多变量时间序列预测的局部变量预测精度,并提升总体的预测性能.我们在5个真实数据集上对所提模型进行性能评估.实验结果表明,本文提出的SEPNets算法比现有算法获得相对最高的预测精度,同时在保障局部变量预测精度上具有更好的性能. 展开更多
关键词 时间序列预测 多变量时间序列 机器学习 神经网络 预训练
下载PDF
预训练语言模型BERT在下游任务中的应用 被引量:6
3
作者 段瑞雪 巢文宇 张仰森 《北京信息科技大学学报(自然科学版)》 2020年第6期77-83,共7页
BERT模型是一种全新的语言模型,其采用微调的双向Transformer编码实现,利用fine-tuning的方式进行预训练,实际使用时,只需要根据具体任务额外增加一个输出层就可以用来解决特定任务,克服了传统词嵌入模型对不同任务定义不同网络结构的... BERT模型是一种全新的语言模型,其采用微调的双向Transformer编码实现,利用fine-tuning的方式进行预训练,实际使用时,只需要根据具体任务额外增加一个输出层就可以用来解决特定任务,克服了传统词嵌入模型对不同任务定义不同网络结构的缺点。为了更好地理解BERT模型及其效果,首先概述BERT模型的原理,以及BERT的预训练策略,然后介绍了如何将BERT模型应用于3个下游任务:文本分类、机器阅读理解和文本摘要,并通过对比实验展示了BERT模型的优势。最后,对未来研究方向进行了展望。 展开更多
关键词 预训练 机器阅读理解 文本分类 文本摘要
下载PDF
A Modified CycleGAN for Multi-Organ Ultrasound Image Enhancement via Unpaired Pre-Training
4
作者 Haonan Han Bingyu Yang +2 位作者 Weihang Zhang Dongwei Li Huiqi Li 《Journal of Beijing Institute of Technology》 EI CAS 2024年第3期194-203,共10页
Handheld ultrasound devices are known for their portability and affordability,making them widely utilized in underdeveloped areas and community healthcare for rapid diagnosis and early screening.However,the image qual... Handheld ultrasound devices are known for their portability and affordability,making them widely utilized in underdeveloped areas and community healthcare for rapid diagnosis and early screening.However,the image quality of handheld ultrasound devices is not always satisfactory due to the limited equipment size,which hinders accurate diagnoses by doctors.At the same time,paired ultrasound images are difficult to obtain from the clinic because imaging process is complicated.Therefore,we propose a modified cycle generative adversarial network(cycleGAN) for ultrasound image enhancement from multiple organs via unpaired pre-training.We introduce an ultrasound image pre-training method that does not require paired images,alleviating the requirement for large-scale paired datasets.We also propose an enhanced block with different structures in the pre-training and fine-tuning phases,which can help achieve the goals of different training phases.To improve the robustness of the model,we add Gaussian noise to the training images as data augmentation.Our approach is effective in obtaining the best quantitative evaluation results using a small number of parameters and less training costs to improve the quality of handheld ultrasound devices. 展开更多
关键词 ultrasound image enhancement handheld devices unpaired images pre-train and finetune cycleGAN
下载PDF
基于预训练的电力时序数据特征提取算法
5
作者 黄建平 张建松 +2 位作者 张旭东 沈思琪 谢裕清 《电子器件》 CAS 2024年第5期1317-1323,共7页
现有的时间序列任务往往训练一个端到端的模型,由于对标签的重度依赖且对相关仪器要求严苛,此过程往往需要消耗大量人力物力。近年在时间序列的预训练领域中,表示学习特别是对比学习逐渐成为了一个新热点并在各类场景取得了广泛且具有... 现有的时间序列任务往往训练一个端到端的模型,由于对标签的重度依赖且对相关仪器要求严苛,此过程往往需要消耗大量人力物力。近年在时间序列的预训练领域中,表示学习特别是对比学习逐渐成为了一个新热点并在各类场景取得了广泛且具有突破性的成效,这些方法通过建模时间序列内在联系给传统时间序列任务带来了提升性能和减少标签重度依赖的可能性。从电力时间序列数据出发,研究表征学习在电力时间序列数据的强大表现并提出一种建模用户粒度的电力时序数据并在该层面上求同存异地提取特征的模型。该模型通过建模社区内用户之间潜在的关系并通过判别式任务增强用户之间的可区分度,使表示学习充分体现用户间的同质元素和异质元素。实验发现本模型在国家电网数据集及其下游任务中得到了优于基线模型10%~15%的效果,并在一些公开数据集中得到一定程度的提升。这些实验都表明了所提出的通过建模用户间关系优化时间序列表示学习模型的优越性。 展开更多
关键词 时间序列 预训练 电力数据 特征提取 表示学习
下载PDF
卷积神经网络在锚杆锚固类型识别中的应用 被引量:2
6
作者 郑海青 张玉 孙晓云 《济南大学学报(自然科学版)》 CAS 北大核心 2020年第1期35-41,共7页
为了解决手工特征提取方法依赖广泛的专业知识和先验知识,难以挖掘新特征而影响识别结果的问题,将一维卷积神经网络应用于锚杆锚固系统类型识别,以实现端到端的分类过程;为了避免随机初始化卷积核会造成网络在训练时收敛速度慢、易陷入... 为了解决手工特征提取方法依赖广泛的专业知识和先验知识,难以挖掘新特征而影响识别结果的问题,将一维卷积神经网络应用于锚杆锚固系统类型识别,以实现端到端的分类过程;为了避免随机初始化卷积核会造成网络在训练时收敛速度慢、易陷入局部最优等问题,利用稀疏自编码器对网络的卷积核进行预训练,并利用实验锚杆锚固数据对稀疏自编码器一维卷积神经网络模型、传统一维卷积神经网络模型和反向传播神经网络模型进行测试。结果表明:一维卷积神经网络可应用于锚杆锚固系统类型识别,实现端到端的分类过程;在锚杆锚固系统类型识别中,稀疏自编码器一维卷积神经网络模型的准确率高于传统一维卷积神经网络模型和反向传播神经网络模型的准确率,识别率可达98.57%。 展开更多
关键词 一维卷积神经网络 锚杆锚固系统 稀疏自编码器 预训练
下载PDF
中文对话理解中基于预训练的意图分类和槽填充联合模型 被引量:2
7
作者 马常霞 张晨 《山东大学学报(工学版)》 CAS CSCD 北大核心 2020年第6期68-75,共8页
基于预训练和注意机制的意图分类和语义槽填充,提出一种结合双向长短时记忆(bidirectional long short-term memory,BiLSTM)、条件随机场(conditional random fields,CRF)和注意机制的双向编码(bidirectional encoder representations f... 基于预训练和注意机制的意图分类和语义槽填充,提出一种结合双向长短时记忆(bidirectional long short-term memory,BiLSTM)、条件随机场(conditional random fields,CRF)和注意机制的双向编码(bidirectional encoder representations from transformers,BERT)具有双向编码表示和注意机制的联合模型。该模型无需过多依赖手工标签数据和领域特定的知识或资源,避免了目前普遍存在的弱泛化能力。在自主公交信息查询系统语料库上进行的试验表明,该模型意图分类的准确性和语义槽填充F1值分别达到98%和96.3%,均产生有效改进。 展开更多
关键词 意图分类 槽填充 预训练 双向编码表示 多头注意
原文传递
面向智能视频监控的人体小目标检测 被引量:1
8
作者 杨溢 申昇 +2 位作者 窦知阳 李元 韩振军 《计算机科学》 CSCD 北大核心 2023年第9期75-81,共7页
人体目标检测对社会治理和城市安全具有很重要的现实意义,监控数据是数据安全的重要来源。小目标检测是目前受到广泛关注的安全检测问题中一项具有挑战性的任务,其检测对象为大型图像中少于20个像素的目标。小目标的特征难以表征,其中... 人体目标检测对社会治理和城市安全具有很重要的现实意义,监控数据是数据安全的重要来源。小目标检测是目前受到广泛关注的安全检测问题中一项具有挑战性的任务,其检测对象为大型图像中少于20个像素的目标。小目标的特征难以表征,其中一个主要挑战是,用于预训练/共同训练检测器的数据集(如COCO)与用于微调检测器的数据集(如TinyPerson)之间存在尺度不匹配的情况,这给小目标检测器的性能带来了负面影响。为了解决这个问题,文中提出了一种优化策略,用于匹配不同数据集的尺度,称其为尺度分布搜索(Scale Distribution Search,SDS),同时平衡图片的信息收益(数据集之间的尺度相近)和信息损失(信噪比(SNR)的降低)。该策略使用高斯模型对数据集中目标的尺度分布进行建模,通过迭代的方式寻找最优分布参数;并对比数据集中目标的特征分布和检测器的性能,以找到最佳的尺度分布。通过SDS策略,主流目标检测方法在TinyPerson上实现了更好的性能,证明了SDS策略在提升预训练/共同训练效率上的有效性。 展开更多
关键词 智能视频监控 小目标检测 尺度搜索 预训练
下载PDF
基于卷积神经网络级联的蒙面人脸检测算法 被引量:1
9
作者 卜伟 肖江剑 +3 位作者 周传宏 康齐正 吴宝国 龚迪军 《计量与测试技术》 2018年第10期68-72,共5页
精确地检测蒙面人脸是鉴别和追踪罪犯或者恐怖分子的重要手段,因此,一个高效的蒙面人脸检测算法这对于打击犯罪,维护社会治安稳定有重要意义。然而,由于面具遮挡导致的人脸信息缺失,传统的人脸检测算法很难取得令人满意的结果。针对这... 精确地检测蒙面人脸是鉴别和追踪罪犯或者恐怖分子的重要手段,因此,一个高效的蒙面人脸检测算法这对于打击犯罪,维护社会治安稳定有重要意义。然而,由于面具遮挡导致的人脸信息缺失,传统的人脸检测算法很难取得令人满意的结果。针对这一问题,在本论文中,我们提出了一种适用于蒙面人脸检测的卷积神经网络级联算法。该级联网络共有三级,在训练时,第一级采用整个训练样本集进行训练,之后逐级对前一级训练中分类错误的样本进行训练,以获得更强的辨别能力。这一策略也能避免第一级网络的过度拟合。为了进一步保证算法的检测精度,我们采用迁移学习的方法,利用大型的通用人脸数据集和蒙面人脸数据集来训练和微调分类网络模型。此外,我们还优化了每一级的网络结构,从而提高了计算效率。我们在蒙面人脸的测试数据集上对算法进行测试。实验结果表明,我们在87. 8%的召回率下取得了86. 6%的精确率。并且,相比于传统的卷积神经网络算法,我们的方法具有较高的检测精度和检测效率。 展开更多
关键词 人脸检测 蒙面人脸 卷积神经网络 级联 预训练 微调 深度学习
下载PDF
预训练模型的跨领域跨任务迁移学习 被引量:1
10
作者 丁文博 许玥 《科技资讯》 2020年第2期107-110,共4页
为了解决计算机深度学习时标注数据工作量大、准确度不高、耗时耗力等问题,需要将预先训练好的模型中的数据进行跨领域跨任务迁移学习。基于对不同数据集的迁移效果的研究,试验时将视觉领域中表现良好的ImageNet预训练模型迁移到音频分... 为了解决计算机深度学习时标注数据工作量大、准确度不高、耗时耗力等问题,需要将预先训练好的模型中的数据进行跨领域跨任务迁移学习。基于对不同数据集的迁移效果的研究,试验时将视觉领域中表现良好的ImageNet预训练模型迁移到音频分类任务,通过剔除无声部分、统一音频长度、数据转换和正则化处理这4个步骤,采用经典图像增强和样本混淆两种数据增强方法,以5种不同的方式训练数据集,实验证明:ImageNET目标训练模型的跨领域迁移学习效果显著,但源领域的模型效果和目标领域的最终效果并没有必然联系,且使用同领域相似数据分布的数据集的预训练效果比ImageNet上的预训练效果更差。 展开更多
关键词 迁移学习 预训练 数据集 数据预处理 数据增强
下载PDF
基于T-Fusion的TFP3D人体行为识别算法
11
作者 曾明如 熊嘉豪 祝琴 《计算机集成制造系统》 EI CSCD 北大核心 2023年第12期4032-4039,共8页
针对当前人体行为识别算法中双流卷积神经网络时效性差、3D卷积神经网络参数多、算法的复杂度高等不足,提出了基于3D卷积网络和时空融合网络的时空融合伪3D卷积神经网络模型TFP3D。首先,使用3D卷积拆分减少3D卷积核带来的庞大参数量;其... 针对当前人体行为识别算法中双流卷积神经网络时效性差、3D卷积神经网络参数多、算法的复杂度高等不足,提出了基于3D卷积网络和时空融合网络的时空融合伪3D卷积神经网络模型TFP3D。首先,使用3D卷积拆分减少3D卷积核带来的庞大参数量;其次,增加时空融合模块T-Fusion,保证人体行为信息时空特征的有效传递;最后,使用Kinetics数据集对深层模型进行预训练,在保证准确率的前提下提升网络速率。在常见的人体行为识别数据集UCFl01上进行了大量的实验分析,并将识别的结果和当前流行的算法进行比较,结果证明所设计的TFP3D优于其他方法,平均识别率相比其他方法有较大的提高。 展开更多
关键词 TFP3D网络 时间融合网络 预训练 行为识别 深度学习
下载PDF
Pre-Train and Learn: Preserving Global Information for Graph Neural Networks
12
作者 Dan-Hao Zhu Xin-Yu Dai Jia-Jun Chen 《Journal of Computer Science & Technology》 SCIE EI CSCD 2021年第6期1420-1430,共11页
Graph neural networks(GNNs)have shown great power in learning on graphs.However,it is still a challenge for GNNs to model information faraway from the source node.The ability to preserve global information can enhance... Graph neural networks(GNNs)have shown great power in learning on graphs.However,it is still a challenge for GNNs to model information faraway from the source node.The ability to preserve global information can enhance graph representation and hence improve classification precision.In the paper,we propose a new learning framework named G-GNN(Global information for GNN)to address the challenge.First,the global structure and global attribute features of each node are obtained via unsupervised pre-training,and those global features preserve the global information associated with the node.Then,using the pre-trained global features and the raw attributes of the graph,a set of parallel kernel GNNs is used to learn different aspects from these heterogeneous features.Any general GNN can be used as a kernal and easily obtain the ability of preserving global information,without having to alter their own algorithms.Extensive experiments have shown that state-of-the-art models,e.g.,GCN,GAT,Graphsage and APPNP,can achieve improvement with G-GNN on three standard evaluation datasets.Specially,we establish new benchmark precision records on Cora(84.31%)and Pubmed(80.95%)when learning on attributed graphs. 展开更多
关键词 graph neural network network embedding representation learning global information pre-train
原文传递
热处理对FeMnSiCrNi合金防松螺母形状记忆效应的影响
13
作者 杜彦良 李俊良 沈英明 《机械工程材料》 CAS CSCD 北大核心 2005年第1期56-58,共3页
研究了固溶处理工艺、预应变大小和恢复退火温度对FeMnSiCrNi合金螺母形状记忆效应的影响规律。结果表明:对于这种螺母,最佳的固溶处理温度为950℃,最适当的预应变为5%,恢复处理温度不超过400℃。
关键词 FeMnSiCrNi合金 固溶处理温度 预应变 恢复处理温度
下载PDF
基于残差空洞卷积神经网络的网络安全实体识别方法 被引量:10
14
作者 谢博 申国伟 +2 位作者 郭春 周燕 于淼 《网络与信息安全学报》 2020年第5期126-138,共13页
近年来,网络安全威胁日益增多,数据驱动的安全智能分析成为网络安全领域研究的热点。特别是以知识图谱为代表的人工智能技术可为多源异构威胁情报数据中的复杂网络攻击检测和未知网络攻击检测提供支撑。网络安全实体识别是威胁情报知识... 近年来,网络安全威胁日益增多,数据驱动的安全智能分析成为网络安全领域研究的热点。特别是以知识图谱为代表的人工智能技术可为多源异构威胁情报数据中的复杂网络攻击检测和未知网络攻击检测提供支撑。网络安全实体识别是威胁情报知识图谱构建的基础。开放网络文本数据中的安全实体构成非常复杂,导致传统的深度学习方法难以准确识别。在BERT(pre-training of deep bidirectional transformers)预训练语言模型的基础上,提出一种基于残差空洞卷积神经网络和条件随机场的网络安全实体识别模型BERT-RDCNN-CRF。通过BERT模型训练字符级特征向量表示,结合残差卷积与空洞神经网络模型有效提取安全实体的重要特征,最后通过CRF获得每一个字符的BIO标注。在所构建的大规模网络安全实体标注数据集上的实验表明,所提方法取得了比LSTM-CRF模型、BiLSTM-CRF模型和传统的实体识别模型更好的效果。 展开更多
关键词 网络安全 实体识别 残差连接 空洞卷积神经网络 BERT预训练模型
下载PDF
基于弱监督预训练CNN模型的情感分析方法 被引量:9
15
作者 张越 夏鸿斌 《计算机工程与应用》 CSCD 北大核心 2018年第13期27-33,共7页
传统的情感分析研究大多基于机器学习算法,此类方法依赖大量人工抽取的特征与领域知识。使用卷积神经网络自动学习文本的特征表示,进而判别文本的情感极性。为了解决情感分析中监督训练样本不足的问题,利用大规模弱监督数据来训练卷积... 传统的情感分析研究大多基于机器学习算法,此类方法依赖大量人工抽取的特征与领域知识。使用卷积神经网络自动学习文本的特征表示,进而判别文本的情感极性。为了解决情感分析中监督训练样本不足的问题,利用大规模弱监督数据来训练卷积神经网络。同时引入"预训练-微调"策略,先在弱监督数据集上对卷积神经网络进行预训练,然后使用监督数据集进行微调训练来克服弱监督数据中的噪声问题。在SemEval-2013 Twitter情感分析数据集上进行实验验证,结果表明由于引入了弱监督数据参与训练,有效增强了卷积神经网络学习情感语义的能力,从而提升了模型的准确性。 展开更多
关键词 情感分析 弱监督 预训练-微调 卷积神经网络
下载PDF
改进SSD的灵武长枣图像轻量化目标检测方法 被引量:8
16
作者 王昱潭 薛君蕊 《农业工程学报》 EI CAS CSCD 北大核心 2021年第19期173-182,共10页
针对加载预训练模型的传统SSD(Single Shot MultiBox Detector)模型不能更改网络结构,设备内存资源有限时便无法使用的问题,该研究提出一种不使用预训练模型也能达到较高检测精度的灵武长枣图像轻量化目标检测方法。首先,建立灵武长枣... 针对加载预训练模型的传统SSD(Single Shot MultiBox Detector)模型不能更改网络结构,设备内存资源有限时便无法使用的问题,该研究提出一种不使用预训练模型也能达到较高检测精度的灵武长枣图像轻量化目标检测方法。首先,建立灵武长枣目标检测数据集。其次,以提出的改进DenseNet网络为主干网络,并将Inception模块替换SSD模型中的前3个额外层,同时结合多级融合结构,得到改进SSD模型。然后,通过对比试验证明改进DenseNet网络和改进SSD模型的有效性。在灵武长枣数据集上的试验结果表明,不加载预训练模型的情况下,改进SSD模型的平均准确率(mAP,mean Average Precision)为96.60%,检测速度为28.05帧/s,参数量为1.99×10^(6),比SSD模型和SSD模型(预训练)的mAP分别高出2.02个百分点和0.05个百分点,网络结构参数量比SSD模型少11.14×10^(6),满足轻量化网络的要求。即使在不加载预训练模型的情况下,改进SSD模型也能够很好地完成灵武长枣图像的目标检测任务,研究结果也可为其他无法加载预训练模型的目标检测任务提供新方法和新思路。 展开更多
关键词 图像处理 目标检测 灵武长枣 预训练模型 SSD模型 DenseNet网络 Inception模块
下载PDF
基于预训练GRU-LightGBM的电力负荷预测 被引量:7
17
作者 张晓 丁云峰 王刚 《计算机系统应用》 2021年第8期288-292,共5页
本文研究工作围绕电网中的核心环节电负荷预测展开.在总结分析之前研究学者的研究成果基础上,提出了基于预训练GRU与LightGBM相结合的方法.该方法首先使用电负荷数据训练一个特征提取网络GRU,然后使用该网络进行时序特征的提取,并将提... 本文研究工作围绕电网中的核心环节电负荷预测展开.在总结分析之前研究学者的研究成果基础上,提出了基于预训练GRU与LightGBM相结合的方法.该方法首先使用电负荷数据训练一个特征提取网络GRU,然后使用该网络进行时序特征的提取,并将提取到的时序特征与非时序特征使用LightGBM进行电负荷的预测.本方法的创新点在于提出了预训练网络来扩充特征,充分融合时序特征及非时序特征.并且考虑到电网的地区差异性,在整体训练过程中将GRU网络参数进行了适应性微调.保证提取到的时序特征是符合当前地域特点的.通过仿真实验最终发现该方法在各项指标上取得了2%的提升. 展开更多
关键词 GRU网络 电负荷 时序特征 预训练网络
下载PDF
基于预训练模型的军事领域命名实体识别研究 被引量:6
18
作者 童昭 王露笛 +1 位作者 朱小杰 杜一 《数据与计算发展前沿》 CSCD 2022年第5期120-128,共9页
【目的】为了解决开源非结构化军事领域数据的命名实体识别问题。【方法】本文提出基于预训练模型(Bidirectional Encoder Representations from Transformers,BERT)的命名实体识别方法,首先基于预训练BERT模型生成自建开源军事语料的... 【目的】为了解决开源非结构化军事领域数据的命名实体识别问题。【方法】本文提出基于预训练模型(Bidirectional Encoder Representations from Transformers,BERT)的命名实体识别方法,首先基于预训练BERT模型生成自建开源军事语料的动态特征词向量的字符表示,然后基于双向长短期记忆网络(Bi-directional Long Short-Term Memory,BiLSTM)完成语义特征提取,最后利用条件随机场模型(Conditional Random Fields,CRF)选出最优标签序列完成实体识别的任务。【结果】模型在自建的开源军事数据集上的实验结果表明,相较于基于统计模型和神经网络的方法,本文提出的方法可使准确率提升8%,F值提高11%,召回率提高10%。【局限】由于现阶段在开源军事领域中公开标注数据集较为缺乏,所以未能在开源军事语料上训练BERT模型。【结论】但本文提出的基于预训练模型的开源军事命名实体识别方法,在一定程度上解决了边界划分问题,同时解决了在数据集不足的情况下实体识别任务表现不佳的问题。 展开更多
关键词 命名实体识别 预训练模型 神经网络
下载PDF
论通用人工智能治理中管制与反垄断的协同 被引量:2
19
作者 许丽 《上海政法学院学报(法治论丛)》 2024年第1期117-132,共16页
随着专用人工智能向通用人工智能技术的发展,通用大模型接入各行业具有通用性,显现出公用事业属性与自然垄断属性。如何实现从具体应用提供者行为规制向通用人工智能服务提供者管制的转变,将提供通用大模型技术支持作为法律治理的对象,... 随着专用人工智能向通用人工智能技术的发展,通用大模型接入各行业具有通用性,显现出公用事业属性与自然垄断属性。如何实现从具体应用提供者行为规制向通用人工智能服务提供者管制的转变,将提供通用大模型技术支持作为法律治理的对象,是当前通用人工智能治理面临的难题。通用人工智能服务提供者的政府管制与反垄断有不同的干预目标和干预理念,是相互独立、相互平行但可以彼此协同的两种治理行为。通用人工智能行业管制应重点转向对服务提供者数据开放与算法备案的实现,反垄断执法应重塑行为违法判定规则,贯彻柔性执法理念,引入敏捷治理新方式。基于反垄断执法仅对市场失灵进行矫正,行业管制能有效矫治结构性失灵,在此基础上应实现针对通用人工智能服务提供者由政府主导走向“行业管制—反垄断执法—通用人工智能服务提供者自治”多元协同治理,从而在最大程度上发挥通用人工智能技术效能,同时减少新兴技术对社会发展造成的负面冲击。 展开更多
关键词 通用人工智能 预训练大模型 反垄断 行业管制
下载PDF
基于视觉注意力的图文跨模态情感分析 被引量:1
20
作者 王法玉 郝攀征 《计算机工程与设计》 北大核心 2024年第2期601-607,共7页
针对单模态情感分析无法完全捕获情感信息的问题,提出一种图像和文本跨模态情感分析模型(BERT-VistaNet),该模型没有直接使用视觉信息作为特征,而是利用视觉信息作为对齐方式,使用注意力机制指出文本中重要的句子,得到基于视觉注意力的... 针对单模态情感分析无法完全捕获情感信息的问题,提出一种图像和文本跨模态情感分析模型(BERT-VistaNet),该模型没有直接使用视觉信息作为特征,而是利用视觉信息作为对齐方式,使用注意力机制指出文本中重要的句子,得到基于视觉注意力的文档表示。对于视觉注意力无法完全覆盖的文本内容,使用BERT模型对文本进行情感分析,得到基于文本的文档表示,将特征进行融合应用于情感分类任务。在Yelp公开餐厅数据集上,该模型相比基线模型TFN-aVGG,准确率提高了43%,相比VistaNet模型准确率提高了1.4%。 展开更多
关键词 情感分析 视觉注意力机制 跨模态 深度学习 特征融合 预训练模型 双向门控单元
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部