期刊文献+
共找到40篇文章
< 1 2 >
每页显示 20 50 100
基于高困惑样本对比学习的隐式篇章关系识别
1
作者 李晓 洪宇 +3 位作者 窦祖俊 徐旻涵 陆煜翔 周国栋 《中文信息学报》 CSCD 北大核心 2022年第11期38-49,共12页
隐式篇章关系识别是一种自动判别论元语义关系的自然语言处理任务。该任务蕴含的关键科学问题涉及两个方面:其一是准确表征论元语义;其二是基于语义表示,有效地判别论元之间的关系类型。该文将集中在第一个方面开展研究。精准可靠的语... 隐式篇章关系识别是一种自动判别论元语义关系的自然语言处理任务。该任务蕴含的关键科学问题涉及两个方面:其一是准确表征论元语义;其二是基于语义表示,有效地判别论元之间的关系类型。该文将集中在第一个方面开展研究。精准可靠的语义编码有助于关系分类,其根本原因是,编码表示的可靠性促进了正负例样本的可区分性(正例样本特指一对蕴含了“目标关系类”的论元,负例则是一对持有“非目标关系类”的论元)。近期研究显示,集成对比学习机制的语义编码方法能够提升模型在正负例样本上的可辨识性。为此,该文将对比学习机制引入论元语义的表示学习过程,利用“对比损失”驱动正负例样本的“相异性”,即在语义空间中聚合同类正样本,且驱散异类负样本的能力。特别地,该文提出基于条件自编码器的高困惑度负例生成方法,并利用这类负例增强对比学习数据的迷惑性,提升论元语义编码器的鲁棒性。该文使用篇章关系分析的公开语料集PDTB进行实验,实验结果证明,上述方法相较于未采用对比学习的基线模型,在面向对比(Comparison)、偶然(Contingency)、扩展(Expansion)及时序(Temporal)四种PDTB关系类型的二元分类场景中,分别产生了4.68%、4.63%、3.14%、12.77%的F 1值性能提升。 展开更多
关键词 隐式篇章关系识别 对比学习 条件编码
下载PDF
基于局部数据增强动态图的事件预测
2
作者 潘磊 刘欣 +3 位作者 陈君益 程章桃 刘乐源 周帆 《计算机科学》 CSCD 北大核心 2024年第3期118-127,共10页
事件指在真实世界中特定的时间和地点发生的与特定主题相关的活动,例如,社会动乱、暴恐袭击、自然灾害和传染病流行等事件会对国家安全和人民群众的生活产生重大威胁。如果能对此类事件的发生进行有效预测,将最大程度地减少负面事件带... 事件指在真实世界中特定的时间和地点发生的与特定主题相关的活动,例如,社会动乱、暴恐袭击、自然灾害和传染病流行等事件会对国家安全和人民群众的生活产生重大威胁。如果能对此类事件的发生进行有效预测,将最大程度地减少负面事件带来的影响或最大化正面事件带来的利益。关于事件的研究中,准确预测事件仍然是一个非常具有挑战性的任务。文中提出了一种基于图注意力网络的事件预测方法LAT-GAT(Local Augmented Temporal-GAT),该方法使用条件变分编码器,在所构建的事件图中对目标节点的邻居节点生成新的特征样本,与节点原有特征进行拼合,形成新的节点特征,实现了对事件的传播结构的利用;另外,LAT-GAT还考虑了历史事件发生的时间先后顺序,将网络在上一时间点的输出结果集成到当前时间的特征中,从而实现了对事件传播时间特性的利用。最后,在泰国、印度、埃及和俄罗斯这4个国家真实事件数据集上,与多种代表性基线方法进行了对比实验。实验结果表明,LAT-GAT在4个国家数据上的F1评分都优于基线方法;在泰国、俄罗斯和印度数据集上召回率优于基线方法;在泰国、埃及和印度数据集上也获得了最高的准确率。还通过消融实验考察了模型参数对最终结果的影响。 展开更多
关键词 事件预测 图注意力网络 动态图 条件编码 数据增强
下载PDF
飞机起落架液压收放系统的故障程度诊断 被引量:2
3
作者 丰赢政 赵东标 +1 位作者 申珂楠 赵世超 《机械制造与自动化》 2022年第1期217-220,共4页
飞机起落架液压收放系统故障程度正确诊断可帮助飞行员及时采取行动应对不同程度的故障,避免人员和财产受到损失。针对飞机起落架液压收放系统故障样本少,故障数据时域上的高相关性,提出一种混合条件变分自编码网络和双向长短期记忆神... 飞机起落架液压收放系统故障程度正确诊断可帮助飞行员及时采取行动应对不同程度的故障,避免人员和财产受到损失。针对飞机起落架液压收放系统故障样本少,故障数据时域上的高相关性,提出一种混合条件变分自编码网络和双向长短期记忆神经网络的故障程度诊断模型。建立某型飞机起落架液压收放系统仿真模型并植入不同程度故障,提取故障数据;将故障数据归一化并训练出CVAE生成模型;利用BLSTM在时域上的双向学习能力,构建CVAE-BLSTM混合模型,诊断飞机起落架液压收放系统的故障程度。与其他算法相比,CVAE-BLSTM具有高准确率与强泛化能力,可对飞机起落架液压收放系统故障程度进行有效诊断。 展开更多
关键词 飞机起落架 液压收放系统 条件编码 双向长短期记忆神经网络 故障程度诊断
下载PDF
基于多模态生成模型的半监督学习 被引量:2
4
作者 陈亚瑞 张芝慧 +1 位作者 杨剑宁 王浩楠 《天津科技大学学报》 CAS 2022年第2期43-50,共8页
随着进入大数据时代,“标记数据少,而未标记数据多”的现象越来越普遍.半监督学习是充分利用样本中“廉价”的未标记样本,让学习器不依赖外界交互、自动地利用未标记样本提升学习性能.通过构建多模态概率生成模型对数据进行建模,然后分... 随着进入大数据时代,“标记数据少,而未标记数据多”的现象越来越普遍.半监督学习是充分利用样本中“廉价”的未标记样本,让学习器不依赖外界交互、自动地利用未标记样本提升学习性能.通过构建多模态概率生成模型对数据进行建模,然后分析该模型上的监督学习过程和非监督学习过程,最后结合两种学习过程实现半监督学习.通过在MNIST数据集和FASHION_MNIST数据集上验证,证实本模型的可行性,并且对比经典的半监督学习可以看出,本模型提高了预测标签的精度. 展开更多
关键词 半监督学习 多模态 生成模型 条件编码
下载PDF
基于条件变分自编码的密码攻击算法 被引量:1
5
作者 段大高 赵振东 +1 位作者 梁少虎 韩忠明 《计算机应用研究》 CSCD 北大核心 2020年第3期821-823,837,共4页
使用密码猜测算法是评估用户密码强度和安全性的有效方法,提出一种基于条件变分自编码密码猜测算法PassCVAE。算法基于条件变分自编码模型,将用户个人信息作为条件特征,训练密码攻击模型。在编码器端,分别使用双向循环神经网络(GRU)和... 使用密码猜测算法是评估用户密码强度和安全性的有效方法,提出一种基于条件变分自编码密码猜测算法PassCVAE。算法基于条件变分自编码模型,将用户个人信息作为条件特征,训练密码攻击模型。在编码器端,分别使用双向循环神经网络(GRU)和文本卷积神经网络(TextCNN),实现对密码序列和用户个人信息的编码和特征的抽象提取;在解码器端使用两层GRU神经网络,实现对用户个人信息和密码数据隐编码的解码,生成密码序列。该算法可以有效地拟合密码数据的分布和字符组合规律,生成高质量的猜测密码数据。多组实验结果表明,提出的PassCVAE算法优于现有的主流密码猜测算法。 展开更多
关键词 条件编码 密码猜测算法 密码攻击
下载PDF
风电和光伏随机场景生成的条件变分自动编码器方法 被引量:47
6
作者 王守相 陈海文 +1 位作者 李小平 舒欣 《电网技术》 EI CSCD 北大核心 2018年第6期1860-1867,共8页
随着风电、光伏等可再生能源渗透率的不断提高,其运行波动性及随机性对电网稳定运行、经济调度等方面带来不良影响,对可再生能源的不确定性进行建模愈加重要。随机场景分析法是解决该问题的主要方法之一,现有随机场景生成方法基于历史... 随着风电、光伏等可再生能源渗透率的不断提高,其运行波动性及随机性对电网稳定运行、经济调度等方面带来不良影响,对可再生能源的不确定性进行建模愈加重要。随机场景分析法是解决该问题的主要方法之一,现有随机场景生成方法基于历史数据对风电、光伏出力进行概率建模,进而进行抽样生成场景,模型准确性差、计算复杂度高。为简化随机场景生成步骤,提高生成效率及精度,提出了一种基于条件变分自动编码器(variational autoencoder,VAE)的风电光伏出力随机场景生成方法,较已有概率方法,所提方法可无监督地学习风电、光伏训练数据的时间、空间及波动性特点,并按条件高效地生成符合观测特点的数据,无需场景约简。通过在单一发电单元、多发电单元、指定标签场景3个场景的成功应用,验证了所提算法的有效性。 展开更多
关键词 随机场景 条件自动编码 深度学习 场景生成
下载PDF
不平衡数据集下基于CVAE-CNN模型的智能电表故障多分类方法 被引量:20
7
作者 高欣 纪维佳 +3 位作者 赵兵 贾欣 黄子健 任昺 《电网技术》 EI CSCD 北大核心 2021年第8期3052-3060,共9页
提高智能电表故障不平衡多分类准确率对用电采集系统的可靠运行具有重要意义。传统机器学习中以合成少数类过采样(synthetic minority oversampling technique,SMOTE)算法及其变体为代表的过采样方法,较少考虑数据全局分布,而后续采用... 提高智能电表故障不平衡多分类准确率对用电采集系统的可靠运行具有重要意义。传统机器学习中以合成少数类过采样(synthetic minority oversampling technique,SMOTE)算法及其变体为代表的过采样方法,较少考虑数据全局分布,而后续采用的分类算法难以从数据中获取更深层特征信息。基于深度学习思想,提出一种基于条件变分自编码器-卷积神经网络(conditional variational auto encoder-convolutional neural network,CVAE-CNN)模型的不平衡多分类方法,将类别标签作为约束条件,搭建由全连接层构成的CVAE网络生成少数类样本,根据变分下界对服从多维且各维度为独立高斯分布的隐变量建模,学习各类分布特点和数据集全局特征,提高生成数据质量。平衡后的数据采用卷积神经网络进行分类,设计一维卷积层提取数据中潜藏的复杂特征,构造最大池化方法提高模型容错率,依据各类分布特点进行分类处理,提高对少数类别的识别率。以15个KEEL公开数据集和近年采集的智能电表故障数据作为实际算例,所提模型与典型的过采样方法和分类方法进行对比,实验结果表明具有更高的分类精度。 展开更多
关键词 智能电表 故障多 不平衡数据 条件编码 卷积神经网络
下载PDF
基于条件变分自编码器的端到端情感语音合成方法 被引量:3
8
作者 张建明 彭锦涛 +1 位作者 贾洪杰 毛启容 《信号处理》 CSCD 北大核心 2023年第4期678-687,共10页
情感语音合成作为语音合成的一个重要分支,在人机交互领域得到了广泛的关注。如何获得更好的情感嵌入并有效地将其引入到语音合成声学模型中是目前主要存在的问题。表达性语音合成往往从参考音频中获得风格嵌入,但只能学习到风格的平均... 情感语音合成作为语音合成的一个重要分支,在人机交互领域得到了广泛的关注。如何获得更好的情感嵌入并有效地将其引入到语音合成声学模型中是目前主要存在的问题。表达性语音合成往往从参考音频中获得风格嵌入,但只能学习到风格的平均表示,无法合成显著的情感语音。该文提出一种基于条件变分自编码器的端到端情感语音合成方法(Conditional Duration-Tacotron,CD-Tacotron),该方法在Tacotron2模型的基础上进行改进,引入条件变分自编码器从语音信号中解耦学习情感信息,并将其作为条件因子,然后通过使用情感标签将其编码为向量后与其他风格信息拼接,最终通过声谱预测网络合成情感语音。在ESD数据集上的主观和客观实验表明,与目前主流的方法GST-Tacotron和VAE-Tacotron相比,该文提出的方法可以生成更具表现力的情感语音。 展开更多
关键词 情感语音合成 条件编码 端到端 Tacotron
下载PDF
基于CVAE⁃CatBoost的工业控制网络异常流量检测研究 被引量:3
9
作者 张子宣 宗学军 +1 位作者 何戡 连莲 《计算机工程》 CAS CSCD 北大核心 2023年第5期173-180,共8页
为解决工业控制网络异常流量检测中存在的数据分布不均衡、现有模型检测率低的问题,提出一种基于条件变分自编码器(CVAE)和CatBoost算法的异常流量检测模型。CVAE引入标签信息作为约束条件,控制生成样本的类别。CatBoost算法通过引入无... 为解决工业控制网络异常流量检测中存在的数据分布不均衡、现有模型检测率低的问题,提出一种基于条件变分自编码器(CVAE)和CatBoost算法的异常流量检测模型。CVAE引入标签信息作为约束条件,控制生成样本的类别。CatBoost算法通过引入无偏估计克服梯度偏差,提高预测的准确性,同时采用多种树的生长方式降低过拟合的风险。使用CVAE进行数据增强,扩充稀有攻击样本,构建分布均匀的平衡数据集。将CatBoost算法作为异常流量检测模型,对Dos、Fuzzers等攻击样本进行精确识别并输出分类结果。实验结果表明:在UNSW-NB15数据集上,利用CVAE进行数据增强后,CatBoost算法对少数类样本的F1值平均提升了25.16个百分点,整体精确率、召回率和F1值分别达到87.85%、87.87%和87.86%;在ZYELL_NCTU NetTraffic_1.0数据集上,利用CVAE进行数据增强后,CatBoost算法对少数类样本的F1值平均提升了16.32%,整体精确率、召回率和F1值均达到99.85%。该模型能够有效避免数据不均衡问题,相较K近邻、随机森林、卷积神经网络等机器学习和深度学习算法具有更好的检测性能和泛化能力。 展开更多
关键词 工业控制网络 异常检测 数据不平衡 条件编码 CatBoost算法
下载PDF
DCVAE与DPC融合的网络入侵检测模型研究 被引量:1
10
作者 李登辉 葛丽娜 +2 位作者 王哲 樊景威 张壕 《小型微型计算机系统》 CSCD 北大核心 2024年第4期998-1006,共9页
入侵检测是主动防御网络中攻击行为的技术,以往入侵检测模型因正常网络流量与未知攻击内在特征区分度不足,导致对未知攻击识别率不够高,本文设计基于判别条件变分自编码器与密度峰值聚类算法的入侵检测模型(DCVAE-DPC).利用判别条件变... 入侵检测是主动防御网络中攻击行为的技术,以往入侵检测模型因正常网络流量与未知攻击内在特征区分度不足,导致对未知攻击识别率不够高,本文设计基于判别条件变分自编码器与密度峰值聚类算法的入侵检测模型(DCVAE-DPC).利用判别条件变分自编码器能够生成指定类别样本的能力,学习正常网络流量特征的隐空间表示并计算其重建误差,增加其与未知攻击间的特征区分度,并使用密度峰值聚类算法求出正常网络流量重建误差的分布,提高未知攻击识别率.实验结果表明,在NSL-KDD数据集中与当前流行的入侵检测模型相比,模型的分类准确率可以达到97.08%,具有更高的未知攻击检测能力,面对当前复杂网络环境,有更强的入侵检测性能. 展开更多
关键词 入侵检测 判别条件编码 密度峰值聚类算法 未知攻击识别 细粒度攻击
下载PDF
基于条件变分自编码器的熔铸炸药成型缺陷快速模拟和预测
11
作者 滕浩 李锡文 +1 位作者 王学林 胡于进 《火炸药学报》 EI CAS CSCD 北大核心 2024年第7期640-648,I0003,共10页
为了实现凝固缺陷的快速模拟和预测,提出了一种基于条件变分自编码器(CVAE)的熔铸炸药成型缺陷预测模型;以注液温度、冒口预热温度等工艺参数为条件,通过条件变分自编码器建立工艺参数与熔铸炸药缺陷的条件概率模型;采用多层神经网络和... 为了实现凝固缺陷的快速模拟和预测,提出了一种基于条件变分自编码器(CVAE)的熔铸炸药成型缺陷预测模型;以注液温度、冒口预热温度等工艺参数为条件,通过条件变分自编码器建立工艺参数与熔铸炸药缺陷的条件概率模型;采用多层神经网络和变分推断方法结合进行模型训练,实现了RHT和DNP基熔铸炸药凝固成型缺陷预测。结果表明,成功构建了熔铸炸药凝固过程数值模拟的条件概率分布,实现了基于仿真数据的RHT和DNP基熔铸炸药凝固缺陷预测;与有限元直接数值计算结果比较,CVAE算法计算缺陷位置的准确率可达到99%,计算时间小于2 s;CVAE在熔铸炸药缺陷概率分布建模上具有性能高、泛化性强的特点,能有效实现熔铸炸药成型缺陷的智能预测。 展开更多
关键词 条件编码 CVAE 熔铸炸药 数值模拟 成型缺陷 多层神经网络 推断方法
下载PDF
基于近邻目标区域表征与CVAE的智能汽车测试场景生成方法
12
作者 谈东奎 朱波 胡旭东 《中国公路学报》 EI CAS CSCD 北大核心 2024年第3期170-180,共11页
基于场景的虚拟测试是研发高安全、高可靠智能汽车的必要手段,场景自动生成技术对于智能汽车测试场景库的构建具有重要意义。为此,针对多车动态测试场景,提出一种基于近邻目标区域表征(NORR)和条件变分自编码器(CVAE)的场景生成方法,实... 基于场景的虚拟测试是研发高安全、高可靠智能汽车的必要手段,场景自动生成技术对于智能汽车测试场景库的构建具有重要意义。为此,针对多车动态测试场景,提出一种基于近邻目标区域表征(NORR)和条件变分自编码器(CVAE)的场景生成方法,实现复杂测试场景的快速生成以及对生成场景类型的控制。首先,针对高速公路场景特征,提出应用NORR方法对场景情境进行描述,将测试场景中关键车辆目标信息转化为尺度统一的灰度图像。接着,利用HighD自然车辆轨迹数据集提取大量场景片段,经过数据规范化处理后构建出真实场景库。在此基础上,以场景中车辆目标数量为条件参数,训练基于条件变分自编码器的生成模型,能够生成包含8条车辆轨迹的动态测试场景。通过计算生成样本集的匹配误差、覆盖度和不合理性3个指标,检验生成模型在样本真实性、多样性和合理性方面的表现。验证结果显示:①相比随机轨迹采样方法和基于GAN的生成模型,VAE模型生成的样本质量最好,其生成样本集的平均匹配误差小于5.22,覆盖度能达到57.2%,不合理样本比例仅为1.7%;②所提出的NORR方法有助于提高生成模型的场景生成效果;③CVAE模型能够在条件输入和生成结果之间建立关联性,通过调整条件参数可以改变生成场景中车辆目标数量。 展开更多
关键词 汽车工程 测试场景生成 条件编码 智能车辆 生成模型
原文传递
基于图持续学习的时序数据分析
13
作者 董次浩 陈雷鸣 +3 位作者 黄子凌 朱宜昌 仇家康 刘尚儒 《计算机系统应用》 2024年第2期188-197,共10页
随着可穿戴设备大规模进入生活,基于动作传感器产生的时序数据来人体行为识别已成为该领域的研究热点.然而目前的方法无法发现多个传感器数据在时空中相互作用的关系.此外,传统神经网络在学习新任务时,由于学习的新任务参数会覆盖掉旧... 随着可穿戴设备大规模进入生活,基于动作传感器产生的时序数据来人体行为识别已成为该领域的研究热点.然而目前的方法无法发现多个传感器数据在时空中相互作用的关系.此外,传统神经网络在学习新任务时,由于学习的新任务参数会覆盖掉旧任务参数,这会引起“灾难性遗忘”问题.为解决这两个问题,本文提出了一种基于图注意力网络与生成式回放持续学习机制融合方法的人体行为识别算法.该算法通过卷积神经网络与图注意力网络提取时序特征,使得模型能够同时关注时间与空间特征,同时,采用了基于生成式数据重放策略的情景记忆持续学习方法,通过条件变分自编码器记忆历史数据分布来解决灾难性遗忘问题.最后,通过在多个公开数据集上与不同的基线算法对比,实验结果表明本文所提算法可以在取得较高的准确率的同时,缓解灾难性遗忘问题. 展开更多
关键词 图注意力网络 可穿戴设备 运动检测 持续学习 条件编码
下载PDF
基于条件变分自编码器和贝叶斯神经网络的短期电力负荷概率预测
14
作者 李丹 罗娇娇 +2 位作者 孙光帆 唐建 黄烽云 《三峡大学学报(自然科学版)》 CAS 北大核心 2024年第5期68-75,共8页
考虑到输入信息和预测模型的不确定性对负荷预测结果的影响,本文提出一种基于条件变分自编码器和贝叶斯神经网络的短期电力负荷概率预测方法.通过条件变分自编码器生成指定天气因素预测值和日历特征条件下实际天气因素可能的多个随机样... 考虑到输入信息和预测模型的不确定性对负荷预测结果的影响,本文提出一种基于条件变分自编码器和贝叶斯神经网络的短期电力负荷概率预测方法.通过条件变分自编码器生成指定天气因素预测值和日历特征条件下实际天气因素可能的多个随机样本,以模拟天气预测信息的不确定性;构建GRU-S2S贝叶斯神经网络学习模型参数的分布特征,以反映预测模型的不确定性,并结合MC dropout技术获得多个可能的负荷预测值;遍历天气因素全部模拟样本,将预测模型输出的负荷预测值构成集合,并通过核密度估计获得预测时段内各时刻预测负荷服从的概率分布.实际算例结果表明,该方法在短期负荷概率预测中具有更高的分位数预测精度和更可靠稳定的区间预测结果. 展开更多
关键词 负荷概率预测 门控循环单元 贝叶斯神经网络 条件编码
下载PDF
基于变分自编码器的多维退化数据生成方法 被引量:1
15
作者 林焱辉 李春波 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2023年第10期2617-2627,共11页
数据驱动的剩余使用寿命(RUL)预测方法不依赖于复杂的物理模型,可以直接利用设备历史运行数据与当前监测数据对设备RUL进行预测,对制定合理的维修策略,降低设备的维护成本具有重要意义。但是数据驱动的RUL预测方法依赖于大量历史数据,... 数据驱动的剩余使用寿命(RUL)预测方法不依赖于复杂的物理模型,可以直接利用设备历史运行数据与当前监测数据对设备RUL进行预测,对制定合理的维修策略,降低设备的维护成本具有重要意义。但是数据驱动的RUL预测方法依赖于大量历史数据,在数据不足时,尤其是多维退化数据,模型难以取得良好的预测效果。针对这一问题,提出一种多维退化数据生成方法,所提方法构建了一种全局优化模型,以条件变分自编码器作为生成模型,提取多维退化数据特征并生成相似数据扩充RUL预测模型训练集,利用长短时记忆网络作为RUL预测模型,所提方法能够通过RUL预测模型更新生成模型的参数提高模型的效果,同时利用更新后的生成模型提高剩余寿命预测模型在退化数据不足情况下的效果。使用航空发动机退化数据进行了案例验证,通过对比未加入生成数据训练得到的RUL预测模型与加入生成数据训练得到的RUL预测模型的表现,验证了所提方法在解决RUL预测模型训练数据不足方面的优越性。 展开更多
关键词 剩余寿命预测 编码 条件编码 数据生成 数据不足
下载PDF
不平衡样本下基于CVAE和CNN的结构损伤识别方法 被引量:1
16
作者 蔡东成 张健飞 《土木工程与管理学报》 2023年第2期108-116,129,共10页
为提高在不平衡样本下结构损伤识别的准确性,提出了一种基于条件变分自编码器(CVAE)数据增强和卷积神经网络(CNN)的结构损伤识别方法。首先,将损伤类别作为约束,构建起基于振动加速度数据的CVAE模型;然后生成损伤加速度数据对初始不平... 为提高在不平衡样本下结构损伤识别的准确性,提出了一种基于条件变分自编码器(CVAE)数据增强和卷积神经网络(CNN)的结构损伤识别方法。首先,将损伤类别作为约束,构建起基于振动加速度数据的CVAE模型;然后生成损伤加速度数据对初始不平衡数据进行扩充;最后使用CNN对扩充数据集进行特征提取和损伤分类识别。通过对悬臂梁振动台实验与钢框架有限元模拟振动实验两类数据集设置不同不平衡比率,进行了CVAE数据增强的效果对比验证。结果表明:CVAE数据增强有助于CNN损伤识别模型对数据特征的提取,能够提高CNN模型的收敛速度,防止模型过拟合;相对于未经数据增强的数据集,所提方法提高了在极不平衡数据下的损伤分类识别准确率,在两类实验数据集上分别提高了15.10%和15.80%。 展开更多
关键词 损伤识别 不平衡样本 数据增强 条件编码 卷积神经网络
下载PDF
自动扩充关键词语义信息的诗歌生成算法 被引量:1
17
作者 王勇超 周灵智 +1 位作者 赵亚萍 许端清 《计算机科学与探索》 CSCD 北大核心 2023年第6期1387-1394,共8页
当前,诗歌生成模型大多数通过用户所提供的关键词来生成符合韵律规则和音调起伏的诗歌。由于关键词蕴含的语义信息较少,很难保证生成诗歌的质量,容易出现上下文主题偏移的现象。针对这一问题,提出了一种基于条件变分自编码器的生成模型... 当前,诗歌生成模型大多数通过用户所提供的关键词来生成符合韵律规则和音调起伏的诗歌。由于关键词蕴含的语义信息较少,很难保证生成诗歌的质量,容易出现上下文主题偏移的现象。针对这一问题,提出了一种基于条件变分自编码器的生成模型,该模型能够在更加丰富的语义信息指导下,生成更符合关键字描述和用户满意度的诗歌。该模型通过采样人类创作的诗歌,引入额外和关键词相关的语义信息,有效估计条件变分自编码器的先验概率分布,生成更贴合真实分布的先验概率。由于该模型自动扩充了关键词信息,缩小了输入和输出语义信息的差距,缓解了以往模型中普遍存在的过翻译问题。实验结果表明,该模型无论在自动评估还是人类评估方面相比其他模型都有更好的效果,并成功减少了过翻译问题出现的频率,提高了生成诗歌的流畅性。通过变化采样的范围,成功实现了对生成诗歌写作风格的控制,进一步证明了该算法的有效性。 展开更多
关键词 自然语言处理 自然语言生成 诗歌生成 条件编码
下载PDF
融合预训练模型的中文知识图谱问题生成方法 被引量:5
18
作者 叶子 陈小平 +2 位作者 张波 欧阳昱 刘辉舟 《小型微型计算机系统》 CSCD 北大核心 2021年第2期246-250,共5页
基于知识图谱的问答方法旨在通过知识图谱的三元组检索和推断来对自然语言形式的问题进行解答.然而,现有中文知识图谱问答语料库存在规模较小,质量较差等问题,相关语料库构建方法亟待完善.因此,本文提出一种融合预训练模型的中文知识图... 基于知识图谱的问答方法旨在通过知识图谱的三元组检索和推断来对自然语言形式的问题进行解答.然而,现有中文知识图谱问答语料库存在规模较小,质量较差等问题,相关语料库构建方法亟待完善.因此,本文提出一种融合预训练模型的中文知识图谱问题生成方法,目标是以中文知识图谱三元组作为输入生成正确且多样的问题.该方法汲取了条件变分自编码器的思想,以预编码器-源编码器-解码器为核心架构,利用BERT模型进行预编码,并以Transformer模型为基础构建源编码器和解码器.此外,该方法还结合了答案编码技术并进行了改进.本文使用NLPCC2017 KBQA数据集进行实验,实验表明该模型在BLEU、ROUGE以及人工评价指标上较基线模型有明显提升,并且能够生成更具多样性的问题,证明了该方法的有效性. 展开更多
关键词 知识图谱 问题生成 预训练模型 条件编码
下载PDF
基于变分自编码器的入侵检测系统设计与实现 被引量:5
19
作者 罗智钰 黄立群 《电脑知识与技术》 2020年第13期22-24,共3页
随着网络技术的快速发展,网络入侵等网络信息安全隐患引起人们的日益关注,通过入侵检测来及时发现潜在网络入侵行为是抵御入侵的一种有效手段,在实际应用中具有重要的意义。该文引入基于条件变分自编码器的深度学习模型,利用Tensorflow... 随着网络技术的快速发展,网络入侵等网络信息安全隐患引起人们的日益关注,通过入侵检测来及时发现潜在网络入侵行为是抵御入侵的一种有效手段,在实际应用中具有重要的意义。该文引入基于条件变分自编码器的深度学习模型,利用Tensorflow框架搭建了一个入侵检测系统。为了验证本文入侵检测系统的有效性,我们在公开的NSL-KDD数据集上开展了相应的性能测试,实验结果表明所设计的入侵检测系统在五种网络状态的预判分类上准确率达到了72.2%,可以在实际部署中对入侵行为进行有效分类。 展开更多
关键词 网络安全 入侵检测 条件编码 Tensorflow
下载PDF
基于条件变分自编码器的问题生成方法
20
作者 刘东 洪宇 +1 位作者 苏玉兰 张民 《山东大学学报(理学版)》 CAS CSCD 北大核心 2023年第1期48-58,共11页
将条件变分自编码器作为辅助模块,引入预训练语言模型的编码解码过程,通过数据增强(潜在的语义扩充)以提高模型的鲁棒性。通过建立陈述句与疑问句之间的高维分布联系,由分布采样实现一对多的问题生成。结果表明,融合条件变分自编码器不... 将条件变分自编码器作为辅助模块,引入预训练语言模型的编码解码过程,通过数据增强(潜在的语义扩充)以提高模型的鲁棒性。通过建立陈述句与疑问句之间的高维分布联系,由分布采样实现一对多的问题生成。结果表明,融合条件变分自编码器不仅能生成多样性的问题,也有助于提升问题生成的模型性能。在基于SQuAD数据集划分的2个答案可知问题生成数据集Split1和Split2上,BLEU-4值分别被提升到20.75%和21.61%。 展开更多
关键词 条件编码 问题生成 预训练语言模型
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部