期刊文献+
共找到140篇文章
< 1 2 7 >
每页显示 20 50 100
大模型时代的自然语言处理:挑战、机遇与发展 被引量:72
1
作者 车万翔 窦志成 +20 位作者 冯岩松 桂韬 韩先培 户保田 黄民烈 黄萱菁 刘康 刘挺 刘知远 秦兵 邱锡鹏 万小军 王宇轩 文继荣 严睿 张家俊 张民 张奇 赵军 赵鑫 赵妍妍 《中国科学:信息科学》 CSCD 北大核心 2023年第9期1645-1687,共43页
近期发布的ChatGPT和GPT-4等大型语言模型,不仅能高质量完成自然语言生成任务,生成流畅通顺,贴合人类需求的语言,而且具备以生成式框架完成各种开放域自然语言理解任务的能力.在少样本、零样本场景下,大模型可取得接近乃至达到传统监督... 近期发布的ChatGPT和GPT-4等大型语言模型,不仅能高质量完成自然语言生成任务,生成流畅通顺,贴合人类需求的语言,而且具备以生成式框架完成各种开放域自然语言理解任务的能力.在少样本、零样本场景下,大模型可取得接近乃至达到传统监督学习方法的性能,且具有较强的领域泛化性,从而对传统自然语言核心任务产生了巨大的冲击和影响.本文就大模型对自然语言处理的影响进行了详细的调研和分析,试图探究大模型对自然语言处理核心任务带来哪些挑战和机遇,探讨大模型将加强哪些自然语言处理共性问题的研究热度,展望大模型和自然语言处理技术的未来发展趋势和应用.分析结果表明,大模型时代的自然语言处理依然大有可为.我们不仅可以将大模型作为研究方法和手段,学习、借鉴大型语言模型的特点和优势,变革自然语言处理的主流研究范式,对分散独立的自然语言处理任务进行整合,进一步提升自然语言核心任务的能力;还可就可解释性、公平性、安全性、信息准确性等共性问题开展深入研究,促进大模型能力和服务质量的提升.未来,以大模型作为基座,拓展其感知、计算、推理、交互和控制能力,自然语言处理技术将进一步助力通用人工智能的发展,促进各行各业的生产力进步,更好地为人类社会服务. 展开更多
关键词 ChatGPT 对话式大模型 大型语言模型 自然语言处理 通用人工智能
原文传递
面向云存储的数据加密系统与技术研究 被引量:38
2
作者 韩培义 刘川意 +3 位作者 王佳慧 段少明 潘鹤中 方滨兴 《通信学报》 EI CSCD 北大核心 2020年第8期55-65,共11页
针对云存储数据安全问题,提出了面向浏览器云存储应用的自动化数据加密系统。该系统采用JavaScript动态程序分析技术,可自动化识别与适配各类云应用,确保了对各类云应用敏感数据的加密保护,并集成了基于安全网关执行的密文搜索功能,在... 针对云存储数据安全问题,提出了面向浏览器云存储应用的自动化数据加密系统。该系统采用JavaScript动态程序分析技术,可自动化识别与适配各类云应用,确保了对各类云应用敏感数据的加密保护,并集成了基于安全网关执行的密文搜索功能,在实现数据加密保护的同时还可最大限度地保持云应用原有功能。实验结果表明,该系统可自动化适配加密各类云应用,支持密文搜索功能,且花费较小的性能代价。 展开更多
关键词 云安全 数据安全 数据加密
下载PDF
基于人工智能的网络空间安全防御战略研究 被引量:34
3
作者 贾焰 方滨兴 +1 位作者 李爱平 顾钊铨 《中国工程科学》 CSCD 北大核心 2021年第3期98-105,共8页
网络空间是继陆、海、空、天之后的第五大活动空间,维护网络空间安全是事关国家安全、国家主权和人民群众合法权益的重大问题。随着人工智能技术的飞速发展和在各领域的应用,网络空间安全面临着新的挑战。本文分析了人工智能时代网络空... 网络空间是继陆、海、空、天之后的第五大活动空间,维护网络空间安全是事关国家安全、国家主权和人民群众合法权益的重大问题。随着人工智能技术的飞速发展和在各领域的应用,网络空间安全面临着新的挑战。本文分析了人工智能时代网络空间安全面临的新风险,包括网络攻击越来越智能化,大规模网络攻击越来越频繁,网络攻击的隐蔽性越来越高,网络攻击的对抗博弈越来越强,重要数据越来越容易被窃取等;介绍了人工智能技术在处理海量数据、多源异构数据、实时动态数据时具有显著的优势,能大幅度提升网络空间防御能力;基于人工智能的网络空间防御关键问题及技术,重点分析了网络安全知识大脑的构建及网络攻击研判,并从构建动态可扩展的网络安全知识大脑,推动有效网络攻击的智能化检测,评估人工智能技术的安全性三个方面提出了针对性的发展对策和建议。 展开更多
关键词 人工智能 网络空间安全 网络攻击 网络防御
下载PDF
结合字形特征与迭代学习的金融领域命名实体识别 被引量:15
4
作者 刘宇瀚 刘常健 +4 位作者 徐睿峰 骆旺达 陈奕 吉忠晟 应能涛 《中文信息学报》 CSCD 北大核心 2020年第11期74-83,共10页
针对中文金融文本领域的命名实体识别,该文从汉字自身特点出发,设计了结合字形特征、迭代学习以及双向长短时记忆网络和条件随机场的神经网络模型。该模型是一种完全端到端且不涉及任何特征工程的模型,其将汉字的五笔表示进行编码以进... 针对中文金融文本领域的命名实体识别,该文从汉字自身特点出发,设计了结合字形特征、迭代学习以及双向长短时记忆网络和条件随机场的神经网络模型。该模型是一种完全端到端且不涉及任何特征工程的模型,其将汉字的五笔表示进行编码以进行信息增强,同时利用迭代学习的策略不断对模型整体预测结果进行改进。由于现有的命名实体识别研究在金融领域缺乏高质量的有标注的语料库资源,所以该文构建了一个大规模的金融领域命名实体语料库HITSZ-Finance,共计31210个文本句,包含4类实体。该文在语料库HITSZ-Finance上进行了一系列实验,实验结果均表明模型的有效性。 展开更多
关键词 金融领域命名实体识别 中文语料库 深度学习
下载PDF
复杂场景下基于CNN的轻量火焰检测方法 被引量:13
5
作者 李欣健 张大胜 +1 位作者 孙利雷 徐勇 《模式识别与人工智能》 EI CSCD 北大核心 2021年第5期415-422,共8页
已有的火灾检测方法往往依赖高性能的机器,在嵌入式端和移动端检测速度较慢、误检率较高,尤其是无法解决小尺度火焰漏检问题.针对上述问题,文中提出基于YOLO的火焰检测方法.使用深度可分离卷积改进火焰检测模型的网络结构,并使用多种数... 已有的火灾检测方法往往依赖高性能的机器,在嵌入式端和移动端检测速度较慢、误检率较高,尤其是无法解决小尺度火焰漏检问题.针对上述问题,文中提出基于YOLO的火焰检测方法.使用深度可分离卷积改进火焰检测模型的网络结构,并使用多种数据增强技术与基于边框的损失函数以提高精度.通过参数调优,在保证检测准确率的情况下,实现在嵌入式移动系统上21 ms的实时火灾探测.实验表明,文中方法在火焰数据集上的精度和速度都有所提高. 展开更多
关键词 火焰检测 目标检测 YOLO算法 数据增强 深度可分离卷积
下载PDF
基于句子级Lattice-长短记忆神经网络的中文电子病历命名实体识别 被引量:13
6
作者 潘璀然 王青华 +3 位作者 汤步洲 姜磊 黄勋 王理 《第二军医大学学报》 CAS CSCD 北大核心 2019年第5期497-506,共10页
目的提出一种基于Re-entity新分词方法的条件随机场(CRF)模型,并与双向长短记忆神经网络(BiLSTM)-CRF和Lattice-长短记忆神经网络(LSTM)进行比较。方法比较了现有实体识别方法和模型后,针对2018年全国知识图谱与语义计算大会(CCKS2018)... 目的提出一种基于Re-entity新分词方法的条件随机场(CRF)模型,并与双向长短记忆神经网络(BiLSTM)-CRF和Lattice-长短记忆神经网络(LSTM)进行比较。方法比较了现有实体识别方法和模型后,针对2018年全国知识图谱与语义计算大会(CCKS2018)任务一“电子病历命名实体识别”,提出基于Re-entity的CRF、BiLSTM-CRF、Lattice-LSTM方法,并在不同语料库训练不同参数级别的字符向量集。分别将各方法引入神经网络模型中进行模型性能对比实验,最后分别基于句子级和篇级输入句长进行对比研究。结果CRF模型在最优特征工程的结果下引入Re-entity方法后性能得到提高,句子级的Lattice-LSTM模型在该任务上取得了89.75%的严格F1-measure,优于CCKS2018任务一的最高结果(89.25%)。结论基于Re-entity新分词方法的CRF模型可利用中文临床药物知识库有效提高电子病历中药物的识别率,Re-entity方法可改善数据预处理阶段分词导致的错误累加,Lattice结构可以更好地结合字符和词序列的潜在语义信息,同时句子级输入能有效提高神经网络模型的识别准确率。 展开更多
关键词 计算机化病案系统 中文电子病历 实体识别 条件随机场 双向长短记忆神经网络 点阵长短记忆神经网络
下载PDF
一种支持前向安全更新和验证的加密搜索算法 被引量:13
7
作者 李涵 张晨 +1 位作者 黄荷姣 郭宇 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2020年第5期48-56,共9页
近年来,云计算的进步推动了可搜索加密技术的发展。然而,现有的加密搜索模式主要考虑中心化的环境,即搜索操作执行在传统的客户-服务器模型中。如何在非信任的分布式环境(如区块链系统)应用可搜索加密技术仍有待探索。与此同时,如何保... 近年来,云计算的进步推动了可搜索加密技术的发展。然而,现有的加密搜索模式主要考虑中心化的环境,即搜索操作执行在传统的客户-服务器模型中。如何在非信任的分布式环境(如区块链系统)应用可搜索加密技术仍有待探索。与此同时,如何保证前向安全更新则是可搜索加密技术面临的另一挑战。为解决以上问题,基于区块链技术,设计了一种支持前向安全更新和验证的加密搜索算法。首先,提出了一种支持前向安全更新的双索引结构,并展示了如何将此结构应用于区块链系统,以实现最优的搜索和更新复杂度;其次,提出了一种新的结果验证方案,该方案基于加密的链上验证表实现了强大的数据保护,并显著降低了区块链的开销;最终,通过Redis集群实现了系统原型,并利用Amazon Cloud服务器对系统进行了性能评估。大量实验证明了所设计的方案是安全且高效的。 展开更多
关键词 加密搜索 前向安全 区块链系统 动态可搜索加密
下载PDF
结合预训练模型和语言知识库的文本匹配方法 被引量:11
8
作者 周烨恒 石嘉晗 徐睿峰 《中文信息学报》 CSCD 北大核心 2020年第2期63-72,共10页
针对文本匹配任务,该文提出一种大规模预训练模型融合外部语言知识库的方法。该方法在大规模预训练模型的基础上,通过生成基于WordNet的同义-反义词汇知识学习任务和词组-搭配知识学习任务引入外部语言学知识。进而,与MT-DNN多任务学习... 针对文本匹配任务,该文提出一种大规模预训练模型融合外部语言知识库的方法。该方法在大规模预训练模型的基础上,通过生成基于WordNet的同义-反义词汇知识学习任务和词组-搭配知识学习任务引入外部语言学知识。进而,与MT-DNN多任务学习模型进行联合训练,以进一步提高模型性能。最后利用文本匹配标注数据进行微调。在MRPC和QQP两个公开数据集的实验结果显示,该方法可以在大规模预训练模型和微调的框架基础上,通过引入外部语言知识进行联合训练有效提升文本匹配性能。 展开更多
关键词 文本匹配 预训练模型 语言知识库融合
下载PDF
焦虑的脑科学研究与临床应用进展 被引量:7
9
作者 罗跃嘉 秦绍正 +4 位作者 朱英杰 李占江 张治国 金增亮 徐鹏飞 《科学通报》 EI CAS CSCD 北大核心 2023年第35期4793-4806,共14页
焦虑障碍是我国患病率最高的精神障碍,也是全球第六大致残原因.如何建立精准有效的个体化预防-诊断-治疗体系,成为当前亟须攻克的难题.焦虑障碍主要包括广泛性焦虑障碍(GAD)、惊恐障碍(PD)和社交焦虑障碍(SAD)的亚型;其发病机制和分型... 焦虑障碍是我国患病率最高的精神障碍,也是全球第六大致残原因.如何建立精准有效的个体化预防-诊断-治疗体系,成为当前亟须攻克的难题.焦虑障碍主要包括广泛性焦虑障碍(GAD)、惊恐障碍(PD)和社交焦虑障碍(SAD)的亚型;其发病机制和分型机制尚不清楚.本文系统综述了近年来临床焦虑障碍和亚临床焦虑的研究进展,特别是本团队的研究进展,重点从神经认知机制的理论模型和临床应用方面寻求新的见解和研究线索.基于经典认知模型、杏仁核和脑岛中心神经模型,以及静态脑网络模型,我们提出了动态焦虑脑网络模型:强调突显网络、执行控制网络、默认网络和感知网络之间的动态相互作用,这是情绪和认知控制交互作用的基础;网络间的神经振荡负责资源转换和信号同步;去甲肾上腺素系统,特别是蓝斑(LC)-去甲肾上腺素(NE)系统,通过神经递质调节上述过程.本文还总结了焦虑的诊断和预测指标,包括遗传特征、认知特征和神经生物标志物,特别强调了特异频段的神经振荡模式,以及动态脑网络连接,以预测个体化焦虑症状和其他精神疾病.通过在体脑成像、神经环路示踪技术、单细胞组学等技术,全面精准解析焦虑障碍的多维度发病机制,揭示国家一类创新药物GW117抗焦虑分子环路机制及其对机体神经-内分泌-免疫系统的影响,为开发新型抗焦虑药物提供依据;通过采用多模态神经影像、神经生理生化等检测评估手段,筛选和鉴定焦虑障碍预测、识别和早期诊断的客观标记;通过融合多模态脑成像技术和光电磁等神经调控技术,开发个体化精准有效的靶点定位和参数优化方案,筛选和确定焦虑障碍治疗的新型靶标.基于多维度客观标记和新型靶标,在亚临床风险人群和焦虑障碍人群中开展队列研究,构建焦虑障碍人群预测模型,形成焦虑障碍早期预防、精确诊断和� 展开更多
关键词 焦虑 动态脑网络模型 诊断标记 个性化预测 精准干预
原文传递
基于深度学习的代码生成方法研究进展 被引量:5
10
作者 杨泽洲 陈思榕 +3 位作者 高翠芸 李振昊 李戈 吕荣聪 《软件学报》 EI CSCD 北大核心 2024年第2期604-628,共25页
关注根据自然语言描述生成相关代码片段的代码生成(code generation)任务.在软件开发过程中,开发人员常常会面临两种情形.一种是通用功能的实现,需要开发人员编写大量重复且技术含量较低的代码;另一种是依赖于特定任务要求,需要开发人... 关注根据自然语言描述生成相关代码片段的代码生成(code generation)任务.在软件开发过程中,开发人员常常会面临两种情形.一种是通用功能的实现,需要开发人员编写大量重复且技术含量较低的代码;另一种是依赖于特定任务要求,需要开发人员查询文档或使用其他工具才能完成的代码编写工作.代码生成作为最直接辅助开发人员完成编码的工作受到学术界和工业界的广泛关注.让机器理解用户需求,自行完成程序编写也一直是软件工程领域重点关注的问题之一.近年来,随着深度学习在软件工程领域任务中的不断发展,尤其是预训练模型的引入使得代码生成任务取得了十分优异的性能.系统梳理当前基于深度学习的代码生成相关工作,并将目前基于深度学习的代码生成方法分为3类:基于代码特征的方法、结合检索的方法以及结合后处理的方法.第1类是指使用深度学习算法利用代码特征进行代码生成的方法,第2类和第3类方法依托于第1类方法进行改进.依次对每一类方法的已有研究成果进行系统的梳理、分析与总结.除此之外,汇总并分析已有的代码生成工作中常用的语料库与评估方法,以便于后续研究进行实验设计.最后,对代码生成方法研究进展进行总结,并针对未来值得关注的研究方向进行展望. 展开更多
关键词 代码生成 深度学习 代码检索 后处理 机器翻译
下载PDF
深度学习数据窃取攻击在数据沙箱模式下的威胁分析与防御方法研究 被引量:9
11
作者 潘鹤中 韩培义 +3 位作者 向夏雨 段少明 庄荣飞 刘川意 《通信学报》 EI CSCD 北大核心 2021年第11期133-144,共12页
详细分析了数据沙箱模式下,深度学习数据窃取攻击的威胁模型,量化评估了数据处理阶段和模型训练阶段攻击的危害程度和鉴别特征。针对数据处理阶段的攻击,提出基于模型剪枝的数据泄露防御方法,在保证原模型可用性的前提下减少数据泄露量... 详细分析了数据沙箱模式下,深度学习数据窃取攻击的威胁模型,量化评估了数据处理阶段和模型训练阶段攻击的危害程度和鉴别特征。针对数据处理阶段的攻击,提出基于模型剪枝的数据泄露防御方法,在保证原模型可用性的前提下减少数据泄露量;针对模型训练阶段的攻击,提出基于模型参数分析的攻击检测方法,从而拦截恶意模型防止数据泄露。这2种防御方法不需要修改或加密数据,也不需要人工分析深度学习模型训练代码,能够更好地应用于数据沙箱模式下数据窃取防御。实验评估显示,基于模型剪枝的防御方法最高能够减少73%的数据泄露,基于模型参数分析的检测方法能够有效识别95%以上的攻击行为。 展开更多
关键词 数据沙箱 数据窃取 AI安全
下载PDF
基于访问代理的数据加密及搜索技术研究 被引量:9
12
作者 王国峰 刘川意 +2 位作者 韩培义 潘鹤中 方滨兴 《通信学报》 EI CSCD 北大核心 2018年第7期1-14,共14页
针对云应用程序数据机密性问题,提出一种访问代理执行的密文搜索方案。此方案不需要修改云应用程序且不改变用户使用习惯,具有很强的可适用性。首先从功能性、效率性和安全性等方面分析了基于访问代理的密文搜索方案,并指出其所面临的... 针对云应用程序数据机密性问题,提出一种访问代理执行的密文搜索方案。此方案不需要修改云应用程序且不改变用户使用习惯,具有很强的可适用性。首先从功能性、效率性和安全性等方面分析了基于访问代理的密文搜索方案,并指出其所面临的关键问题,包括代理间索引和密文的安全分享,并设计解决方案。实验结果表明,此方案可有效保护云服务用户数据,实现多种搜索功能,且具有很高的效率性和安全性。 展开更多
关键词 云安全 数据保护 密文搜索 密文分享
下载PDF
跨模态表征与生成技术 被引量:6
13
作者 刘华峰 陈静静 +4 位作者 李亮 鲍秉坤 李泽超 刘家瑛 聂礼强 《中国图象图形学报》 CSCD 北大核心 2023年第6期1608-1629,共22页
多媒体数据持续呈现爆发式增长并显现出异源异构的特性,因此跨模态学习领域研究逐渐引起学术和工业界的关注。跨模态表征与生成是跨模态学习的两大核心基础问题。跨模态表征旨在利用多种模态之间的互补性剔除模态之间的冗余,从而获得更... 多媒体数据持续呈现爆发式增长并显现出异源异构的特性,因此跨模态学习领域研究逐渐引起学术和工业界的关注。跨模态表征与生成是跨模态学习的两大核心基础问题。跨模态表征旨在利用多种模态之间的互补性剔除模态之间的冗余,从而获得更为有效的特征表示;跨模态生成则是基于模态之间的语义一致性,实现不同模态数据形式上的相互转换,有助于提高不同模态间的迁移能力。本文系统地分析了国际与国内近年来跨模态表征与生成领域的重要研究进展,包括传统跨模态表征学习、多模态大模型表示学习、图像到文本的跨模态转换和跨模态图像生成。其中,传统跨模态表征学习探讨了跨模态统一表征和跨模态协同表征,多模态大模型表示学习探讨了基于Transformer的模型研究,图像到文本的跨模态转换探讨了图像视频的语义描述、视频字幕语义分析和视觉问答等领域的发展,跨模态图像生成从不同模态信息的跨模态联合表示方法、图像的跨模态生成技术和基于预训练的特定域图像生成阐述了跨模态生成方面的进展。本文详细综述了上述各个子领域研究的挑战性,对比了国内外研究方面的进展情况,梳理了发展脉络和学术研究的前沿动态。最后,根据上述分析展望了跨模态表征与生成的发展趋势和突破口。 展开更多
关键词 多媒体技术 跨模态学习 大模型 跨模态表征 跨模态生成 深度学习
原文传递
基于开放医疗大数据的人工智能研究 被引量:8
14
作者 马婷 陈清财 《医学与哲学》 北大核心 2022年第1期1-4,共4页
医疗人工智能(artificial intelligence,AI)的发展离不开大数据的汇聚与标注,同时也引发了医疗大数据及其标注标准如何统一的问题。从AI发展对医疗大数据需求出发,指出建立医疗大数据统一标准的重要性与必要性,分析当前医疗AI技术的开... 医疗人工智能(artificial intelligence,AI)的发展离不开大数据的汇聚与标注,同时也引发了医疗大数据及其标注标准如何统一的问题。从AI发展对医疗大数据需求出发,指出建立医疗大数据统一标准的重要性与必要性,分析当前医疗AI技术的开发过程缺乏数据统一标准和临床共识,提出“以开放换取共识”的医疗大数据平台方案——素问系统,实现“算法工程师开发技术—临床医生编辑知识—伦理专家监控伦理”的一体化AI生产流程。最后,以素问系统中第一个开源项目——医学知识图谱,作为大数据抽取标准知识的案例,解析了如何以开放换取共识,让AI技术专家与临床专家共同打造可落地的医疗AI技术。 展开更多
关键词 医疗大数据 人工智能 临床共识 医学知识图谱
下载PDF
基于深度学习的图像-文本匹配研究综述 被引量:6
15
作者 刘萌 齐孟津 +3 位作者 詹圳宇 曲磊钢 聂秀山 聂礼强 《计算机学报》 EI CAS CSCD 北大核心 2023年第11期2370-2399,共30页
图像-文本匹配任务旨在衡量图像和文本描述之间的相似性,其在桥接视觉和语言中起着至关重要的作用.近年来,图像与句子的全局对齐以及区域与单词的局部对齐研究方面取得了很大的进展.本文对当前先进的研究方法进行分类和描述.具体地,本... 图像-文本匹配任务旨在衡量图像和文本描述之间的相似性,其在桥接视觉和语言中起着至关重要的作用.近年来,图像与句子的全局对齐以及区域与单词的局部对齐研究方面取得了很大的进展.本文对当前先进的研究方法进行分类和描述.具体地,本文将现有方法划分为基于全局特征的图像-文本匹配方法、基于局部特征的图像-文本匹配方法、基于外部知识的图像-文本匹配方法、基于度量学习的图像-文本匹配方法以及多模态预训练模型,对于基于全局特征的图像-文本匹配方法,本文依据流程类型划分为两类:基于嵌入的方法和基于交互的方法;而对于基于局部特征的图像-文本匹配方法,依据其交互模式的不同,则被细分为三类:基于模态内关系建模的方法、基于模态间关系建模的方法以及基于混合交互建模的方法.随后,本文对当前图像-文本匹配任务的相关数据集进行了整理,并对现有方法的实验结果进行分析与总结.最后,对未来研究可能面临的挑战进行了展望. 展开更多
关键词 图像-文本匹配 跨模态图像检索 多模态预训练模型 综述 深度学习 人工智能
下载PDF
YOLOv5上融合多特征的实时火焰检测方法 被引量:7
16
作者 张大胜 肖汉光 +1 位作者 文杰 徐勇 《模式识别与人工智能》 EI CSCD 北大核心 2022年第6期548-561,共14页
在自然场景中,天气情况、光照强度、背景干扰等问题影响火焰检测的准确性.为了实现复杂场景下实时准确的火焰检测,在目标检测网络YOLOv5的基础上,结合Focal Loss焦点损失函数、CIoU(Complete Intersection over Union)损失函数与多特征... 在自然场景中,天气情况、光照强度、背景干扰等问题影响火焰检测的准确性.为了实现复杂场景下实时准确的火焰检测,在目标检测网络YOLOv5的基础上,结合Focal Loss焦点损失函数、CIoU(Complete Intersection over Union)损失函数与多特征融合,提出实时高效的火焰检测方法.为了缓解正负样本不均衡问题,并充分利用困难样本的信息,引入焦点损失函数,同时结合火焰静态特征和动态特征,设计多特征融合方法,达到剔除误报火焰的目的.针对国内外缺乏火焰数据集的问题,构建大规模、高质量的十万量级火焰数据集(http://www.yongxu.org/data bases.html).实验表明,文中方法在准确率、速度、精度和泛化能力等方面均有明显提升,同时降低误报率. 展开更多
关键词 YOLOv5 火焰检测 FOCAL Loss损失函数 CIoU损失函数 多特征融合
下载PDF
联邦学习及其安全与隐私保护研究综述 被引量:3
17
作者 熊世强 何道敬 +1 位作者 王振东 杜润萌 《计算机工程》 CAS CSCD 北大核心 2024年第5期1-15,共15页
联邦学习(FL)是一种新兴的分布式机器学习技术,只需将数据留在本地即可通过各方协作训练一个共有模型,解决了传统机器学习中数据难以采集和隐私安全的问题。随着联邦学习技术的应用和发展,相关研究发现联邦学习仍可能受到各类攻击。为... 联邦学习(FL)是一种新兴的分布式机器学习技术,只需将数据留在本地即可通过各方协作训练一个共有模型,解决了传统机器学习中数据难以采集和隐私安全的问题。随着联邦学习技术的应用和发展,相关研究发现联邦学习仍可能受到各类攻击。为了确保联邦学习的安全性,研究联邦学习中的攻击方式及相应的隐私保护技术显得尤为重要。首先介绍了联邦学习的背景知识及相关定义,总结概括了联邦学习的发展历程及分类;接着阐述了联邦学习的安全三要素,从基于安全来源和基于安全三要素2个角度分类概述了联邦学习中的安全问题及研究进展;然后对隐私保护技术进行分类,结合相关研究应用综述了联邦学习中安全多方计算(SMC)、同态加密(HE)、差分隐私(DP)、可信执行环境(TEE)4种常用隐私保护技术;最后对联邦学习的未来研究方向进行展望。 展开更多
关键词 联邦学习 数据安全 攻击方式 隐私保护 安全三要素
下载PDF
基于对抗学习的讽刺识别研究 被引量:7
18
作者 张庆林 杜嘉晨 徐睿峰 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2019年第1期29-36,共8页
为了避免现有讽刺识别方法的性能会受训练数据缺乏的影响,在使用有限标注数据训练的注意力卷积神经网络基础上,提出一种对抗学习框架,该框架包含两种互补的对抗学习方法。首先,提出一种基于对抗样本的学习方法,应用对抗生成的样本参与... 为了避免现有讽刺识别方法的性能会受训练数据缺乏的影响,在使用有限标注数据训练的注意力卷积神经网络基础上,提出一种对抗学习框架,该框架包含两种互补的对抗学习方法。首先,提出一种基于对抗样本的学习方法,应用对抗生成的样本参与模型训练,以期提高分类器的鲁棒性和泛化能力。进而,研究基于领域迁移的对抗学习方法,以期利用跨领域讽刺表达数据,改善模型在目标领域上的识别性能。在3个讽刺数据集上的实验结果表明,两种对抗学习方法都能提高讽刺识别的性能,其中基于领域迁移方法的性能提升更显著;同时结合两种对抗学习方法能够进一步提高讽刺识别性能。 展开更多
关键词 讽刺识别 对抗学习 注意力机制 卷积神经网络 对抗样本
下载PDF
高校思想政治教育工作有效性提升路径的探索 被引量:7
19
作者 辛欣 《教育教学论坛》 2020年第48期92-94,共3页
随着国内外形势的复杂多变和社会思潮的不断冲击,高等院校的思想政治工作面临着严峻的挑战。思想政治教育工作的有效性直接影响了高等院校“怎样培养人”和“培养什么样的人”的战略目标,影响了青年大学生的培养质量和育人效果。青年的... 随着国内外形势的复杂多变和社会思潮的不断冲击,高等院校的思想政治工作面临着严峻的挑战。思想政治教育工作的有效性直接影响了高等院校“怎样培养人”和“培养什么样的人”的战略目标,影响了青年大学生的培养质量和育人效果。青年的价值取向决定着未来整个社会的价值取向。青年兴则国家兴,青年强则国家强。高校思想政治教育工作者应立足“立德树人”,遵循“以人为本”原则,注重人文教育、专业教育和思想政治教育三方面协同发展,落实青年大学生的自我探索、思想引领、实践应用和网络引导四元契合的教育战略,以多维度、深层次的工作方式提升高等院校思想政治教育工作的有效性。 展开更多
关键词 青年大学生 思想政治教育工作 有效性提升路径
下载PDF
结合金融领域情感词典和注意力机制的细粒度情感分析 被引量:6
20
作者 祝清麟 梁斌 +3 位作者 徐睿峰 刘宇瀚 陈奕 毛瑞彬 《中文信息学报》 CSCD 北大核心 2022年第8期109-117,共9页
针对在金融领域实体级情感分析任务中缺乏足够的标注语料,以及通用的情感分析模型难以有效处理金融文本等问题,该文构建一个百万级别的金融领域实体情感分析语料库,并标注5000余个金融领域情感词作为金融领域情感词典。同时,基于该金融... 针对在金融领域实体级情感分析任务中缺乏足够的标注语料,以及通用的情感分析模型难以有效处理金融文本等问题,该文构建一个百万级别的金融领域实体情感分析语料库,并标注5000余个金融领域情感词作为金融领域情感词典。同时,基于该金融领域数据集,提出一种结合金融领域情感词典和注意力机制的金融文本细粒度情感分析模型(FinLexNet)。该模型使用两个LSTM网络分别提取词级别的语义信息和基于情感词典分类后的词类级别信息,能有效获取金融领域词语的特征信息。此外,为了让文本中金融领域情感词获得更多关注,提出一种基于金融领域情感词典的注意力机制来为不同实体获取重要的情感信息。最终在构建的金融领域实体级语料库上进行实验,取得了比对比模型更好的效果。 展开更多
关键词 细粒度情感分析 金融文本 金融情感词典
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部