期刊文献+
共找到91篇文章
< 1 2 5 >
每页显示 20 50 100
提示学习驱动的新闻舆情风险识别方法研究 被引量:3
1
作者 曾慧玲 李琳 +1 位作者 吕思洋 何铮 《计算机工程与应用》 CSCD 北大核心 2024年第1期182-188,共7页
从新闻报道中识别企业的风险可以快速定位企业所涉及的风险类别,从而帮助企业及时地做出应对措施。一般而言,新闻舆情风险识别是一种风险标签的多分类任务。以BERT为代表的深度学习方法采用预训练+微调的模式在文本分类任务当中表现突... 从新闻报道中识别企业的风险可以快速定位企业所涉及的风险类别,从而帮助企业及时地做出应对措施。一般而言,新闻舆情风险识别是一种风险标签的多分类任务。以BERT为代表的深度学习方法采用预训练+微调的模式在文本分类任务当中表现突出。然而新闻舆情领域标记数据偏少,构成了小样本的机器学习问题。以提示学习为代表的新范式为小样本分类性能的提升提供了一种新的途径和手段,现有的研究表明该范式在很多任务上优于预训练+微调的方式。受现有研究工作的启发,提出了基于提示学习的新闻舆情风险识别方法,在BERT预训练模型基础之上根据提示学习的思想设计新闻舆情风险提示模板,通过MLM(masked language model)模型训练之后,将预测出来的标签通过答案工程映射到已有的风险标签。实验结果表明在新闻舆情数据集的不同数量小样本上,提示学习的训练方法均优于微调的训练方法。 展开更多
关键词 风险标签 多分类 预训练模型 提示学习
下载PDF
ELMo-CNN-BiGRU双通道文本情感分类模型 被引量:8
2
作者 吴迪 王梓宇 赵伟超 《计算机工程》 CAS CSCD 北大核心 2022年第8期105-112,共8页
文本情感分类通过对带有情感色彩的主观性文本进行分析和推理,帮助用户更好地做出判断与决策。针对传统情感分类模型难以根据上下文信息调整词向量的问题,提出一种双通道文本情感分类模型。利用ELMo和Glove预训练模型分别生成动态和静... 文本情感分类通过对带有情感色彩的主观性文本进行分析和推理,帮助用户更好地做出判断与决策。针对传统情感分类模型难以根据上下文信息调整词向量的问题,提出一种双通道文本情感分类模型。利用ELMo和Glove预训练模型分别生成动态和静态词向量,通过堆叠嵌入2种词向量生成输入向量。采用自注意力机制处理输入向量,计算内部的词依赖关系。构建融合卷积神经网络(CNN)和双向门控递归单元(BiGRU)的双通道神经网络结构,同时获取文本局部特征和全局特征。最终将双通道处理结果进行拼接,经过全连接层处理后输入分类器获得文本情感分类结果。实验结果表明,与同类情感分类模型中性能较优的H-BiGRU模型相比,ELMo-CNN-BiGRU模型在IMDB、yelp和sentiment140数据集上的准确率和F1值分别提升了2.42、1.98、2.52和2.40、1.94、2.43个百分点,具有更好的短文本情感分类效果和稳定性。 展开更多
关键词 文本情感分类 双通道 预训练模型 深度学习 自注意力机制
下载PDF
基于有监督对比学习的遥感图像场景分类 被引量:9
3
作者 郭东恩 夏英 +1 位作者 罗小波 丰江帆 《光子学报》 EI CAS CSCD 北大核心 2021年第7期79-90,共12页
针对遥感场景图像中复杂背景以及类内多样性和类间相似性影响场景分类性能的问题,提出一种基于有监督对比学习的遥感场景分类方法。该方法包含判别性特征学习和线性分类两个阶段。在判别性特征学习阶段,引入有监督对比损失以拉近同类场... 针对遥感场景图像中复杂背景以及类内多样性和类间相似性影响场景分类性能的问题,提出一种基于有监督对比学习的遥感场景分类方法。该方法包含判别性特征学习和线性分类两个阶段。在判别性特征学习阶段,引入有监督对比损失以拉近同类场景间的距离并增大不同类场景间的距离,提高类内多样性和类间相似性场景的判别能力;然后引入门控自注意模块对无用的背景信息进行过滤且聚焦关键场景区域,提高复杂背景的场景识别;最后引入一个预训练的Inception V3语义分支,把语义分支和原始模型提取的特征进行融合增强特征判别能力,以提高场景分类的整体性能。线性分类阶段通过对特征学习阶段训练的模型进行微调获得分类结果。在AID和NWPU-RESISC45数据集上的综合实验证明了所提方法的有效性。 展开更多
关键词 有监督对比学习 特征融合 遥感场景分类 门控机制 自注意机制 遥感图像 预训练模型
下载PDF
基于预训练模型的单帧航拍图像无监督语义分割 被引量:1
4
作者 任月冬 游新冬 +1 位作者 滕尚志 吕学强 《北京信息科技大学学报(自然科学版)》 2024年第2期21-28,共8页
针对航拍图像语义分割成本高、通用性差和精度低等问题,提出了一种两阶段无监督语义分割网络(two-stage unsupervised semantic segmentation net, TUSSNet),针对单帧航拍图像训练进而生成最终的语义分割结果。算法分为2个阶段。首先,... 针对航拍图像语义分割成本高、通用性差和精度低等问题,提出了一种两阶段无监督语义分割网络(two-stage unsupervised semantic segmentation net, TUSSNet),针对单帧航拍图像训练进而生成最终的语义分割结果。算法分为2个阶段。首先,使用对比语言-图像预训练(contrastive language-image pretraining, CLIP)模型生成航拍图像的粗粒度语义标签,然后进行网络的预热训练。其次,在第一阶段的基础上,采用分割一切模型(segment anything model, SAM)对航拍图像进行细粒度类别预测,生成精细化类别掩码伪标签;然后迭代优化网络,得到最终语义分割结果。实验结果显示,相较于现有无监督语义分割方法,算法显著提高了航拍图像的分割精度,同时提供了准确的语义信息。 展开更多
关键词 预训练模型 航拍图像 语义分割 无监督算法 聚类效果估计 深度学习
下载PDF
面向借贷案件的相似案例匹配模型
5
作者 曹发鑫 孙媛媛 +2 位作者 王治政 潘丁豪 林鸿飞 《计算机工程》 CSCD 北大核心 2024年第1期306-312,共7页
相似案例匹配任务是文本匹配在司法领域的具体应用之一,目的在于区分法律文书是否相似,对类案检索具有重要意义。与传统文本匹配任务相比,法律文本通常篇幅较长,同时相似案例匹配是针对相同案由案件的匹配,案情文本之间的差异较小,以往... 相似案例匹配任务是文本匹配在司法领域的具体应用之一,目的在于区分法律文书是否相似,对类案检索具有重要意义。与传统文本匹配任务相比,法律文本通常篇幅较长,同时相似案例匹配是针对相同案由案件的匹配,案情文本之间的差异较小,以往的文本匹配方法很难计算文本相似度。针对借贷案件文本匹配存在的问题,建立一种融合借贷案件关键要素的相似案例匹配模型。为了获取文本中更丰富的语义特征,构建正则表达式获得借贷案件的特定案件要素,如借款交付形式、借款人基本属性等,并与原有的案情文本相结合,联合学习法律文本与案件关键要素的语义特征。同时,利用共享权重的预训练模型分别对不同的文书进行编码,并且对预训练模型特定编码层的输出进行融合,得到更加丰富的语义信息。引入有监督对比学习框架,更好地利用样本信息,进一步提高相似案例匹配的性能。在CAIL2019-SCM数据集上的实验结果表明,与LFESM模型相比,该模型在测试集上的准确率提高了1.05个百分点。 展开更多
关键词 相似案例匹配 孪生网络 对比学习 预训练模型 法律关键要素
下载PDF
基于预训练模型自适应匹配的视觉故事生成算法
6
作者 宁铭 江爱文 +2 位作者 崔朝阳 刘长红 王明文 《中文信息学报》 CSCD 北大核心 2024年第5期155-166,共12页
视觉故事生成任务是为一组图像序列生成具有表现力和连贯性的、能准确描述所涉及视觉内容的语句段落,是当前计算机视觉和自然语言处理交叉领域中一个有趣而又快速发展的多模态研究方向。随着预训练模型在各种下游任务的成功,基于预训练... 视觉故事生成任务是为一组图像序列生成具有表现力和连贯性的、能准确描述所涉及视觉内容的语句段落,是当前计算机视觉和自然语言处理交叉领域中一个有趣而又快速发展的多模态研究方向。随着预训练模型在各种下游任务的成功,基于预训练模型的视觉故事生成算法也被广泛研究。但因为数据模态的差异和语义鸿沟的存在,预训练模型在微调学习过程中会产生灾难性遗忘问题。如何协调视觉和语言两种模态数据的预训练模型,是当前多模态预训练模型研究的主要目标之一。该文提出基于预训练模型自适应匹配的视觉故事生成算法,一方面综合挖掘图像流的视觉、关系、序列等多样化互补信息,弥补语义差异;同时,另一方面用适应性损失对图文两种模态数据进行特征对齐,以及对图像流数据进行连续信息对齐,取得了较好的效果。算法在目前已公开的视觉故事生成数据集(VIST)上与近年的先进算法进行实验比较。评测结果表明,该文算法在生成故事的图文相关性、文本多样性、内容逻辑连贯性等指标上取得了具有竞争力的结果。 展开更多
关键词 视觉故事 适应匹配损失 预训练模型 多模态特征 图像序列
下载PDF
基于迁移学习的棉/毛纤维自动识别方法
7
作者 游小荣 李淑芳 《毛纺科技》 CAS 北大核心 2024年第6期83-88,共6页
针对纺织品废料中织物纤维手工分类存在效率低、主观性强等问题,提出了一种小样本条件下纺织品废料中棉/毛纤维的自动识别方法。首先使用扫描电子显微镜,对已有的棉/毛纤维进行拍照,形成小样本棉/毛纤维图像集;然后分别加载4种经ImageNe... 针对纺织品废料中织物纤维手工分类存在效率低、主观性强等问题,提出了一种小样本条件下纺织品废料中棉/毛纤维的自动识别方法。首先使用扫描电子显微镜,对已有的棉/毛纤维进行拍照,形成小样本棉/毛纤维图像集;然后分别加载4种经ImageNet数据集训练过的模型进行迁移学习,保留或部分微调模型的网络参数,并基于小样本图像集进行训练和验证,生成棉/毛纤维的分类模型;最后基于准确率、精确率和召回率评价指标,对各种分类模型进行对比测试,选出最优分类模型,实现棉/毛纤维的自动识别。经过实验发现ResNetXt50模型在模型训练过程中取得了最高的精确率,其值为97.33%。对测试集进行测试,结果显示通过微调后的4种分类模型中,ResNet50和ResNetXt50的测试准确率可达99.537%,验证了方法的有效性。 展开更多
关键词 纺织品废料 小样本 迁移学习 预训练模型 图像识别
下载PDF
基于人工智能技术的画作鉴赏
8
作者 张以琳 《信息与电脑》 2024年第3期67-69,共3页
随着互联网和数字化技术的发展,人们可以轻松地获得各种类型的图片和画作,但是很多人对于艺术作品的鉴赏水平较低,无法从中领略到作者所想要表达的艺术意境。因此,设计一款能够自动对画作进行鉴赏并为用户提供艺术鉴赏指导的画作鉴赏模... 随着互联网和数字化技术的发展,人们可以轻松地获得各种类型的图片和画作,但是很多人对于艺术作品的鉴赏水平较低,无法从中领略到作者所想要表达的艺术意境。因此,设计一款能够自动对画作进行鉴赏并为用户提供艺术鉴赏指导的画作鉴赏模型显得非常有意义。文章首先介绍了卷积神经网络和图像预处理技术,然后使用EfficientNet模型架构进行模型训练与评价。研究结果表明,基于人工智能技术的画作鉴赏能够实现准确的画作鉴赏,具有实用价值和应用前景。 展开更多
关键词 卷积神经网络 图像预处理 预训练模型 画作鉴赏
下载PDF
基于语境与文本结构融合的中文拼写纠错方法
9
作者 刘昌春 张凯 +2 位作者 包美凯 刘烨 刘淇 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期451-463,共13页
在中文拼写纠错任务的处理中往往存在对句子的语义理解不够且对于汉字的语音和视觉信息利用较少的问题,针对这一问题,提出一种基于语境置信度和汉字相似度的纠错方法(ECS).该方法基于深度学习的理论,融合汉字的视觉相似度、汉字的语音... 在中文拼写纠错任务的处理中往往存在对句子的语义理解不够且对于汉字的语音和视觉信息利用较少的问题,针对这一问题,提出一种基于语境置信度和汉字相似度的纠错方法(ECS).该方法基于深度学习的理论,融合汉字的视觉相似度、汉字的语音相似度以及微调过的预训练BERT模型,能自动提取句子语义并利用汉字的相似性.具体地,通过对预训练的中文BERT模型进行微调,使之能适应下游的中文拼写纠错任务;同时,利用表意文字描述序列获取汉字的树形结构作为视觉信息,采用汉字的拼音序列作为语音信息;最后,利用编辑距离得出汉字的视觉和语音相似度,并将这些相似度数据与微调过的BERT模型融合,以实现纠错任务.在SIGHAN标准数据集上的测试结果显示,和基准模型相比,提出的ECS方法其F1-score提升巨大,在检错层面上提升2.1%,在纠错层面上提升2.8%,也验证了将汉字的语境信息、视觉信息与语音信息融合用于中文拼写纠错任务的适用性. 展开更多
关键词 中文拼写纠错 BERT 汉字语音相似度 汉字视觉相似度 预训练模型
下载PDF
基于领域知识微调的缺陷报告严重性预测
10
作者 陈冰婷 邹卫琴 +1 位作者 蔡碧瑜 刘文杰 《计算机科学》 CSCD 北大核心 2024年第S01期835-841,共7页
有效预测缺陷报告的严重性,对快速、准确分派缺陷报告,帮助开发人员及时发现并处理软件中的缺陷至关重要。现有主流的基于传统信息检索或通用预训练模型的缺陷报告严重性预测方法,存在忽略上下文语义或缺陷报告特性导致预测效果受限的... 有效预测缺陷报告的严重性,对快速、准确分派缺陷报告,帮助开发人员及时发现并处理软件中的缺陷至关重要。现有主流的基于传统信息检索或通用预训练模型的缺陷报告严重性预测方法,存在忽略上下文语义或缺陷报告特性导致预测效果受限的问题。对此,提出一种基于领域知识微调的缺陷报告严重性预测方法。利用能充分考虑文本上下文语义的BERT预训练模型,并使用缺陷报告数据对其进行模型微调使其学习到相关的领域知识。微调后的BERT模型用于抽取缺陷报告的语义特征,随后使用支持向量机进行严重性预测模型的构建。在Mozilla,Eclipse和Apache选取的共计15个项目上进行的实验表明,在准确率、召回率和F1值上,相较传统的信息检索方法,所提方法分别能提升4.5%~22.0%,3.0%~22.0%,4.0%~22.0%;相较通用BERT模型,微调后的BERT模型的准确率、召回率和F1值分别能够提高2.0%~5.1%,1.9%~5.1%,1.8%~5.0%。 展开更多
关键词 词嵌入 BERT 预训练模型 缺陷报告 微调 严重性预测
下载PDF
一种基于联合预测的简历实体识别方法
11
作者 黄康洲 周刚 范永胜 《人工智能科学与工程》 CAS 北大核心 2024年第1期70-84,共15页
目前个人简历实体类型繁多,大量平面实体和嵌套实体交错在简历中,对实体识别产生了不小的负面影响。为此,设计了一种联合预测的命名实体识别框架。首先,利用预训练模型Mengzi-BERT进行上下文的词嵌入表示。为了充分利用预训练模型提取... 目前个人简历实体类型繁多,大量平面实体和嵌套实体交错在简历中,对实体识别产生了不小的负面影响。为此,设计了一种联合预测的命名实体识别框架。首先,利用预训练模型Mengzi-BERT进行上下文的词嵌入表示。为了充分利用预训练模型提取的特征,先对网络深度进行压缩,放大卷积层感受野,并且融合了自注意力机制,然后设计了一个新的命名实体识别模型TPDCA(triple layers progressive dilated convolutional neural network-attention)。其次,为防止实体之间跨度过大、简历实体嵌套等问题,设计了全新的基于Biaffine双仿射注意力机制的局部关系实体识别模型BCN(biaffine-based local relationship capture network)。最后,通过分别调整TPDCA模型和BCN局部关系识别模型的预测权重进行联合预测,构成Mengzi-TPDCA-CRF-BCN联合预测框架,获得了综合表现最佳的实体识别结果。这样设计避免了模型丢失实体间长距离依赖关系,降低了平面实体和嵌套实体相互交错对预测的负面影响,解决了实体类型间的高耦合度影响识别任务的问题。该模型与现行主流方法相比各评价指标提升了3%,有效地解决了简历实体类型间耦合度高,实体间跨度大的实际问题。 展开更多
关键词 自然语言处理 预训练模型 命名实体识别 深度学习 简历信息 联合预测
下载PDF
基于颜色通道特征融合的环境声音分类方法 被引量:1
12
作者 董绍江 夏蒸富 +2 位作者 方能炜 邢镔 胡小林 《应用科学学报》 CAS CSCD 北大核心 2023年第4期669-681,共13页
针对传统神经网络提取的复杂环境声音特征微弱,导致分类准确率低的问题,提出了一种基于颜色通道特征融合的环境声音分类方法。首先,从原始音频数据中提取出三种声音特征,即对数梅尔频谱图(log-Mel spectrogram,LMS)、梅尔倒谱系数(Mel-s... 针对传统神经网络提取的复杂环境声音特征微弱,导致分类准确率低的问题,提出了一种基于颜色通道特征融合的环境声音分类方法。首先,从原始音频数据中提取出三种声音特征,即对数梅尔频谱图(log-Mel spectrogram,LMS)、梅尔倒谱系数(Mel-scale frequency cepstral coefficients,MFCC)以及能量谱图(energy spectrum,ES);其次,分别将以上三者作为RGB颜色通道分量进行特征融合,形成包含更多特征信息的声谱图,更全面表征环境声音;再次,为了避免由于数据集较少导致所训练的模型泛化能力较差,对预训练模型VGG-16采用微调方法进行训练;最后,在两个广泛使用的环境声音分类数据集以及实际场景采集的音频上验证本文所提方法的有效性,并与其他模型的准确率进行对比。结果表明,本文所提方法在ESC-10以及ESC-50数据集上的准确率分别能够达到88.2%和65.2%,并且能提高实际场景采集的音频分类效果。 展开更多
关键词 RGB颜色通道 特征融合 微调训练 环境声音分类 预训练模型
下载PDF
嵌入知识语义的医疗领域对话系统
13
作者 吕学强 张剑 +2 位作者 穆天杨 李宝安 游新冬 《计算机工程与设计》 北大核心 2023年第12期3794-3799,共6页
由于领域知识图谱包含丰富的相应领域下实体及实体间关系的知识语义,能够为领域对话的回复提供重要参考,提出一种BERT融合BiLSTM的对话训练方法。基于医疗知识图谱,将知识语义的图谱信息融入对话系统,使用TransE模型将已有的医疗图谱数... 由于领域知识图谱包含丰富的相应领域下实体及实体间关系的知识语义,能够为领域对话的回复提供重要参考,提出一种BERT融合BiLSTM的对话训练方法。基于医疗知识图谱,将知识语义的图谱信息融入对话系统,使用TransE模型将已有的医疗图谱数据融入多轮对话,通过扩充知识库的信息扩大对话系统的适用范围,对比GPT2和BERT模型在已有多轮对话数据集上的效果。实验结果表明,该方法F1值达到92.59%,满足了对话系统对回复严谨性的要求。 展开更多
关键词 对话系统 知识图谱 知识语义 深度学习 医疗领域 图嵌入 预训练模型
下载PDF
6G智联新场景与网络管控新范式
14
作者 廖建新 李博堃 +2 位作者 郭令奇 戚琦 王敬宇 《信息通信技术》 2023年第6期21-27,共7页
随着6G通信技术的蓬勃发展,新的智联场景不断浮现,给包含网络管控在内的网络架构带来新的挑战和需求。文章首先介绍IMT-2030工作组对6G应用场景的分析,具体涵盖九大特点和主要的智联场景,以及这些场景的分类总结。接着根据场景特点列举6... 随着6G通信技术的蓬勃发展,新的智联场景不断浮现,给包含网络管控在内的网络架构带来新的挑战和需求。文章首先介绍IMT-2030工作组对6G应用场景的分析,具体涵盖九大特点和主要的智联场景,以及这些场景的分类总结。接着根据场景特点列举6G网络架构需要面对的挑战和满足的需求,并概括国内三大运营商的6G网络架构设计思想。最后,介绍知识定义的意图网络,作为一个新的6G网络管控范式,并梳理其核心理念——知识与意图双闭环管控架构。 展开更多
关键词 通信技术 第六代移动通信网络 网络管控 自智网络 知识定义网络 意图网络 预训练模型 知识图谱
下载PDF
基于梯度数据选择的跨领域情感分析
15
作者 苏仪 周夏冰 《软件导刊》 2023年第5期50-56,共7页
情感分析研究往往依赖特定场景的大量标注数据,领域迁移会导致模型需要重新进行训练,因此跨领域情感分析任务应运而生。然而,目前跨领域情感分析方法大多考虑学习域的不变特征,或进行特征适应以处理源领域与目标领域的差距,并没有充分... 情感分析研究往往依赖特定场景的大量标注数据,领域迁移会导致模型需要重新进行训练,因此跨领域情感分析任务应运而生。然而,目前跨领域情感分析方法大多考虑学习域的不变特征,或进行特征适应以处理源领域与目标领域的差距,并没有充分、高效地利用源领域数据,所以需要从数据迁移和利用的角度研究领域适应问题。不同于之前从源领域提取可迁移样本的启发式方法,提出一种通用的可学习的替代方法——梯度数据选择(GDS),可在训练过程中自动分配样本权重,由此使不可迁移的样本很容易在采样过程中被丢弃,而可迁移的样本会被更加频繁地采样到。在英文和中文两个数据集上进行实验,并将GDS应用到BERT、RoBERTa等模型进行通用性分析,实验结果证实了该方法的有效性。 展开更多
关键词 跨领域情感分析 领域适应 数据选择 半监督学习 迁移学习 预训练模型
下载PDF
基于复述模型的词语替代方法
16
作者 强继朋 陈宇 +2 位作者 李杨 李云 吴信东 《中文信息学报》 CSCD 北大核心 2023年第5期22-31,43,共11页
词语替代任务旨在为句子中的目标词寻找合适的替代词。基于预训练语言模型BERT的词语替代方法直接利用目标词的上下文信息生成替代候选词。由于标注数据资源的缺乏使得研究人员通常采用无监督的方法,这也限制了预训练模型在此任务上的... 词语替代任务旨在为句子中的目标词寻找合适的替代词。基于预训练语言模型BERT的词语替代方法直接利用目标词的上下文信息生成替代候选词。由于标注数据资源的缺乏使得研究人员通常采用无监督的方法,这也限制了预训练模型在此任务上的适用性。考虑到现有的大规模复述语料中包含了大量的词语替代规则,该文提出一种通过复述模型生成替代候选词的方法。具体的做法是:利用复述语料训练一个神经复述模型;提出了一种只关注目标词变化的解码策略,用于从复述模型中生成替代词;根据文本生成评估指标计算替代词对原句意思的改变程度,对替代词排序。相对已有的词语替代方法,在两个广泛使用的数据集LS07和CoInCo上进行评估,该文提出的方法取得了显著的提高。 展开更多
关键词 词语替代 复述模型 预训练模型
下载PDF
基于电子病历的预训练模型在急性呼吸道感染识别中的应用 被引量:2
17
作者 贾萌萌 刘晞照 +14 位作者 漆莉 戴佩希 李勤 姜明月 唐文革 谭明伟 李婷婷 姜玢杉 任钰华 饶俊莉 颜朝阳 曹琰琳 杨维中 冉华 冯录召 《中华预防医学杂志》 CAS CSCD 北大核心 2022年第11期1543-1548,共6页
目的评价基于电子病历的预训练模型对急性呼吸道感染(ARI)的识别效果。方法收集重庆大学附属三峡医院2021年12月1至31日就诊于呼吸与危重症科、发热门诊、急诊门诊、儿科、感染科的所有患者的病历资料。使用基于Transformer的双向编码... 目的评价基于电子病历的预训练模型对急性呼吸道感染(ARI)的识别效果。方法收集重庆大学附属三峡医院2021年12月1至31日就诊于呼吸与危重症科、发热门诊、急诊门诊、儿科、感染科的所有患者的病历资料。使用基于Transformer的双向编码器表征(BERT)预训练模型对病历进行ARI病例识别与判断,以医学专业人员根据ARI病例定义判断的结果作为“金标准”,计算模型识别ARI的灵敏度、特异度、与“金标准”的一致性及受试者工作特征曲线下面积(AUC),评价模型对ARI病例识别的准确性。结果含有3817条电子医疗记录的测试集中,共有1200条经人工判定的ARI病历。模型判定ARI共计1205例,灵敏度为92.67%(1112/1200),特异度96.45%(2524/2617),与“金标准”的一致性Kappa值为0.89,AUC为0.95。模型在男性和女性中识别ARI的准确性相近(AUC分别为0.95和0.94),且对未成年ARI病例识别较18~59岁及≥60岁(AUC分别为0.94,0.89和0.89)更准确。相较于住院患者,目前模型对门诊患者的ARI识别更好,AUC分别为0.74和0.95。结论使用基于电子病历的预训练模型对ARI病例判定具有良好的效果,特别是针对门诊患者及未成年患者。该模型在利用电子病历进行医疗机构ARI病例监测方面表现出良好的潜力。 展开更多
关键词 急性呼吸道感染 电子病历 预训练模型 应用
原文传递
增强卷积神经网络的人脸篡改检测方法 被引量:3
18
作者 张韩钰 吴志昊 +1 位作者 徐勇 陈斌 《计算机工程与应用》 CSCD 北大核心 2021年第8期220-224,共5页
由于人脸篡改具有很大的危害,关于人脸篡改的判别方法的研究十分重要。已有的基于卷积神经网络的人脸篡改判别研究取得了一定的进展,但是判别结果不尽如意。现有的篡改判别方法大多只关注于假脸的某一类特征,但越来越多样化的人脸篡改... 由于人脸篡改具有很大的危害,关于人脸篡改的判别方法的研究十分重要。已有的基于卷积神经网络的人脸篡改判别研究取得了一定的进展,但是判别结果不尽如意。现有的篡改判别方法大多只关注于假脸的某一类特征,但越来越多样化的人脸篡改手段容易使得现有的篡改判别方法失效。针对这些问题,使用一个性能优异的预训练模型,并利用一种数据增强方式和一种标签平滑化的损失函数,在篡改过的人脸视频的检测上取得了准确度的显著提高。而且,由于采用了“抽帧”处理的方式,提出的方法具有很高的计算效率。 展开更多
关键词 人脸篡改 图像分类 预训练模型 数据增强 标签平滑
下载PDF
基于栈式预训练模型的中文序列标注 被引量:1
19
作者 刘宇鹏 李国栋 《哈尔滨理工大学学报》 CAS 北大核心 2022年第1期8-13,共6页
序列标注(sequence labelling)是自然语言处理(natural language processing)中的一类重要任务。在文中,根据任务的相关性,使用栈式预训练模型进行特征提取,分词,命名实体识别/语块标注。并且通过对BERT内部框架的深入研究,在保证原有... 序列标注(sequence labelling)是自然语言处理(natural language processing)中的一类重要任务。在文中,根据任务的相关性,使用栈式预训练模型进行特征提取,分词,命名实体识别/语块标注。并且通过对BERT内部框架的深入研究,在保证原有模型的准确率下进行优化,降低了BERT模型的复杂度,减少了模型在训练和预测过程中的时间成本。上层结构上,相比于传统的长短期记忆络(LSTM),采用的是双层双向LSTM结构,底层使用双向长短期记忆网络(Bi-LSTM)用来分词,顶层用来实现序列标注任务。在新式半马尔可夫条件随机场(new semi-conditional random field,NSCRF)上,将传统的半马尔可夫条件随机场(Semi-CRF)和条件随机场(CRF)相结合,同时考虑分词和单词的标签,在训练和解码上提高了准确率。将模型在CCKS2019、MSRANER和BosonNLP数据集上进行训练并取得了很大的提升,F1测度分别达到了92.37%、95.69%和93.75%。 展开更多
关键词 基于BERT的栈式模型 预训练模型 命名实体识别 语块分析
下载PDF
自监督聚类重训练的语音表示学习 被引量:1
20
作者 张文林 刘雪鹏 +2 位作者 牛铜 杨绪魁 屈丹 《模式识别与人工智能》 EI CSCD 北大核心 2022年第5期461-471,共11页
现有的基于重建的自监督预训练方法往往通过对语音帧的还原重建进行训练,未充分利用语音帧包含的音素信息.因此,文中结合自监督学习方法与噪声学生训练,提出基于自监督聚类重训练的语音表示学习方法.基于一个初始的语音表示模型(教师模... 现有的基于重建的自监督预训练方法往往通过对语音帧的还原重建进行训练,未充分利用语音帧包含的音素信息.因此,文中结合自监督学习方法与噪声学生训练,提出基于自监督聚类重训练的语音表示学习方法.基于一个初始的语音表示模型(教师模型),利用无监督聚类得到音素类别伪标签.结合伪标签预测任务与重构任务,重新训练表示模型(学生模型).将学生模型作为新的教师模型,借助聚类与重训练,不断优化伪标签与语音表示模型.对比实验表明,经过聚类重训练后,语音表示模型在音素识别和说话人识别两项下游任务上均优于聚类重训练前的模型,性能较优. 展开更多
关键词 无监督学习 自监督学习 语音表示 预训练模型 掩蔽重建 噪声学生训练
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部