期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
水利工程文本中抢险实体和关系的智能分析与提取 被引量:4
1
作者 杨阳蕊 朱亚萍 +2 位作者 刘雪梅 陈思思 李慧敏 《水利学报》 EI CSCD 北大核心 2023年第7期818-828,共11页
水利工程抢险措施是防汛应急预案的重要组成部分。本文旨在运用信息抽取技术从各种无结构文本源中抽取出水利工程抢险知识,并将其转化为〈实体,关系,实体〉三元组结构,为应急预案智能生成提供结构化知识支撑。本文将异构的水利工程抢险... 水利工程抢险措施是防汛应急预案的重要组成部分。本文旨在运用信息抽取技术从各种无结构文本源中抽取出水利工程抢险知识,并将其转化为〈实体,关系,实体〉三元组结构,为应急预案智能生成提供结构化知识支撑。本文将异构的水利工程抢险实体抽取和关系抽取视为从序列到序列的生成任务,并提出了基于大型预训练语言模型(T5)的水利工程抢险实体和关系联合抽取框架(Water Project Rescue Entities and Relationships Joint Extraction,WRERJE)。WRERJE是同时进行实体抽取和关系抽取的多任务框架,该框架使用动态提示引导T5进行实体和关系的联合抽取。研究特定于水利工程抢险领域的文本数据增强方法,在使用少量标注样本对WRERJE进行初步微调的基础上,通过数据增强方法获得更多描述模糊但标注正确的数据进一步微调WRERJE,提高了其对水利工程抢险实体和关系抽取的性能。通过实验对WRERJE性能进行评估,结果表明在水利工程抢险实体和关系联合抽取任务上,WRERJE表现出了较高的抽取性能(实体和关系抽取F1值分别达到78.42%、78.22%),验证了动态提示和联合抽取方法的有效性。 展开更多
关键词 水利工程抢险 应急预案 信息抽取 动态提示 联合抽取 文本数据增强
下载PDF
融合非核心词EDA和SSMix的雷达故障文本分类方法
2
作者 谢雨希 杨江平 +1 位作者 孙知建 胡欣 《火力与指挥控制》 CSCD 北大核心 2024年第4期136-141,共6页
对雷达装备故障文本进行智能化分类,有助于提高雷达装备保障效率。针对雷达故障文本专业性强,样本量小且不平衡的问题,通过非核心词EDA进行类内数据增强,以实现在增加文本量的同时保持关键信息不变。针对非核心词EDA方法产生的新样本多... 对雷达装备故障文本进行智能化分类,有助于提高雷达装备保障效率。针对雷达故障文本专业性强,样本量小且不平衡的问题,通过非核心词EDA进行类内数据增强,以实现在增加文本量的同时保持关键信息不变。针对非核心词EDA方法产生的新样本多样性不够的问题,增加SSMix(saliency-based span mixup for text classification),进行类间数据增强,通过对输入文本非线性的交叉融合来提升文本的多样性。实验证明,与现有的经典基线分类方法和典型数据增强分类方法相比,该方法在准确率上有较大幅度的提升。 展开更多
关键词 雷达故障文本 非核心词EDA SSMix 文本数据增强 分类
下载PDF
基于文本数据增强的中文水稻育种问句命名实体识别
3
作者 牛培宇 侯琛 《农业机械学报》 EI CAS CSCD 北大核心 2024年第8期333-343,共11页
针对现有水稻育种问答系统存在数据管理水平低、知识粒度大,水稻育种领域缺乏用于命名实体识别的标注数据、人工标注成本高等问题,提出了一种基于文本数据增强的方法来识别水稻育种问句的命名实体,通过构建水稻育种知识图谱,对水稻育种... 针对现有水稻育种问答系统存在数据管理水平低、知识粒度大,水稻育种领域缺乏用于命名实体识别的标注数据、人工标注成本高等问题,提出了一种基于文本数据增强的方法来识别水稻育种问句的命名实体,通过构建水稻育种知识图谱,对水稻育种问句中的大类命名实体进行分类,从而增强实体边界,降低知识粒度。针对水稻育种数据标注成本高导致命名实体识别性能不佳的难点,通过在BERT-BILSTM-CRF模型中引入数据增强层,提出了DA-BERT-BILSTM-CRF模型。实验以标注的水稻育种问句为训练数据,将所提出的模型与其他基线模型进行比较。结果表明,本文方法在水稻育种问句中命名实体识别的单类别识别任务和整体识别任务上均优于其他方法,其中单类别识别精确率达到94.26%,F1值达到93.32%;整体识别精确率达到93.86%,F1值达到93.34%。 展开更多
关键词 水稻育种 问答系统 命名实体识别 文本数据增强 知识图谱
下载PDF
基于数据增强和深度学习的水电站告警事件诊断 被引量:3
4
作者 孙国强 章逸舟 +4 位作者 唐杰阳 唐凡 卫志农 臧海祥 杨东 《电力自动化设备》 EI CSCD 北大核心 2023年第8期88-95,共8页
针对水电告警事件传统诊断方法存在效率低下、准确率不足等缺陷,设计了一种融合先验知识的数据增强方法和基于双向简单循环单元网络的层级注意力深度学习框架。针对水电告警规则不完善的问题,采用隐含狄利克雷分布-序列推理增强模型构... 针对水电告警事件传统诊断方法存在效率低下、准确率不足等缺陷,设计了一种融合先验知识的数据增强方法和基于双向简单循环单元网络的层级注意力深度学习框架。针对水电告警规则不完善的问题,采用隐含狄利克雷分布-序列推理增强模型构建告警信号与告警特征间的映射机制;结合该水电告警先验知识提出改进隐含狄利克雷分布方法增强样本数据,最终由层级注意力模型学习样本特征并输出诊断结果。测试算例为某水电集控中心的实际告警数据,测试结果表明,所提方法可在低资源训练环境下实现快速和高准确率的水电告警事件诊断。 展开更多
关键词 水电站告警事件 文本数据增强 注意力机制 深度学习 先验知识
下载PDF
面向中文命名实体识别任务的数据增强 被引量:4
5
作者 李健 张克亮 +2 位作者 唐亮 夏榕璟 任静静 《计算机与现代化》 2022年第4期1-6,11,共7页
在低资源自然语言处理(NLP)任务中,现有的数据不足以训练一个理想的深度学习模型,文本数据增强是提高此类任务训练效果的有效方法。针对中文命名实体识别任务,提出一组基于实例替换的数据增强方法。将训练样本中的命名实体替换为另一个... 在低资源自然语言处理(NLP)任务中,现有的数据不足以训练一个理想的深度学习模型,文本数据增强是提高此类任务训练效果的有效方法。针对中文命名实体识别任务,提出一组基于实例替换的数据增强方法。将训练样本中的命名实体替换为另一个同类实体而保持标签不变,具体算法包括:1)实体之间交叉互换;2)实体内部同义替换;3)中文人名自动生成。分别在PeopleDailyNER和CLUENER2020数据集上应用上述方法,并对BERT+CRF模型进行增强训练。实验结果表明,仅添加与原始数据等量的增强数据,在小样本条件下能使模型F1值在2个数据集上分别提升约10%和7%,随着样本数据的增加,训练效果仍有明显提升。 展开更多
关键词 深度学习 文本数据增强 命名实体识别 实例交叉 中文人名生成器
下载PDF
基于EDA和回译的导游投诉文本混合增强方法 被引量:2
6
作者 余佳雨 李响 +3 位作者 詹瑾瑜 江维 曹扬 杨瑞 《计算机技术与发展》 2021年第3期21-26,共6页
近年来,使用机器学习算法从导游投诉文本数据中识别出导游违规行为,辅助旅游监管人员工作,为旅游监管提供依据,成为一个必然趋势。然而导游投诉文本存在着语料单一、难以获取等困难,如何对这些导游投诉文本进行文本增强以满足导游违规... 近年来,使用机器学习算法从导游投诉文本数据中识别出导游违规行为,辅助旅游监管人员工作,为旅游监管提供依据,成为一个必然趋势。然而导游投诉文本存在着语料单一、难以获取等困难,如何对这些导游投诉文本进行文本增强以满足导游违规行为识别需要,是一个迫切需要解决的问题。针对这一问题,提出了一种基于EDA(easy data augmentation)和回译的导游投诉文本混合增强方法。从EDA和回译两个角度对导游投诉文本进行增强,将两种方法返回的增强投诉语料进行混合,得到最终的增强文本;并将该方法在实际的导游违规行为识别系统中进行了应用与验证。通过大量实验对该方法与传统的EDA文本增强方法、回译文本增强方法进行了分析与对比,实验数据表明,基于EDA和回译的导游投诉文本混合增强方法相对于其他两种传统文本增强方法具有更高的准确率和更优秀的文本增强效果,应用在实际的导游违规行为识别系统中得到了87.54%的准确率,相比原始数据集准确率提升了7.4%。 展开更多
关键词 导游违规行为识别 文本增强 EDA 回译 混合增强
下载PDF
针对在线教育情感分析的数据扩充研究
7
作者 黄伟强 刘海 +1 位作者 梁韬文 杨海华 《网络安全与数据治理》 2022年第7期93-100,共8页
在互联网上大量主观性的评论具有丰富的研究价值,可以通过对评论的分析获取评论的情感极性。在对大量评论进行情感分析时,存在时间和人力消耗过多等问题,针对该问题,提出了基于聚类分析的文本数据扩充方法:在对少量关键数据进行标注的... 在互联网上大量主观性的评论具有丰富的研究价值,可以通过对评论的分析获取评论的情感极性。在对大量评论进行情感分析时,存在时间和人力消耗过多等问题,针对该问题,提出了基于聚类分析的文本数据扩充方法:在对少量关键数据进行标注的基础上,通过聚类分析标注大量数据,以减少情感分析在实际应用中的成本。以在线教育平台的评论为例,对目前多个主流在线教育平台上爬取的共569970条中文评论数据进行少量标注,然后使用该方法进行数据扩充,最后基于目前多个主流机器学习模型和卷积神经网络模型进行情感分析训练。研究结果表明,数据处理经过聚类后取得较好的数据扩充效果,其中采用卷积神经网络模型进行的情感分析,准确度可以达到96.5%。 展开更多
关键词 数据扩充 情感分析 自然语言处理 聚类分析
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部