期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
大数据环境下政务数据的情报价值及其利用研究——以海关报关商品归类风险规避为例 被引量:11
1
作者 王昊 邓三鸿 +2 位作者 朱立平 王鑫芸 范涛 《科技情报研究》 2020年第4期74-89,共16页
[目的/意义]为充分挖掘大数据环境下政务数据中的情报价值,文章以海关报关商品自动归类研究为例,探讨经过长时间积累的大规模数据在数据自动处理和分析中的典型应用,从而有效体现数据的情报价值。[方法/过程]提取积累的政务数据中的报... [目的/意义]为充分挖掘大数据环境下政务数据中的情报价值,文章以海关报关商品自动归类研究为例,探讨经过长时间积累的大规模数据在数据自动处理和分析中的典型应用,从而有效体现数据的情报价值。[方法/过程]提取积累的政务数据中的报关商品及其类目的相关特征信息,进而采用深度学习方法对其进行建模和训练,最终利用机器学习获得情报,实现对未知类目报关商品的自动分类,达到风险规避的目的。[结果/结论]文章首先对不同的深度学习文本分类模型进行比较,在对得到的情报进行分析后,选择构建加入Attention机制的TextRNN模型。实验结果表明,该模型表现最优,能够较好的对海关报关商品进行归类,进而规避风险,并能更加充分挖掘海关报关数据中的情报价值。[局限]实验中对于报关商品特征的讨论有限,选取特征时仅参考了历史研究、专家意见与相关性值,其他有效特征可能被过滤,存在一定的局限性。 展开更多
关键词 政务数据 风险判别 文本分类 textrnn 报送商品 情报价值 HS编码
下载PDF
面向SDH光传输系统告警排查的领域知识图谱构建方法 被引量:1
2
作者 高德荃 刘广旭 +2 位作者 冯宝 赵子岩 张媛 《电力信息与通信技术》 2023年第9期60-66,共7页
SDH光传输系统是支撑大电网安全运行的关键电力通信设施,当前对于实时严重告警的排查主要依赖通信调度人员的经验开展关联分析,该模式存在排查速度慢、业务协同差等不足。为了解决以上问题,提出了一种面向SDH光传输系统告警的领域知识... SDH光传输系统是支撑大电网安全运行的关键电力通信设施,当前对于实时严重告警的排查主要依赖通信调度人员的经验开展关联分析,该模式存在排查速度慢、业务协同差等不足。为了解决以上问题,提出了一种面向SDH光传输系统告警的领域知识图谱构建方法。针对告警文本中实体嵌套和边界难以确定的问题,构建BERT+Bi-LSTM+CNN模型进行命名实体识别。采用Multi-Attention+TextRNN模型进行关系抽取,并基于GCN+Self-Attention进行知识图谱融合。以某线路的通信设备告警文本为实验对象,采用所提出的方法进行知识抽取和融合,实体识别准确率达到91.42%,知识融合的hits@1能达到38.1%,验证了针对SDH光传输系统告警场景的领域知识图谱构建方法的有效性。 展开更多
关键词 SDH光传输系统 告警排查 知识抽取 知识融合 BERT textrnn
下载PDF
基于TextRNN与TextCNN的情感分类对比研究 被引量:3
3
作者 付甜甜 刘海忠 《科学技术创新》 2022年第30期69-72,共4页
在进行文本情感分类任务时,针对任务和数据特点选取合适的深度学习主体算法十分关键。为解决此问题,探讨TextRNN与TextCNN这两种情感分类算法的适用场景,对比其优势和不同,为主层算法选择提供参考。同时对TextRNN的单向和双向选择问题,T... 在进行文本情感分类任务时,针对任务和数据特点选取合适的深度学习主体算法十分关键。为解决此问题,探讨TextRNN与TextCNN这两种情感分类算法的适用场景,对比其优势和不同,为主层算法选择提供参考。同时对TextRNN的单向和双向选择问题,TextCNN卷积核类型的选择问题进行讨论,并在IMDB数据集上进行实验比较。结果表明,TextRNN采用双向特征提取时分类准确率更高,TextCNN选取多尺度卷积核组合来提取特征会有更好的表现效果。与此同时TextCNN比TextRNN拥有更高的准确率和更强的鲁棒性。与常用的三种机器学习算法LR、SVM、NB相比较,这两种深度学习算法的分类结果比机器学习算法的最好结果高出10%左右。 展开更多
关键词 textrnn TextCNN 情感分类
下载PDF
多层次文本分类法的模型构建及实验分析——以进出口商品归类问题为例 被引量:3
4
作者 朱立平 张紫玄 +2 位作者 邓三鸿 赵梓博 王昊 《情报科学》 CSSCI 北大核心 2021年第10期178-184,共7页
【目的/意义】政府机构的数据规模在数字时代得到了空前的增长,这也为多类目政务数据的自动化处理工作带来了挑战。在此背景下,本文通过引入多层次文本分类方法,对进出口商品的自动归类问题进行了探索。【方法/过程】基于HS编码的层次结... 【目的/意义】政府机构的数据规模在数字时代得到了空前的增长,这也为多类目政务数据的自动化处理工作带来了挑战。在此背景下,本文通过引入多层次文本分类方法,对进出口商品的自动归类问题进行了探索。【方法/过程】基于HS编码的层次结构,构建了一个包含三个层次的分类模型,通过逐层判别进而累加的方式进行文本分类;同时,对SVM与TextRNN等算法的分类效果进行了对比。【结果/结论】多层次分类模型对于解决商品归类问题的总体效果较好;在数据充分的情况下,TextRNN比SVM的效果相对较好(第1层93.00%>92.90%,第2层96.46%>96.38%),而在学习不充分的环境下,SVM具有较大优势(第3层92.49%<95.92%);SVM取得了85.88%的最佳叠加正确率。【创新/局限】本研究尝试基于多层次分类方法解决商品自动归类问题,但数据规模及应用场景仍有待拓展。 展开更多
关键词 层次分类 文本分类 机器学习 SVM 深度学习 textrnn
原文传递
基于TextRNN的医疗导诊模型设计 被引量:1
5
作者 叶郅弈 蔡莉莉 《电脑知识与技术》 2023年第31期82-84,共3页
随着经济的发展和生活水平的提高,人们对自身健康的需求日益关注。长期压力及不健康的生活习惯使得亚健康人群比例连年攀升。当身体出现某些不适症状时,人们迫切想要了解症状对应的疾病原因,以便尽快就医。为方便人们的线上导诊,该文提... 随着经济的发展和生活水平的提高,人们对自身健康的需求日益关注。长期压力及不健康的生活习惯使得亚健康人群比例连年攀升。当身体出现某些不适症状时,人们迫切想要了解症状对应的疾病原因,以便尽快就医。为方便人们的线上导诊,该文提出基于TextRNN的医疗导诊设计,使用预训练模型将患者的自述病情逐词映射为词向量并输入模型,通过双向长短时记忆网络提取病情中的特征并学习,预测出患者需要就诊的科室,实现了智能导诊的功能。 展开更多
关键词 智能医疗导诊 textrnn 双向长短时记忆网络 特征学习
下载PDF
多标签文本分类模型对比研究 被引量:3
6
作者 姜炎宏 迟呈英 战学刚 《辽宁科技大学学报》 CAS 2020年第2期146-153,160,共9页
为了有效地管理和利用网络文本信息,实现文本内容自动标签标注,提出采用多种深度学习模型对多标签文本分类进行研究。采用神经网络词向量模型word2vec获取文本数据的语义特征。对循环神经网络和卷积神经网络进行模型融合,引入注意力机制... 为了有效地管理和利用网络文本信息,实现文本内容自动标签标注,提出采用多种深度学习模型对多标签文本分类进行研究。采用神经网络词向量模型word2vec获取文本数据的语义特征。对循环神经网络和卷积神经网络进行模型融合,引入注意力机制,形成TextRCNN_Attention神经网络模型。实验结果表明,TextRCNN_Attention模型结构融合了循环神经网络和卷积神经网络模型的优点,能更好地理解语义信息。Attention机制对文本特征提取更加合理,使模型将注意力聚焦在对文本分类任务贡献分值较大的特征上,分类效果更好。 展开更多
关键词 多标签文本 文本循环神经网络 文本卷积神经网络 注意力机制
下载PDF
智能问诊中基于深度神经网络的反问生成方法 被引量:4
7
作者 杜曾贞 唐东昕 解丹 《计算机应用》 CSCD 北大核心 2022年第3期867-873,共7页
在智能问诊中,为了让医生快速提出合理的反问以提高医患对话效率,提出了基于深度神经网络的反问生成方法。首先获取大量医患对话文本并进行标注;然后使用文本循环神经网络(TextRNN)、文本卷积神经网络(TextCNN)二种分类模型分别对医生... 在智能问诊中,为了让医生快速提出合理的反问以提高医患对话效率,提出了基于深度神经网络的反问生成方法。首先获取大量医患对话文本并进行标注;然后使用文本循环神经网络(TextRNN)、文本卷积神经网络(TextCNN)二种分类模型分别对医生的陈述进行分类;再利用双向文本循环神经网络(TextRNN-B)、双向变形编码器(BERT)分类模型进行问题触发;设计六种不同的问答选取方式来模拟医疗咨询领域情景,采用开源神经机器翻译(OpenNMT)模型进行反问生成;最后对已生成的反问进行综合评估。实验结果表明,使用TextRNN进行分类优于TextCNN,利用BERT模型进行问题触发优于TextRNN-B,采用OpenNMT模型在Window-top方式下实现反问生成时,使用双语评估替补(BLEU)和困惑度(PPL)指标进行评价的结果最好。所提方法验证了深度神经网络技术在反问生成中的有效性,可以有效解决智能问诊中医生反问生成的问题。 展开更多
关键词 智能问诊 反问生成 文本循环神经网络 双向变形编码器 开源神经机器翻译
下载PDF
基于文本分类技术的中文纯文本聊天记录敏感词汇隐晦语义表达检测技术研究
8
作者 艾耕帆 《中国科技期刊数据库 工业A》 2023年第4期5-9,共5页
针对中文纯文本聊天记录中可能存在的敏感词汇隐晦语义表达信息,本文提出的BERT-TextCNN-TextRNN模型充分地结合了BERT预训练模型、TextCNN模型与TextRNN模型三者的优势。BERT-TextCNN-TextRNN模型既可以很好地提取中文纯文本聊天记录... 针对中文纯文本聊天记录中可能存在的敏感词汇隐晦语义表达信息,本文提出的BERT-TextCNN-TextRNN模型充分地结合了BERT预训练模型、TextCNN模型与TextRNN模型三者的优势。BERT-TextCNN-TextRNN模型既可以很好地提取中文纯文本聊天记录中词汇与词汇之间的短距离局部关系特征,同时又能够很好地获取聊天记录文段中句子与句子之间的长距离全局关系特征与依赖信息,使得模型对中文纯文本聊天记录中可能存在的敏感词汇隐晦语义表达特征信息了解得更为充分而完善。 展开更多
关键词 敏感词汇隐晦语义表达 中文纯文本聊天记录 文本分类 BERT-TextCNN-textrnn模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部