期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
基于ERNIE+DPCNN+BiGRU的农业新闻文本分类 被引量:5
1
作者 杨森淇 段旭良 +2 位作者 肖展 郎松松 李志勇 《计算机应用》 CSCD 北大核心 2023年第5期1461-1466,共6页
针对农业新闻目前面临的针对性差、分类不清和数据集缺乏等问题,提出一种基于ERNIE(Enhanced Representation through kNowledge IntEgration)、深度金字塔卷积神经网络(DPCNN)和双向门控循环单元(BiGRU)的农业新闻分类模型——EGC。首... 针对农业新闻目前面临的针对性差、分类不清和数据集缺乏等问题,提出一种基于ERNIE(Enhanced Representation through kNowledge IntEgration)、深度金字塔卷积神经网络(DPCNN)和双向门控循环单元(BiGRU)的农业新闻分类模型——EGC。首先利用ERNIE对数据集进行编码,然后利用改进后的DPCNN和BiGRU同时提取新闻文本的特征,再将两者提取的特征进行拼合并经过Softmax得到最终结果。为了使EGC模型适用于农业新闻分类领域,对DPCNN进行改进,减少它的卷积层以保留更多特征。实验结果表明,与ERNIE相比,EGC模型的精确率、召回率和F1分数别提升了1.47、1.29和1.42个百分点,优于传统分类模型。 展开更多
关键词 新闻文本分类 农业工程 ERNIE 深度金字塔卷积神经网络 双向门控循环单元
下载PDF
新闻文本自动分类技术概述 被引量:7
2
作者 刘冬瑶 刘世杰 +2 位作者 陈宇星 张文波 周振 《电脑知识与技术(过刊)》 2017年第12X期87-91,共5页
文本分类是对文本集按照一定的分类体系或标准划分为不同的类别。该文总结了文本分类的基本流程,讨论了中文文本分类的主要特点和常用技术,指出了现今新闻文本分类存在的问题,并对中文文本分类未来的发展前景和研究方向做出展望。
关键词 本预处理 新闻文本分类 机器学习 自然语言处理
下载PDF
基于因子分析朴素贝叶斯方法的新闻文本分类
3
作者 冷婷 叶仁玉 李沅静 《安庆师范大学学报(自然科学版)》 2024年第1期47-51,共5页
新闻文本分类是对网络新闻进行管理的有效途径。朴素贝叶斯方法为新闻文本分类的常用方法,在文本特征维度较高时,该方法的条件独立性假设难以成立,会导致分类效果欠佳。本文提出了因子分析朴素贝叶斯分类模型,并对复旦大学文本语料库中... 新闻文本分类是对网络新闻进行管理的有效途径。朴素贝叶斯方法为新闻文本分类的常用方法,在文本特征维度较高时,该方法的条件独立性假设难以成立,会导致分类效果欠佳。本文提出了因子分析朴素贝叶斯分类模型,并对复旦大学文本语料库中的新闻文本进行分类,同时将结果与朴素贝叶斯、多项Logistic回归模型和决策树方法进行比较。实验结果显示,因子分析朴素贝叶斯模型的分类准确率达84%,效果最优。 展开更多
关键词 朴素贝叶斯 因子分析 新闻文本分类 机器学习
下载PDF
基于AI深度学习的新闻文本分类法研究
4
作者 龚静 郑迪聪 刘现芳 《中国新技术新产品》 2024年第5期18-20,共3页
针对传统机器学习未能考虑局部信息对新闻文本分类的影响以及无法及时捕获长距离特征信息等问题,本文提出了一种基于AI深度学习的新闻文本分类方法。为进一步验证新闻文本分类效果,该方法将径向基函数模型与多层感知层模型结合,并进行... 针对传统机器学习未能考虑局部信息对新闻文本分类的影响以及无法及时捕获长距离特征信息等问题,本文提出了一种基于AI深度学习的新闻文本分类方法。为进一步验证新闻文本分类效果,该方法将径向基函数模型与多层感知层模型结合,并进行深度学习训练,通过样本标记迭代试验进行测试。结果表明,AI深度学习加快了模型训练过程,提升了模型在迭代过程的正确率,降低了漏报率,显著增强了分类效果。 展开更多
关键词 AI深度学习 新闻文本分类 自然语言处理 词向量
下载PDF
基于BERT-BiLSTM-CNN模型的新闻文本分类研究 被引量:2
5
作者 徐建飞 吴跃成 《软件工程》 2023年第6期11-15,共5页
针对双向长短期记忆网络(BiLSTM)没有考虑到局部关键信息对文本分类的影响,以及卷积神经网络(TextCNN)无法捕获文本的长远距离的特征信息等问题,文章提出了一种基于BERT-BiLSTM-CNN混合神经网络模型的新闻文本分类的方法。为了进一步增... 针对双向长短期记忆网络(BiLSTM)没有考虑到局部关键信息对文本分类的影响,以及卷积神经网络(TextCNN)无法捕获文本的长远距离的特征信息等问题,文章提出了一种基于BERT-BiLSTM-CNN混合神经网络模型的新闻文本分类的方法。为了进一步增强文本表示和提高新闻文本分类的效果,首先使用BERT预训练模型对文本进行词嵌入映射,其次利用BiLSTM-CNN模型进一步提取文本上下文和局部关键特征,最后对新闻文本进行分类;并在THUCNews数据上进行对比实验,实验结果表明,BERT-BiLSTM-CNN模型的文本分类效果优于Transformer、TextRNN、TextCNN等深度学习模型。 展开更多
关键词 BERT BiLSTM-CNN 深度学习 新闻文本分类
下载PDF
基于BERT和RNN的新闻文本分类对比 被引量:6
6
作者 林德萍 汪红娟 《北京印刷学院学报》 2021年第11期156-162,共7页
准确且高效地获取对我们有用的信息,解决数据信息过多而带来的数据冗余的问题成为人们越来越关注的问题。近年来国内外研究学者针对不同的自然语言处理任务提出了各种不同的框架,不同的框架具有不同的优缺点。自然语言处理领域中经典的... 准确且高效地获取对我们有用的信息,解决数据信息过多而带来的数据冗余的问题成为人们越来越关注的问题。近年来国内外研究学者针对不同的自然语言处理任务提出了各种不同的框架,不同的框架具有不同的优缺点。自然语言处理领域中经典的问题之一就是文本分类,其中新闻文本分类是我们日常生活中容易引起大家关注的重要任务。该实验基于Transformer框架下的BERT模型对新闻文本数据集进行分类,通过与RNN的长短期记忆网络对同一新闻文本数据集进行了对比,评价指标采用的是模型分类通用的准确率和损失值。实验结果表明BERT模型的分类准确率明显高于长短期记忆网络。 展开更多
关键词 新闻文本分类 LSTM BERT
下载PDF
基于BERT+BiLSTM+Attention的对抗训练新闻文本分类模型 被引量:1
7
作者 汪辉 于瓅 《西安文理学院学报(自然科学版)》 2023年第3期49-53,共5页
新闻文本分类是长文本分类的典型问题,因此提取词与词之间的关系特征就尤为重要.提出了基于双向Transformer编码表示的预训练模型(Bidirectional Encoder Representations from Transformers,BERT)和双向长短时记忆网络(Bi-directional ... 新闻文本分类是长文本分类的典型问题,因此提取词与词之间的关系特征就尤为重要.提出了基于双向Transformer编码表示的预训练模型(Bidirectional Encoder Representations from Transformers,BERT)和双向长短时记忆网络(Bi-directional Long Short-Term Memory,BiLSTM)以及注意力机制的对抗训练分类模型(BBA-AT).将预处理新闻文本数据经过BERT进行训练得到词嵌入编码,在训练后的词向量级别上进行扰动达到数据增广的效果,以此来进行对抗训练,之后通过双向长短时记忆网络对数据集进行编码提取双向语义表征.本文提出的BBA-AT模型F 1值在TNEWS数据集上比BERT模型提升了1.34%. 展开更多
关键词 BiLSTM 新闻文本分类 对抗训练 BERT
下载PDF
机器学习下的新冠疫情新闻文本分类 被引量:1
8
作者 李海艳 王文东 江丛君 《延安大学学报(自然科学版)》 2023年第1期79-82,共4页
针对新冠疫情新闻繁杂及信息类别不明等问题,采取新冠疫情新闻语料作为数据集,分别利用TF-IDF与Word2vec提取特征值,与支持向量机、朴素贝叶斯等基于机器学习的模型结合对文本进行分类,并与TextCNN及BiLSTM 2种深度学习模型的分类实验... 针对新冠疫情新闻繁杂及信息类别不明等问题,采取新冠疫情新闻语料作为数据集,分别利用TF-IDF与Word2vec提取特征值,与支持向量机、朴素贝叶斯等基于机器学习的模型结合对文本进行分类,并与TextCNN及BiLSTM 2种深度学习模型的分类实验结果进行对比分析。实验结果表明:同等条件下,基于新冠疫情主题新闻数据集,SVM+TF-IDF模型在几种分类器中效果最好,精确度达到84%,F1值达到83%。 展开更多
关键词 新闻文本分类 机器学习 TF-IDF 支持向量机
下载PDF
基于加权Word2Vec和TextCNN的新闻文本分类 被引量:1
9
作者 廖运春 舒坚 《长江信息通信》 2022年第9期32-35,共4页
随着网络和各类社交媒体的盛行,越来越多的文本信息通过互联网呈现在人们面前。对于海量的文本数据,自然语言处理技术变得越来越实用,新闻文本分类便是其中一项重要的任务,其对制定新闻检索策略、新闻推荐、社会舆情监控等具有积极作用... 随着网络和各类社交媒体的盛行,越来越多的文本信息通过互联网呈现在人们面前。对于海量的文本数据,自然语言处理技术变得越来越实用,新闻文本分类便是其中一项重要的任务,其对制定新闻检索策略、新闻推荐、社会舆情监控等具有积极作用。文章通过分析文本表示模型与分类模型的研究现状,提出一种基于加权Word2Vec和TextCNN的新闻文本分类方法,在新闻文本多分类数据上进行实验。从实验结果上来看,在文本表示模型中,该文方法比TF-IDF模型、Word2Vec模型以及随机词嵌入模型在精确率、召回率和F1值上均有提高;在文本分类模型中,文章使用的TextCNN模型要比传统的机器学习模型以及循环神经网络模型在分类效果以及模型性能方面表现更出色。 展开更多
关键词 新闻文本分类 自然语言处理 本表示 文本分类
下载PDF
基于机器学习的新闻文本分类研究 被引量:2
10
作者 李秀秀 陈海山 《电脑编程技巧与维护》 2021年第12期132-135,共4页
利用Python语言对5000条新闻数据进行了文本分类。通过词频和TF-IDF统计量构建特征向量,通过精准率和召回率对比前后2种特征提取算法的分类效果,通过逻辑回归、朴素贝叶斯和支持向量机进行分类结果对比,结果表明:对于目标新闻文本,在同... 利用Python语言对5000条新闻数据进行了文本分类。通过词频和TF-IDF统计量构建特征向量,通过精准率和召回率对比前后2种特征提取算法的分类效果,通过逻辑回归、朴素贝叶斯和支持向量机进行分类结果对比,结果表明:对于目标新闻文本,在同等条件下,使用TF-IDF构建词向量模型的精准率和召回率比使用词频词袋模型分别高出0.013和0.012个百分点。在使用TF-IDF特征的基础上,朴素贝叶斯、逻辑回归和支持向量机算法的准确率是依次上升的,其中支持向量机的精度最好。 展开更多
关键词 新闻文本分类 TF-IDF特征 逻辑回归 朴素贝叶斯 支持向量机
下载PDF
基于辅助任务的BERT中文新闻文本分类研究
11
作者 崔建青 仇测皓 《软件工程》 2022年第6期4-8,共5页
新闻文本分类是自然语言处理领域中一项重要任务,本文使用新闻标题进行文本分类。随着BERT预训练模型的崛起,BERT模型在多项NLP(Natural Language Processing)任务中都取得了较好的效果,并应用在新闻分类任务中。为了提高新闻分类这一... 新闻文本分类是自然语言处理领域中一项重要任务,本文使用新闻标题进行文本分类。随着BERT预训练模型的崛起,BERT模型在多项NLP(Natural Language Processing)任务中都取得了较好的效果,并应用在新闻分类任务中。为了提高新闻分类这一主要任务的效果,本文引入辅助任务判断两个新闻是否是同类新闻,对BERT预训练模型在辅助任务和主要任务上进行微调。在THUCNews数据集上进行实验,实验结果表明,引入辅助任务的BERT新闻分类模型在效果上优于原BERT模型。 展开更多
关键词 新闻文本分类 BERT 辅助任务
下载PDF
基于图卷积网络的藏文新闻文本分类 被引量:4
12
作者 胥桂仙 张子欣 +2 位作者 于绍娜 董玉双 田媛 《数据分析与知识发现》 CSCD 北大核心 2023年第6期73-85,共13页
【目的】针对藏文预训练知识缺少的现状,利用藏文音节和文档的构造关系,提出基于图卷积网络的藏文新闻文本分类方法。【方法】基于音节-音节关系和音节-文档关系为藏文新闻语料库构建文本图,然后使用音节和文档的独热表示进行初始化,在... 【目的】针对藏文预训练知识缺少的现状,利用藏文音节和文档的构造关系,提出基于图卷积网络的藏文新闻文本分类方法。【方法】基于音节-音节关系和音节-文档关系为藏文新闻语料库构建文本图,然后使用音节和文档的独热表示进行初始化,在训练集文档类别标签的监督下,使用图卷积网络联合学习音节和文档的嵌入,最后将文本分类问题转化为节点分类问题。【结果】图卷积网络在藏文新闻正文文本分类任务上准确率达到70.44%,相比于基线模型高出8.96~20.66个百分点;在藏文新闻标题文本上准确率达到61.94%,比基线模型高出6.61~26.05个百分点。同时,图卷积网络相比引入预训练音节嵌入的SVM、CNN和少数民族语言预训练模型CINO在准确率上高出0.73~15.1个百分点,在正文上的准确率相比Word2Vec+LSTM方法高出15.65个百分点。【局限】仍依赖于有标注数据集,但藏文的有监督文本相对稀缺。【结论】图卷积网络在藏文新闻文本分类任务上具有有效性,能够解决藏文新闻文本信息杂乱的问题,有助于对各类别藏文新闻文本数据进行挖掘。 展开更多
关键词 图卷积网络 新闻文本分类 本图 节点分
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部