期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
网络文本数据搜索引擎与搜索技术 被引量:3
1
作者 李勇 《情报理论与实践》 CSSCI 北大核心 2001年第4期298-300,共3页
This paper describes the functions,characteristics and operating principles of search engines based on Web text,and the searching and data mining technologies for Web-based text information.Methods of computer-aided t... This paper describes the functions,characteristics and operating principles of search engines based on Web text,and the searching and data mining technologies for Web-based text information.Methods of computer-aided text clustering and abstacting are also given.Finally,it gives some guidelines for the assessment of searching quality. 展开更多
关键词 网络本数据搜索引擎 搜索技术 文本分类算法 本质量 查询质量
下载PDF
基于SVM和KNN算法的科技文献自动分类研究 被引量:10
2
作者 白小明 邱桃荣 《微计算机信息》 北大核心 2006年第12X期275-276,65,共3页
本文着重对SVM和KNN分类法进行分析,并结合实际的文档集测试了SVM和KNN分类法的性能,给出了实验数据。
关键词 文本分类算法 SVM KNN 本自动分系统
下载PDF
基于TextCNN模型的文本意图识别算法改进研究 被引量:3
3
作者 窦乔 吕博文 +3 位作者 汪洲 邵锦依 郑懿 钟毅 《武汉理工大学学报》 CAS 2023年第8期133-139,共7页
文本分类算法常被用于自然语言处理领域,该算法可帮助系统理解用户输入的文本,准确判断用户的意图或需求,以便提供相应的回答或服务。作者在TextCNN文本分类模型的基础上融入情绪信息、词向量以及语句特征,提出一种新的意图识别模型emoB... 文本分类算法常被用于自然语言处理领域,该算法可帮助系统理解用户输入的文本,准确判断用户的意图或需求,以便提供相应的回答或服务。作者在TextCNN文本分类模型的基础上融入情绪信息、词向量以及语句特征,提出一种新的意图识别模型emoBERT-TextCNN,该模型可增强意图分析与预测的准确性。以汽车行业和电子消费品两个独立数据集为例,将此模型与其他多种分类模型进行对比实验,实验结果表明文中所提出的分类模型,意图预测精确率均在80%以上,与不包含情绪信息的分类模型相比,其F1值分别提升了1.54%和1.03%,证明该模型能有效提高文本分类的准确性,且融入情绪信息能加强意图识别的强度。 展开更多
关键词 人工智能 自然语言处理 文本分类算法 意图识别技术 特征增强
原文传递
《计算机工程与设计》2019年第40卷总目次
4
《计算机工程与设计》 北大核心 2019年第12期I0001-I0015,共15页
关键词 卷积神经网络 组稀疏表示 文本分类算法 多特征融合 特征选择方法 图像分割算法 人脸超分辨率 核相关滤波 目标检测算法 吕学强 人体动作识别 网络入侵检测 命名实体识别 提取算法 离群点检测 残差网络 快速匹配算法 《计算机工程与设计》
下载PDF
粗糙集理论在文本分类算法中的应用
5
作者 王珍珍 《重庆科技学院学报(自然科学版)》 CAS 2009年第4期166-168,共3页
文本分类常采用的算法一般是基于向量比较的分类技术。文本中关键字较多,形成的特征向量维数相当高,因而会导致分类比较处理的运算量太大,而降低维数后又会不可避免地丢失有用信息。将粗糙集理论应用于分类处理过程中可有效地解决此问题。
关键词 文本分类 粗糙集 约简 文本分类算法
下载PDF
话题检测与跟踪任务中的话题跟踪研究
6
作者 张海川 李胜东 +2 位作者 石俊涛 吴建伟 王元 《信息与电脑》 2022年第11期151-153,共3页
话题检测与跟踪(Topic Detection and Tracking,TDT)任务是对互联网热门话题和敏感话题进行信息处理,受到了研究者的广泛关注。其中,它的子任务之一是话题跟踪任务,即跟踪热门话题和敏感话题。话题跟踪任务的关键技术是话题/报道表示模... 话题检测与跟踪(Topic Detection and Tracking,TDT)任务是对互联网热门话题和敏感话题进行信息处理,受到了研究者的广泛关注。其中,它的子任务之一是话题跟踪任务,即跟踪热门话题和敏感话题。话题跟踪任务的关键技术是话题/报道表示模型和文本分类算法。因此,本文主要研究话题跟踪关键技术,分析关键技术的优缺点,并采用话题/报道表示模型表示话题和报道,同时利用文本分类算法判断报道与话题的相关性以跟踪同类话题,采用话题检测与跟踪评测方法评估话题跟踪结果,设计通用的话题跟踪系统。研究结果表明,该系统具有良好的应用前景。 展开更多
关键词 话题跟踪 文本分类算法 话题检测与跟踪(TDT)
下载PDF
基于最大熵的文本分类算法的改进
7
作者 贺兴时 杨成成 《西安石油大学学报(自然科学版)》 CAS 北大核心 2009年第6期77-79,共3页
基于最大熵模型的文本分类算法对不同测试文档的训练结果相差较大.利用Boosting机制改进基于最大熵模型的分类算法,以提高该分类算法的稳定性.实验结果表明,该改进方法可以有效改善基于最大熵模型分类算法的稳定性,且分类精度也有一定... 基于最大熵模型的文本分类算法对不同测试文档的训练结果相差较大.利用Boosting机制改进基于最大熵模型的分类算法,以提高该分类算法的稳定性.实验结果表明,该改进方法可以有效改善基于最大熵模型分类算法的稳定性,且分类精度也有一定的提高. 展开更多
关键词 文本分类算法 最大熵模型 BOOSTING算法 稳定性
下载PDF
计算机科学2011年第38卷总目次
8
《计算机科学》 CSCD 北大核心 2011年第12期297-305,共9页
关键词 算法研究 语义标注 分层抽象模型 彩色图像 人脸识别 计算机科学 粗糙集理论 无线传感器网络 自动图像标注 文本分类算法 目次
下载PDF
一种基于Agent-NB的文本分类模型和算法
9
作者 胡春娜 刘显德 郝兴 《哈尔滨商业大学学报(自然科学版)》 CAS 2011年第1期103-106,共4页
针对基于内容的文本分类问题,提出了一种Agent与朴素贝叶斯分类(Naive Bayes)相融合的反馈分类模型和算法(Agent-NB).朴素贝叶斯分类是一种简单而有效的文本分类方法,然而有限大小的训练样本集,一般不具备良好的数据完备性,难以一次性... 针对基于内容的文本分类问题,提出了一种Agent与朴素贝叶斯分类(Naive Bayes)相融合的反馈分类模型和算法(Agent-NB).朴素贝叶斯分类是一种简单而有效的文本分类方法,然而有限大小的训练样本集,一般不具备良好的数据完备性,难以一次性构造出高性能的分类模型.基于Agent-NB的反馈分类模型,可结合Agent的智能特性,通过反馈学习过程,动态调整相应参数,使朴素贝叶斯分类模型不断逼近其理想模型,从而提高分类器的性能.实验结果表明,提出的Agent-NB分类方法,分类效果明显增强,召回率、准确率和F1值与朴素贝叶斯分类算法相比有一定提高. 展开更多
关键词 朴素贝叶斯分 Agent-NB 文本分类算法
下载PDF
基于特征相关的改进加权朴素贝叶斯分类算法 被引量:30
10
作者 饶丽丽 刘雄辉 张东站 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2012年第4期682-685,共4页
朴素贝叶斯分类算法的特征项间强独立性的假设在现实中是很难满足的.为了在一定程度上放松这一假设,提出了基于特征相关的改进加权朴素贝叶斯分类算法,该算法采用一种新的权重计算方法,这种权重计算方法是在传统词频-反文档频率(TF-IDF... 朴素贝叶斯分类算法的特征项间强独立性的假设在现实中是很难满足的.为了在一定程度上放松这一假设,提出了基于特征相关的改进加权朴素贝叶斯分类算法,该算法采用一种新的权重计算方法,这种权重计算方法是在传统词频-反文档频率(TF-IDF)权重计算基础上,考虑到特征项在类内和类间的分布情况,另外还结合特征项间的相关度,调整权重计算值,加大最能代表所属类的特征项的权重,将它称之为TF-IDF-FC权重计算.与基于传统TF-IDF权重的加权朴素贝叶斯分类算法和其他常用加权朴素贝叶斯分类算法比较,如基于属性加权的朴素贝叶斯分类算法,这种算法的分类效果均有一定的提高. 展开更多
关键词 朴素贝叶斯文本分类 加权朴素贝叶斯文本分类算法 TF—IDF权重 特征项间的相关度
下载PDF
一种模仿人类的自动文本分类算法 被引量:5
11
作者 王树梅 戴保存 +1 位作者 黄河燕 陈肇雄 《计算机科学》 CSCD 北大核心 2003年第3期44-45,53,共3页
An algorithm of text classification is given that imitates human's in this paper. On one hand, the algorithmenhances weight of theme when feature vector is processed, because of the assumption that the title of a ... An algorithm of text classification is given that imitates human's in this paper. On one hand, the algorithmenhances weight of theme when feature vector is processed, because of the assumption that the title of a document canproject its content. On the other hand,a weight parameter o vector is designed to simulate human's skimming andskipping behavior for calculating method of a document cluster center, and a weight of the feature that there are morepositive examples than negative ones is enhanced . The experiment shows that the algorithm greatly improves the per-formance of a text classification system. 展开更多
关键词 自动文本分类算法 本信息处理 档分 自然语言处理 INTERNET
下载PDF
基于大数据的桥梁监测信息分类技术研究 被引量:7
12
作者 梅文涵 杨建喜 《科技创业月刊》 2015年第5期95-98,共4页
针对桥梁健康监测获取海量数据却无法实时精确地监测评估桥梁结构状态的困难性,本立足数据挖掘算法理论,在Hadoop平台下运用KNN文本分类算法对桥梁结构缩尺模型加速度数据进行分类分析,采用分布式文件系统HDFS对监测数据进行存储和访问... 针对桥梁健康监测获取海量数据却无法实时精确地监测评估桥梁结构状态的困难性,本立足数据挖掘算法理论,在Hadoop平台下运用KNN文本分类算法对桥梁结构缩尺模型加速度数据进行分类分析,采用分布式文件系统HDFS对监测数据进行存储和访问,应用Map/Reduce并行计算框架对桥梁各环境参数进行计算,并据此判断监测点属于何种工况,实现了桥梁监测海量数据的存储、访问、分类以及桥梁结构健康状况的判别,通过实验室缩尺模型工程实例验证了理论的有效性。实验结果表明,与传统的串行分类算法相比,基于Hadoop平台的并行分类算法具有较好的扩展性,并取得了基于大数据理论的桥梁监测技术研究的革新。 展开更多
关键词 HADOOP平台 大数据 KNN文本分类算法 HDFS
下载PDF
融合文本分类算法的皮肤病辅助诊疗模型
13
作者 凌天 诸佳珍 +1 位作者 焦阳 李露芳 《中国医学物理学杂志》 CSCD 2024年第8期1046-1052,共7页
针对当前皮肤病辅助诊断中生物医学特征建模规模较小且耗费巨大人工成本,而患者疾病特征的时间序列同样无法准确描述等难点,本研究运用融合文本分类算法,融合常用的文本分类模型TextLSTM、TextCNN、RCNN得到皮肤疾病辅助诊疗模型(TLNN模... 针对当前皮肤病辅助诊断中生物医学特征建模规模较小且耗费巨大人工成本,而患者疾病特征的时间序列同样无法准确描述等难点,本研究运用融合文本分类算法,融合常用的文本分类模型TextLSTM、TextCNN、RCNN得到皮肤疾病辅助诊疗模型(TLNN模型),通过提取图像传感器医学特征向量化后进行预处理减少焦块数量以及消除偏差较大的特征信息,提高决策数据精度。在ISIC2018和PH2数据集进行对照实验,TLNN模型的准确率为72.36%,高于其余3种文本分类模型。在与医生主观诊断对比实验中,模型诊断准确率为92%,接近于医生94%的平均准确率,而有效诊断效率(1.17min/例)明显高于医生人工诊断(4.57min/例),整体效率提升幅度达290%,结果表明对比传统人工诊断,融合文本分类算法模型能以更短时间获得精确的诊断。TLNN模型可以应用于疾病诊断,辅助医生医疗决策,为患者提供优质便捷的智能诊疗服务。 展开更多
关键词 皮肤病 辅助诊断 融合文本分类算法 D-S证据理论 医学特征
下载PDF
基于优化LM模糊神经网络的不均衡林业信息文本分类算法 被引量:4
14
作者 陈宇 许莉薇 《中南林业科技大学学报》 CAS CSCD 北大核心 2015年第4期27-32,59,共7页
为解决不均衡林业信息文本分类中少数类分类正确率低问题,提出了一种基于优化LM模糊神经网络的不均衡林业信息文本分类算法。在阐述优化LM模糊神经网络算法原理的基础上,提取不均衡林业信息文本特征矩阵训练分类器的各项参数,实现对不... 为解决不均衡林业信息文本分类中少数类分类正确率低问题,提出了一种基于优化LM模糊神经网络的不均衡林业信息文本分类算法。在阐述优化LM模糊神经网络算法原理的基础上,提取不均衡林业信息文本特征矩阵训练分类器的各项参数,实现对不均衡林业信息文本的精准与快速分类。实验结果表明该算法对少数类辨识准确率高,优于神经网络分类法以及SVM算法、模糊神经网络算法,为不均衡林业信息文本的分类提供了新思路。 展开更多
关键词 不均衡文本分类算法 不均衡林业信息文本分类 优化LM模糊神经网络
下载PDF
一种基于支持向量机和遗传算法的启发式多层文本分类算法
15
作者 严丽丽 陈鹤年 《软件导刊》 2010年第10期52-53,共2页
在支持向量机和遗传算法的基础上,提出一种新的启发式多层文本分类算法。实验结果证明了该算法的可行性和有效性。文本分类技术是解决大规模文本处理的有效途径。
关键词 文本分类 遗传算法 神经网络 支持向量机 启发式多层文本分类算法
下载PDF
SVM算法在中文文本分类算法中的应用策略研究
16
作者 王泽 《通讯世界》 2016年第1期225-226,共2页
文本分类在数据库和搜索引擎的应用较为广泛,SVM是文本分类算法中的重要算法,适用于多种分类问题,能够解决传统算法中的弊端。本文对支持向量机和支持向量机算法做出具体的介绍,对该算法在文本分类中的应用具体指标进行探讨,旨在为我国... 文本分类在数据库和搜索引擎的应用较为广泛,SVM是文本分类算法中的重要算法,适用于多种分类问题,能够解决传统算法中的弊端。本文对支持向量机和支持向量机算法做出具体的介绍,对该算法在文本分类中的应用具体指标进行探讨,旨在为我国的文本分类方式的进步和发展提供理论帮助。 展开更多
关键词 SVM算法 文本分类算法 应用策略
下载PDF
基于局部卷积神经网络算法的文本分类识别 被引量:1
17
作者 赵革委 胡海东 《微型电脑应用》 2021年第8期136-139,共4页
研究了一种基于局部卷积神经网络的新型文本分类识别算法。该算法主要由5个步骤组成。第一步使用基于搜索字符串的文本词频统计法构成异构文本数据的同构化结果;第二步将上述同构化结果进行三维模糊化处理;第三步使用经过模糊化的数据... 研究了一种基于局部卷积神经网络的新型文本分类识别算法。该算法主要由5个步骤组成。第一步使用基于搜索字符串的文本词频统计法构成异构文本数据的同构化结果;第二步将上述同构化结果进行三维模糊化处理;第三步使用经过模糊化的数据输入到卷积神经网络算法模块中进行机器学习分析;第四步通过针对神经元网络输出结果构建三维数据矩阵,并对该三维数据矩阵进行解模糊处理;第五步将该解模糊处理的数据重新构成数据查询表并将数据查询表内容进行格式化输出。通过主观评价法将这种文本分类识别算法分析结果与4个国内外常用搜索引擎分析结果进行对比,发现所提出的文本分类识别算法有一定的先进性。 展开更多
关键词 局部卷积神经网络 文本分类识别算法 模糊神经网络 异构数据同构化
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部