期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
基于决策树分类技术的遥感影像分类方法研究 被引量:107
1
作者 申文明 王文杰 +3 位作者 罗海江 张峰 刘小曼 熊文成 《遥感技术与应用》 CSCD 2007年第3期333-338,共6页
以河北唐山为研究区,应用Landsat ETM+影像数据和GIS数据,对决策树分类技术和传统计算机自动分类方法进行了比较。研究表明:决策树与传统自动分类方法相比,分类精度提高了18.29%,Kappa系数提高0.1878。在地形起伏的山区,应用DEM及其衍... 以河北唐山为研究区,应用Landsat ETM+影像数据和GIS数据,对决策树分类技术和传统计算机自动分类方法进行了比较。研究表明:决策树与传统自动分类方法相比,分类精度提高了18.29%,Kappa系数提高0.1878。在地形起伏的山区,应用DEM及其衍生数据等GIS数据作为辅助数据可以提高分类精度19.52%,Kappa系数提高0.281;反射率影像分类效果比原始DN值影像的分类效果好,分类精度提高15.86%;缨帽变换在压缩数据量的同时,分类精度有所降低。 展开更多
关键词 遥感影像 决策树 计算机自动分类 空间数据挖掘 土地利用/土地覆盖
下载PDF
基于深度学习的中文专利自动分类方法研究 被引量:23
2
作者 吕璐成 韩涛 +1 位作者 周健 赵亚娟 《图书情报工作》 CSSCI 北大核心 2020年第10期75-85,共11页
[目的/意义]面向当前国内专利审查和专利情报分析工作中对于海量专利分类的客观需求,设计了7种基于深度学习的专利自动分类方法,对比各种方法的分类效果,从而助力专利分类效率和效果的提升。[方法/过程]针对传统机器学习方法存在的缺陷... [目的/意义]面向当前国内专利审查和专利情报分析工作中对于海量专利分类的客观需求,设计了7种基于深度学习的专利自动分类方法,对比各种方法的分类效果,从而助力专利分类效率和效果的提升。[方法/过程]针对传统机器学习方法存在的缺陷,基于Word2Vec、CNN、RNN、Attention机制等深度学习技术,考虑专利文本语序特征、上下文特征以及分类关键特征,设计Word2Vec+TextCNN、Word2Vec+GRU、Word2Vec+BiGRU、Word2Vec+BiGRU+TextCNN等7种深度学习模型,以中国专利为例,选取IPC主分类号的"部"作为分类依据,对比这7种模型与3种传统分类模型在中文专利分类任务中的效果。[结果/结论]实证研究效果显示,采用考虑语序特征、上下文特征及强化关键特征的深度学习方法进行中文专利分类具有更优的分类效果。 展开更多
关键词 专利自动分类 深度学习 词嵌入 专利文本挖掘
原文传递
基于多视图融合的论文自动分类方法研究 被引量:4
3
作者 杨秀璋 夏换 +2 位作者 于小民 杨琪 汪瑜斌 《现代电子技术》 北大核心 2020年第8期120-124,共5页
为科研工作者精准推荐所需的学术论文,从而节约检索时间和精力,提高科研效率,并进一步提升论文自动分类的准确度。该文在传统单视图论文分类基础上,提出了一种基于多视图融合的论文自动分类方法,考虑论文标题、关键词、摘要三个视图的... 为科研工作者精准推荐所需的学术论文,从而节约检索时间和精力,提高科研效率,并进一步提升论文自动分类的准确度。该文在传统单视图论文分类基础上,提出了一种基于多视图融合的论文自动分类方法,考虑论文标题、关键词、摘要三个视图的互补性和协调性,实现对海量论文的自动分类。文中抓取了中国知网9个主题的1 710篇论文作为实验语料,并构建决策树、K最近邻、随机森林、支持向量机、朴素贝叶斯分类器进行实验。结果表明,基于多视图融合的论文分类方法在准确率、召回率和F值上都有所提升,优于单视图的论文分类方法,且可以为论文自动分类、推荐系统、文本挖掘提供有效支撑,具有一定的应用前景和实用价值。 展开更多
关键词 论文自动分类 多视图融合 数据处理 语料获取 智能推荐 文本挖掘
下载PDF
一种集成数据挖掘的自动视频分类方法 被引量:3
4
作者 原野 宋擒豹 沈钧毅 《计算机工程》 CAS CSCD 北大核心 2004年第14期11-13,共3页
针对自动视频分类工作中分类预测精度低的问题,提出了一种集成数据挖掘技术的自动视频分类方法。首先进行视频分割,形成了一个视频属性数据库;然后分别使用决策树、分类关联规则等技术对视频属性数据库进行数据挖掘,提取出决策树分类规... 针对自动视频分类工作中分类预测精度低的问题,提出了一种集成数据挖掘技术的自动视频分类方法。首先进行视频分割,形成了一个视频属性数据库;然后分别使用决策树、分类关联规则等技术对视频属性数据库进行数据挖掘,提取出决策树分类规则集和分类关联规则集;最后利用一个规则集的合并裁减算法来合并这两个分类预测规则集,形成最终的具有更高精度的视频分类规则集。通过实验验证了决策树分类预测规则和分类关联规则具有分类预测的一致性;同时实验表明,使用合并后的规则集比单独使用一个规则集来预测视频具有更高的预测准确率。 展开更多
关键词 自动视频分类 数据挖掘 决策树 分类关联规则
下载PDF
中文自动分类在搜索引擎中的应用研究 被引量:2
5
作者 李红宇 刘庆江 《计算机科学》 CSCD 北大核心 2008年第5期292-293,297,共3页
为了提高搜索引擎的查准率,帮助用户快速地定位其感兴趣的网页,可应用中文网页自动分类技术,实现快速准确的搜索引擎系统,使其具有较高的查准率。
关键词 中文自动分类 搜索引擎 WEB挖掘 网页
下载PDF
基于关联规则的船舶故障数据自动分类方法 被引量:4
6
作者 杨桦 《舰船科学技术》 北大核心 2018年第6X期55-57,共3页
传统船舶的故障数据自动分类方法,存在故障数据类型定义不准确、分类时间过长等弊端。为有效解决上述问题,设计基于关联规则的新型船舶故障数据自动分类方法。通过船舶故障数据的采集及预处理、数据的进一步挖掘两大步骤,完成关联规则... 传统船舶的故障数据自动分类方法,存在故障数据类型定义不准确、分类时间过长等弊端。为有效解决上述问题,设计基于关联规则的新型船舶故障数据自动分类方法。通过船舶故障数据的采集及预处理、数据的进一步挖掘两大步骤,完成关联规则下的船舶故障数据感知。通过BP自动分类神经网络设计、船舶故障数据的归一化处理、HIWO自动分类算法设计三大步骤,完成新型船舶故障数据自动分类方法的搭建。设计对比实验结果表明,新型船舶故障数据自动分类方法,与传统方法相比,可以在提升故障数据类型定义准确性的同时,有效控制分类时间。 展开更多
关键词 关联规则 故障数据 自动分类 数据预处理 数据挖掘 神经网络 归一化 HIWO
下载PDF
基于随机森林和LDA的论文自动分类及主题挖掘研究 被引量:3
7
作者 杨秀璋 于小民 +1 位作者 李娜 夏换 《计算机时代》 2018年第11期14-18,23,共6页
当前科研成果呈爆炸式增长,论文跨学科交叉分布不断深化,精准获取所需的论文需要耗费大量的时间和精力。文章提出一种基于随机森林的论文自动分类方法,实现对海量论文的自动分类;提出一种基于LDA模型的主题挖掘方法,提取论文关键词并进... 当前科研成果呈爆炸式增长,论文跨学科交叉分布不断深化,精准获取所需的论文需要耗费大量的时间和精力。文章提出一种基于随机森林的论文自动分类方法,实现对海量论文的自动分类;提出一种基于LDA模型的主题挖掘方法,提取论文关键词并进行词云展示。实验数据采用Selenium技术抓取中国知网九大主题的1710篇论文,实验结果表明,该论文分类方法在准确率、召回率和F值上都有所提升,有效地挖掘出各学科的主题词,为下一步引文分析、文本挖掘和知识图谱构建提供有效支撑。 展开更多
关键词 文本自动分类 LDA 随机森林 主题挖掘 中国知网
下载PDF
自动视频分类中的数据预处理 被引量:2
8
作者 原野 沈钧毅 宋擒豹 《计算机工程》 CAS CSCD 北大核心 2004年第4期129-131,共3页
提出了一套视频数据采集、特征提取及数据预处理方法。介绍了视频数据的采集方式,并提出了一套可计算的视频特征属性,可以反映人们对不同的视频风格的典型特征的理解。给出了如何将这些提取的视频属性数据处理成适合于决策树分类、分... 提出了一套视频数据采集、特征提取及数据预处理方法。介绍了视频数据的采集方式,并提出了一套可计算的视频特征属性,可以反映人们对不同的视频风格的典型特征的理解。给出了如何将这些提取的视频属性数据处理成适合于决策树分类、分类关联规则以及序列模式等数据挖掘技术适用的数据格式。 展开更多
关键词 视频分割 自动视频分类 数据挖掘 数据预处理
下载PDF
财经类专业搜索引擎关键技术的设计与实现 被引量:1
9
作者 刘钦创 《韩山师范学院学报》 2008年第3期22-25,共4页
介绍了一个基于Web挖掘技术的财经类搜索引擎的实现的关键技术,提出了类别向量的概念以及如何将Web结构挖掘和内容挖掘结合起来,并利用改进的VSM技术实现网页自动分类.
关键词 专业搜索引擎 WEB挖掘 向量空间模型 类别向量 自动分词
下载PDF
基于知识库的网络信息概念挖掘(英文)
10
作者 章成志 侯汉清 《情报理论与实践》 CSSCI 北大核心 2004年第5期528-532,共5页
本文采用数据挖掘技术和情报语言学方法 ,构建了一个可以用于从因特网上提取信息、进行自动标引和自动分类的系统 ,提供了一种创建自动分类知识库的新方法 ;提出了一种用于主题抽取的位置加权算法 ,研制了一种改进汉语同义词识别性能的... 本文采用数据挖掘技术和情报语言学方法 ,构建了一个可以用于从因特网上提取信息、进行自动标引和自动分类的系统 ,提供了一种创建自动分类知识库的新方法 ;提出了一种用于主题抽取的位置加权算法 ,研制了一种改进汉语同义词识别性能的新方法 ,并在自动分类时运用了这种语义相似度识别算法。 展开更多
关键词 知识库 网络信息挖掘 概念挖掘 因特网 自动分类 自动标引 同义词识别
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部