-
题名基于决策树分类技术的遥感影像分类方法研究
被引量:107
- 1
-
-
作者
申文明
王文杰
罗海江
张峰
刘小曼
熊文成
-
机构
中国科学院地理科学与资源研究所
中国环境监测总站
-
出处
《遥感技术与应用》
CSCD
2007年第3期333-338,共6页
-
基金
科技部十五攻关项目资助(2003BA614A-06-04)
-
文摘
以河北唐山为研究区,应用Landsat ETM+影像数据和GIS数据,对决策树分类技术和传统计算机自动分类方法进行了比较。研究表明:决策树与传统自动分类方法相比,分类精度提高了18.29%,Kappa系数提高0.1878。在地形起伏的山区,应用DEM及其衍生数据等GIS数据作为辅助数据可以提高分类精度19.52%,Kappa系数提高0.281;反射率影像分类效果比原始DN值影像的分类效果好,分类精度提高15.86%;缨帽变换在压缩数据量的同时,分类精度有所降低。
-
关键词
遥感影像
决策树
计算机自动分类
空间数据挖掘
土地利用/土地覆盖
-
Keywords
Remote Sensing Image, Decision-tree, automatic classification, Spatial Data mining, Landuse/Land cover
-
分类号
TP751
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名基于深度学习的中文专利自动分类方法研究
被引量:23
- 2
-
-
作者
吕璐成
韩涛
周健
赵亚娟
-
机构
中国科学院文献情报中心
中国科学院大学经济与管理学院图书情报与档案管理系
中国科学院计算技术研究所
-
出处
《图书情报工作》
CSSCI
北大核心
2020年第10期75-85,共11页
-
基金
中国科学院青年人才项目"基于深度学习的专利所属产业分类"(项目编号:G180161001)研究成果之一。
-
文摘
[目的/意义]面向当前国内专利审查和专利情报分析工作中对于海量专利分类的客观需求,设计了7种基于深度学习的专利自动分类方法,对比各种方法的分类效果,从而助力专利分类效率和效果的提升。[方法/过程]针对传统机器学习方法存在的缺陷,基于Word2Vec、CNN、RNN、Attention机制等深度学习技术,考虑专利文本语序特征、上下文特征以及分类关键特征,设计Word2Vec+TextCNN、Word2Vec+GRU、Word2Vec+BiGRU、Word2Vec+BiGRU+TextCNN等7种深度学习模型,以中国专利为例,选取IPC主分类号的"部"作为分类依据,对比这7种模型与3种传统分类模型在中文专利分类任务中的效果。[结果/结论]实证研究效果显示,采用考虑语序特征、上下文特征及强化关键特征的深度学习方法进行中文专利分类具有更优的分类效果。
-
关键词
专利自动分类
深度学习
词嵌入
专利文本挖掘
-
Keywords
patent automatic classification
deep learning
word embedding
patent text mining
-
分类号
G254.11
[文化科学—图书馆学]
-
-
题名基于多视图融合的论文自动分类方法研究
被引量:4
- 3
-
-
作者
杨秀璋
夏换
于小民
杨琪
汪瑜斌
-
机构
贵州财经大学信息学院
贵州财经大学贵州省经济系统仿真重点实验室
-
出处
《现代电子技术》
北大核心
2020年第8期120-124,共5页
-
基金
贵州省教育厅青年科技人才成长项目(黔教合KY字[2016]172)
贵州省教育厅青年科技人才成长项目(黔教合KY字[2016]178)
贵州省普通高等学校科技拔尖人才支持计划项目(黔教合KY字[2016]068)。
-
文摘
为科研工作者精准推荐所需的学术论文,从而节约检索时间和精力,提高科研效率,并进一步提升论文自动分类的准确度。该文在传统单视图论文分类基础上,提出了一种基于多视图融合的论文自动分类方法,考虑论文标题、关键词、摘要三个视图的互补性和协调性,实现对海量论文的自动分类。文中抓取了中国知网9个主题的1 710篇论文作为实验语料,并构建决策树、K最近邻、随机森林、支持向量机、朴素贝叶斯分类器进行实验。结果表明,基于多视图融合的论文分类方法在准确率、召回率和F值上都有所提升,优于单视图的论文分类方法,且可以为论文自动分类、推荐系统、文本挖掘提供有效支撑,具有一定的应用前景和实用价值。
-
关键词
论文自动分类
多视图融合
数据处理
语料获取
智能推荐
文本挖掘
-
Keywords
paper automatic classification
multi-view fusion
data processing
corpus obtaining
intelligent recommendation
text mining
-
分类号
TN911-34
[电子电信—通信与信息系统]
TP391
[电子电信—信息与通信工程]
-
-
题名一种集成数据挖掘的自动视频分类方法
被引量:3
- 4
-
-
作者
原野
宋擒豹
沈钧毅
-
机构
西安交通大学计算机系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2004年第14期11-13,共3页
-
基金
国家自然科学基金资助项目(60173058)
-
文摘
针对自动视频分类工作中分类预测精度低的问题,提出了一种集成数据挖掘技术的自动视频分类方法。首先进行视频分割,形成了一个视频属性数据库;然后分别使用决策树、分类关联规则等技术对视频属性数据库进行数据挖掘,提取出决策树分类规则集和分类关联规则集;最后利用一个规则集的合并裁减算法来合并这两个分类预测规则集,形成最终的具有更高精度的视频分类规则集。通过实验验证了决策树分类预测规则和分类关联规则具有分类预测的一致性;同时实验表明,使用合并后的规则集比单独使用一个规则集来预测视频具有更高的预测准确率。
-
关键词
自动视频分类
数据挖掘
决策树
分类关联规则
-
Keywords
automatic video classification
Data mining
Decision tree
Class association rules
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名中文自动分类在搜索引擎中的应用研究
被引量:2
- 5
-
-
作者
李红宇
刘庆江
-
机构
哈尔滨师范大学阿城学院计算机与信息系
-
出处
《计算机科学》
CSCD
北大核心
2008年第5期292-293,297,共3页
-
文摘
为了提高搜索引擎的查准率,帮助用户快速地定位其感兴趣的网页,可应用中文网页自动分类技术,实现快速准确的搜索引擎系统,使其具有较高的查准率。
-
关键词
中文自动分类
搜索引擎
WEB挖掘
网页
-
Keywords
Chinese automatic classification, Search engine,Web mining
-
分类号
TP393.4
[自动化与计算机技术—计算机应用技术]
TP311.13
[自动化与计算机技术—计算机科学与技术]
-
-
题名基于关联规则的船舶故障数据自动分类方法
被引量:4
- 6
-
-
作者
杨桦
-
机构
四川交通职业技术学院
-
出处
《舰船科学技术》
北大核心
2018年第6X期55-57,共3页
-
文摘
传统船舶的故障数据自动分类方法,存在故障数据类型定义不准确、分类时间过长等弊端。为有效解决上述问题,设计基于关联规则的新型船舶故障数据自动分类方法。通过船舶故障数据的采集及预处理、数据的进一步挖掘两大步骤,完成关联规则下的船舶故障数据感知。通过BP自动分类神经网络设计、船舶故障数据的归一化处理、HIWO自动分类算法设计三大步骤,完成新型船舶故障数据自动分类方法的搭建。设计对比实验结果表明,新型船舶故障数据自动分类方法,与传统方法相比,可以在提升故障数据类型定义准确性的同时,有效控制分类时间。
-
关键词
关联规则
故障数据
自动分类
数据预处理
数据挖掘
神经网络
归一化
HIWO
-
Keywords
association rules
fault data
automatic classification
data preprocessing
data mining
neural network
normalization
HIWO
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
U672
[自动化与计算机技术—计算机科学与技术]
-
-
题名基于随机森林和LDA的论文自动分类及主题挖掘研究
被引量:3
- 7
-
-
作者
杨秀璋
于小民
李娜
夏换
-
机构
贵州财经大学信息学院
贵州财经大学贵州省经济系统仿真重点实验室
中国船舶工业系统工程研究院
-
出处
《计算机时代》
2018年第11期14-18,23,共6页
-
基金
贵州省教育厅青年科技人才成长项目"实体和属性对齐方法的研究与实现"(黔教合KY字[2016]172)
贵州省教育厅青年科技人才成长项目"无线校园网络建设中Mesh网关负载均衡问题研究"(黔教合KY字[2016]178)
贵州省普通高等学校科技拔尖人才支持计划项目"定向钻机远程实时监控大数据分析评价系统"(黔教合KY字[2016]068)
-
文摘
当前科研成果呈爆炸式增长,论文跨学科交叉分布不断深化,精准获取所需的论文需要耗费大量的时间和精力。文章提出一种基于随机森林的论文自动分类方法,实现对海量论文的自动分类;提出一种基于LDA模型的主题挖掘方法,提取论文关键词并进行词云展示。实验数据采用Selenium技术抓取中国知网九大主题的1710篇论文,实验结果表明,该论文分类方法在准确率、召回率和F值上都有所提升,有效地挖掘出各学科的主题词,为下一步引文分析、文本挖掘和知识图谱构建提供有效支撑。
-
关键词
文本自动分类
LDA
随机森林
主题挖掘
中国知网
-
Keywords
automatic text classification
LDA
random forest
topic mining
CNKI
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名自动视频分类中的数据预处理
被引量:2
- 8
-
-
作者
原野
沈钧毅
宋擒豹
-
机构
西安交通大学计算机系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2004年第4期129-131,共3页
-
基金
国家自然科学基金资助项目(60173058)
-
文摘
提出了一套视频数据采集、特征提取及数据预处理方法。介绍了视频数据的采集方式,并提出了一套可计算的视频特征属性,可以反映人们对不同的视频风格的典型特征的理解。给出了如何将这些提取的视频属性数据处理成适合于决策树分类、分类关联规则以及序列模式等数据挖掘技术适用的数据格式。
-
关键词
视频分割
自动视频分类
数据挖掘
数据预处理
-
Keywords
Video segmentation
automatic video classification
Data mining
Data preprocess
-
分类号
TP274
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名财经类专业搜索引擎关键技术的设计与实现
被引量:1
- 9
-
-
作者
刘钦创
-
机构
汕头职业技术学院科研设备处
-
出处
《韩山师范学院学报》
2008年第3期22-25,共4页
-
文摘
介绍了一个基于Web挖掘技术的财经类搜索引擎的实现的关键技术,提出了类别向量的概念以及如何将Web结构挖掘和内容挖掘结合起来,并利用改进的VSM技术实现网页自动分类.
-
关键词
专业搜索引擎
WEB挖掘
向量空间模型
类别向量
自动分词
-
Keywords
specialized search engine
Web Vector
automatic classification mining
vector space modal(VSM)
categorization
-
分类号
TP392
[自动化与计算机技术—计算机应用技术]
-
-
题名基于知识库的网络信息概念挖掘(英文)
- 10
-
-
作者
章成志
侯汉清
-
机构
南京农业大学信息管理系
-
出处
《情报理论与实践》
CSSCI
北大核心
2004年第5期528-532,共5页
-
基金
ThispaperispartlysponsoredbyNationalSocialScienceFund ,directedbyProf.HouHanqing .(ID :0 2BTQ0 12 )
-
文摘
本文采用数据挖掘技术和情报语言学方法 ,构建了一个可以用于从因特网上提取信息、进行自动标引和自动分类的系统 ,提供了一种创建自动分类知识库的新方法 ;提出了一种用于主题抽取的位置加权算法 ,研制了一种改进汉语同义词识别性能的新方法 ,并在自动分类时运用了这种语义相似度识别算法。
-
关键词
知识库
网络信息挖掘
概念挖掘
因特网
自动分类
自动标引
同义词识别
-
Keywords
knowledge database
automatic classification
automatic indexing / concept mining
synonyms recognition
-
分类号
G354
[文化科学—情报学]
-