-
题名基于密度的kNN分类器训练样本裁剪方法的改进
被引量:13
- 1
-
-
作者
熊忠阳
杨营辉
张玉芳
-
机构
重庆大学计算机学院
-
出处
《计算机应用》
CSCD
北大核心
2010年第3期799-801,817,共4页
-
基金
中国博士后科学基金资助项目(20070420711)
重庆市科委自然科学基金资助项目(2007BB2372)
-
文摘
在文本分类中,训练集的分布状态会直接影响k-近邻(kNN)分类器的效率和准确率。通过分析基于密度的kNN文本分类器训练样本的裁剪方法,发现它存在两大不足:一是裁剪之后的均匀状态只是以ε为半径的球形区域意义上的均匀状态,而非最理想的均匀状态即两两样本之间的距离相等;二是未对低密度区域的样本做任何处理,裁剪之后仍存在大量不均匀的区域。针对这两处不足,提出了以下两点改进:一是优化了裁剪策略,使裁剪之后的训练集更趋于理想的均匀状态;二是实现了对低密度区域样本的补充。通过实验对比,改进后的方法在稳定性和准确率方面都有明显提高。
-
关键词
文本分类
K-近邻
快速分类
样本裁剪
样本补充
-
Keywords
text classification
k-Nearest Neighbor(kNN)
fast classification
sample reduction
sample supplement
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于不确定性迭代优化的山地植被遥感制图
被引量:6
- 2
-
-
作者
郭逸飞
吴田军
骆剑承
石含宁
郜丽静
-
机构
中国科学院空天信息创新研究院遥感科学国家重点实验室
中国科学院大学
长安大学理学院
兰州交通大学测绘与地理信息学院
-
出处
《地球信息科学学报》
CSCD
北大核心
2022年第7期1406-1419,共14页
-
基金
国家自然科学基金项目(42071316、41631179)
国家重点研发计划项目(2017YFB0503600)
+3 种基金
重庆市农业产业数字化地图项目(21C00346)
内蒙古自治区科技重大专项(2021SZD0036)
陕西省重点研发计划项目(2021NY-170)
长安大学中央高校基本科研业务费专项资金资助(300102120201)。
-
文摘
山地因其较高的异质性和特殊的环境特征给遥感科学及其应用带来了诸多问题和挑战。为实现山地植被信息的精准提取,本研究选择部分滇西北山地区域作为研究区开展方法实验,利用高分辨率遥感影像数据和数字高程模型,结合分区分层感知思想,提出一种基于不确定性理论的山地植被型组分类制图方法。首先结合地形对研究区影像进行多尺度分割制作图斑;然后根据图斑特征使用随机森林方法进行分类,将分类结果与对应类别样本间的相似性作为优化目标,并构建混合熵模型定量计算图斑推测类型的不确定性,据此进行针对性的样本补充和分类模型的迭代优化。实验总体分类精度达90.8%,较迭代前提升了29.4%,Kappa系数达到0.875。在高不确定性区域,该方法相比使用一次性补样和随机补样方法的分类结果,精度分别提高了17%和13%。研究结果表明,通过人机交互的方式,基于不确定性理论为样本库融入增量信息的迭代优化方法能够有效提高植被型组分类的精度,相较于传统的样本选择方法具有更高的效率和更低的不确定性。
-
关键词
山地植被信息
植被型组分类
多尺度分割
随机森林
不确定性理论
相似性度量
样本补充
迭代优化
-
Keywords
mountain vegetation information
classification for groups of vegetation type
multiscale segmentation
random forest
uncertainty theory
similarity measure
sample supplement
iterative optimization
-
分类号
P237
[天文地球—摄影测量与遥感]
Q948
[天文地球—测绘科学与技术]
-