基于数据挖掘算法土壤肥力状况的分析研究被引量：8

Analysis andresearch of the soil fertility status based on data mining algorithm

下载PDF

导出

摘要为了从土壤养分数据中分析出其对土壤肥力的贡献,以挖掘出描述土壤肥力状况的知识,本文选择数据挖掘技术的C4.5决策树、K-means和DBSCAN聚类算法,利用农安县三个乡(镇)采集的土壤养分数据,从算法的准确率和时间效率两个方面进行模拟实验,并分别就同一数据集不同算法、同一算法不同数据集两种情况进行对比分析。结果表明:对于同一数据集C4.5与K-means算法准确率和时间效率都较高(精度分别为98.7903%、98.1182%,运行时间分别为0.03s、0.08s),但对于依靠大量数据分析土壤肥力状况以预测未来土壤肥力的变化趋势,显然K-means算法更适合。对于不同数据集的比较,选择DBSCAN算法的效果较好(正确率分别为97.1774%、94.0226%、92.3240%)。上述研究结果为分析土壤肥力状况提供了新的参考依据。 Data mining is the extracting or ＂ mining＂ knowledge from large amounts of data. In order to analyze its contribution to soil fertility from the soil nutrient data and to dig out the description of the knowledge of soil fertility status. This article select some typical algorithms of data mining technology, such as C4.5 decision tree, K-means and DBSCAN clustering algorithm. Combining soil nutrient data collected from the three town of NongAn, and Simulation from two aspects of the precision rate and time efficiency. Clustering condition of one algorithm with different data sets is analyzed by comparing with the same clustering of the data set under different algorithms. The results showed that C4.5 and K-means algorithm have higher accuracy and time efficiency for comparing the same data set （Precision respectively 98.7903%, 98.1182%, time efficiency respectively 0.03s, 0.08s） . However, relying on large amounts of data for analysis of soil fertility status to predict future trends in fertility, apparently, K-means algorithm is more suitable. DBSCAN algorithm has good effect for comparing different data sets （correct rates were 97.1774%, 94.0226%, and 92.3240%） ; these results provide a new reference for analysis of soil fertility status.

作者蔡丽霞陈桂芬

机构地区吉林农业大学信息技术学院

出处《中国农机化学报》北大核心 2014年第3期252-255,262,共5页 Journal of Chinese Agricultural Mechanization

基金国家863项目(2006AA10A309) 国家星火计划(2008GA661003) 吉林省世行项目(2011-Z20)

关键词数据挖掘 C4 5决策树聚类算法土壤肥力 data mining C4.5 decision tree clustering algorithm soil fertility

分类号 TP399 [自动化与计算机技术—计算机应用技术] S158.2 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献19

1邢平平,施鹏飞,熊范纶.数据挖掘技术在农业数据中的有效应用[J].计算机工程与应用,2001,37(2):4-6. 被引量：42
2Lianghou Li, Jiyue Li. Application of clustering analysis in classifying site type and evaluating soil fertility [C]. 2010 Third International Conference on Education Technology and Training (ETY 2010), 2010. 被引量：1
3Chawan, Saurabh R Bhonde, et al. Improvement of K-Means clustering Algorithm [J]. International Journal of Engineering Research and Applications (IJERA) ISSN, 2012, 2 (2): 1378- 1382. 被引量：1
4陈桂芬,曹丽英,王国伟.加权空间模糊动态聚类算法在土壤肥力评价中的应用[J].中国农业科学,2009,42(10):3559-3563. 被引量：25
5Jiawei Han, Micheline Kamber. Data mining concepts and techniques [M]. Second Edition: China Machine Press, 2007. 被引量：1
6张琳,陈燕,李桃迎,牟向伟.决策树分类算法研究[J].计算机工程,2011,37(13):66-67. 被引量：53
7谭勇,荣秋生.一个基于DBSCAN聚类算法的实现[J].计算机工程,2004,30(13):119-121. 被引量：7
8Jain AK, Dubes RC. Algorithms for Clustering Data [J]. Prentice-Hall Advanced Reference Series, 1988: (1): 334. 被引量：1
9孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1070
10高阳,廖家平,吴伟.基于决策树的ID3算法与C4.5算法[J].湖北工业大学学报,2011,26(2):54-56. 被引量：19

二级参考文献73

1邱洁,过仲阳,苏君毅,戴晓燕,林晖.关联规则及其在灾害天气预测中的应用[J].华东师范大学学报（自然科学版）,2005(Z1):165-169. 被引量：4
2张家爱.数据挖掘技术在农业决策支持系统中的应用[J].吉林农业科技学院学报,2010,19(1):56-57. 被引量：6
3栾丽华,吉根林.决策树分类技术研究[J].计算机工程,2004,30(9):94-96. 被引量：112
4高学东,尹阿东,张健,宫雨,武森.利用上凸函数对决策树算法的改进[J].中国管理科学,2004,12(4):144-148. 被引量：2
5王静红,王熙照,邵艳华,王伍伶.决策树算法的研究及优化[J].微机发展,2004,14(9):30-32. 被引量：31
6苗孝可,夏克俭,王秀.精准农业变量施肥智能决策支持系统的研究[J].计算机应用,2004,24(11):153-155. 被引量：17
7王熙照,谢竞博.基于属性间交互信息的模糊ID3算法的扩展(英文)[J].复旦学报（自然科学版）,2004,43(5):777-780. 被引量：5
8丁华,张少中,王秀坤.基于改进ID3算法的轨迹化决策研究[J].计算机工程与设计,2004,25(10):1721-1723. 被引量：8
9魏涛.改进的ID3算法及其在教育信息挖掘中的应用[J].上海海事大学学报,2005,26(3):82-84. 被引量：6
10李洁,高新波,焦李成.基于特征加权的模糊聚类新算法[J].电子学报,2006,34(1):89-92. 被引量：114

共引文献1502

1丁小军,陈杰,李霖,徐碧通,朱晓姝.一种基于聚类结果稳定性来确定聚类数的方法[J].玉林师范学院学报,2020(3):43-47. 被引量：1
2王玥,李文权,梁爽,余静财.基于改进聚类算法的共享汽车网点选址研究[J].武汉理工大学学报,2021,43(2):79-85.
3林耿堃,盛积良.乡村振兴时代背景下农民消费结构变迁研究[J].农业农村部管理干部学院学报,2021(2):76-81. 被引量：3
4高文才,曹帅.基于MRF-FCM算法的矿井运动目标图像优化[J].工矿自动化,2024,50(S01):69-73.
5高显义,林欣晖.基于文本聚类的变电工程变更特征识别研究[J].建筑经济,2020,41(S02):200-203. 被引量：2
6毛颖颖,杨新凯.融合拓扑势的自适应层次聚类算法研究[J].计算机应用研究,2020,37(S01):37-39.
7张睿恺,吴克河.基于优化特征集的LeNet-5攻击检测模型的态势感知技术[J].计算机应用研究,2020,37(S01):287-289. 被引量：3
8李对红,王裴岩 ,张桂平,张少阳.基于字簇的多模型中文分词方法研究[J].计算机应用研究,2020,37(2):355-359. 被引量：2
9陈超,赫春晓.一种基于二叉决策树的植被分类方法研究[J].现代测绘,2019,0(5):28-31.
10尧少波,蒋励剑,赵文文,卢铮,吴昌聚,陈伟芳.耦合聚类的数据驱动稀薄流非线性本构计算方法[J].航空学报,2022,43(S02):43-56.

同被引文献58

1朱玉荣,吕建新,曾宪,刘正国.基于RBF神经网络的农用柴油机故障诊断研究[J].农机化研究,2012,34(5):212-215. 被引量：3
2张立国,吴超,时广毅.基于云计算和WebGIS的农业信息服务系统构建[J].湖北农业科学,2013,52(5):1161-1163. 被引量：9
3郑湘平.基于2013版新规则男子自由体操成套动作难度选择与编排研究[J].成都体育学院学报,2014,40(11):61-67. 被引量：13
4熊亚军,廖晓农,李梓铭,张小玲,孙兆彬,赵秀娟,赵普生,马小会,蒲维维.KNN数据挖掘算法在北京地区霾等级预报中的应用[J].气象,2015,41(1):98-104. 被引量：53
5王元珍,龚卫华.数据库异构集群的性能模型研究[J].计算机科学,2006,33(6):106-108. 被引量：3
6胡劲松,杨世锡.EMD方法基于径向基神经网络预测的数据延拓与应用[J].机械强度,2007,29(6):894-899. 被引量：23
7吴楠,何方,沙宗珩,等.GIS在测土配方施肥工作中的应用[C].创新与发展2006高校GIS论坛论文集,2006. 被引量：1
8陈留美,桂林国,吕家珑,王重光,李政中,王增,孙榕.应用主成分分析和聚类分析评价不同施肥处理条件下新垦淡灰钙土土壤肥力质量[J].土壤,2008,40(6):971-975. 被引量：49
9孙红辉,张清华,宋贤征.基于RBF神经网络的柴油机故障诊断[J].小型内燃机与摩托车,2009,38(1):70-72. 被引量：3
10陈桂芬,曹丽英,王国伟.加权空间模糊动态聚类算法在土壤肥力评价中的应用[J].中国农业科学,2009,42(10):3559-3563. 被引量：25

引证文献8

1宋志飞,彭金莲.海南农垦耕地类型的聚类分析[J].计算机应用研究,2020,37(S01):88-91. 被引量：2
2罗小玲,薛河儒.基于模糊关联优化的中文语义深度挖掘仿真[J].计算机仿真,2016,33(1):362-364. 被引量：5
3罗哉,刘慧平,胡晓峰,徐伟.视觉导引AGV纠偏算法研究[J].计算机仿真,2016,33(1):373-377. 被引量：11
4鲁业明,于合龙.基于YARN的加权模糊C均值算法在土壤养分数据挖掘中的应用[J].中国农机化学报,2016,37(9):140-145. 被引量：1
5王珺.体操运动员平衡木直体后空翻动作数据抗干扰挖掘[J].科学技术与工程,2017,17(3):258-262. 被引量：1
6畅卫功.嵌入式网络信息接口数据实时采集仿真[J].计算机仿真,2017,34(9):274-277. 被引量：4
7马立艳,陈桂芬.基于粗糙集RBF神经网络在东丰县开发区企业管理上的应用[J].农业与技术,2019,39(11):4-7.
8彭金莲,唐朝胜,蒋菊生,赵春梅.基于大数据挖掘的橡胶园耕地地力评价[J].热带生物学报,2019,10(4):380-386.

二级引证文献24

1袁勤,黄家海.基于图正则算法的语义特征提取与翻译的研究[J].电子测量技术,2020(8):91-95. 被引量：3
2樊一婷.基于关联系数矩阵的体操运动员平衡木直体后空翻动作分析[J].自动化与仪器仪表,2018,0(12):180-183. 被引量：4
3徐谦谦.汽车自动驾驶英文信息特征提取优化仿真[J].计算机仿真,2016,33(11):175-178. 被引量：3
4罗哉,唐颖奇,李冬,王岚晶.基于最优偏差路径的自动导引车纠偏方法[J].仪器仪表学报,2017,38(4):853-860. 被引量：24
5杨前明,王俊基,崔克克.重载复合机器人自导引纠偏PID算法与实验研究[J].机电工程,2017,34(10):1208-1213. 被引量：6
6孙雷.安全协议多目标语言代码缺陷检测方法仿真[J].计算机仿真,2017,34(12):443-446. 被引量：1
7王少帅.电力系统管道漏磁检测异常数据高度采集仿真[J].计算机仿真,2018,35(5):387-390. 被引量：3
8邢继军.多线程技术下复杂设备多点数据精准采集仿真[J].计算机仿真,2018,35(6):436-439. 被引量：4
9瞿学新,朱全银,严云洋,李翔.基于互信息和关联规则的文本特征提取方法[J].淮阴工学院学报,2018,27(3):20-24. 被引量：1
10杨前明,张君,阮益.AGV轨迹规划及其纠偏控制机理研究[J].机电工程,2018,35(11):1243-1247. 被引量：12

1杨玉琴,陈桂芬,郭宏亮,孙雄辉,蔡丽霞.大数据处理技术在土壤肥力评价中的研究[J].中国农机化学报,2016,37(4):233-236. 被引量：2
2林浩,苑超,王增辉.基于加权算法的土壤肥力状况的分析与研究[J].中国农机化学报,2015,36(6):315-318. 被引量：1
3李丽珊,朱文兴.基于簇中心动态迁移的一个聚类算法[J].福建农林大学学报（自然科学版）,2004,33(4):508-511.
4贾晨光,陈桂芬.基于粗糙集C4.5算法的应用[J].中国农机化学报,2016,37(7):149-153. 被引量：2
5田茁.短信平台系统中基于神经网络的测土配方施肥模型[J].黑龙江科技信息,2015(30):34-35.
6郭万春,蔡丽霞,陈航,陈桂芬.基于改进的DBSCAN算法的土壤肥力变化的分析研究[J].计算机科学,2013,40(11A):412-414.
7张志伟.浅谈适地适树[J].河北林业,2009(1):28-28.
8王存理,高楠.农安:“互联网+”悄然进村入户[J].农村科学实验,2015,0(11).
9李威,陈桂芬.基于C4.5决策树算法的农安县农田管理区划分[J].湖北农业科学,2014,53(7):1675-1677. 被引量：1
10卞云超,司秀丽.基于MapReduce的新聚类算法在农业领域的应用——以柑橘红蜘蛛图像目标识别为例[J].中国农机化学报,2016,37(9):166-171. 被引量：6

中国农机化学报

2014年第3期

浏览历史

内容加载中请稍等...

基于数据挖掘算法土壤肥力状况的分析研究被引量：8

参考文献19

二级参考文献73

共引文献1502

同被引文献58

引证文献8

二级引证文献24

相关作者

相关机构

相关主题

浏览历史

基于数据挖掘算法土壤肥力状况的分析研究 被引量：8

参考文献19

二级参考文献73

共引文献1502

同被引文献58

引证文献8

二级引证文献24

相关作者

相关机构

相关主题

浏览历史

基于数据挖掘算法土壤肥力状况的分析研究被引量：8