在大数据时代背景下,面对高校各信息化系统所积累的海量数据,如何避免数据孤岛,融合多源数据,充分发掘隐藏在数据背后的有价值信息是亟待解决的问题。针对此问题,本论文采用EDM(Educational Data Mining)方法对原始数据进行数据...在大数据时代背景下,面对高校各信息化系统所积累的海量数据,如何避免数据孤岛,融合多源数据,充分发掘隐藏在数据背后的有价值信息是亟待解决的问题。针对此问题,本论文采用EDM(Educational Data Mining)方法对原始数据进行数据清洗、数据融合、数据挖掘。在数据挖掘阶段,提出一种改进型的FP—growth算法,实现对频繁模式的发现与约减,并通过挖掘出的频繁模式构建用户行为模型,最后利用用户行为模型进行决策支持和用户服务推荐。实际应用表明,本文所提数据处理方案可以实现高校内部多源海量数据的挖掘与知识发现,具有较高的实用价值。展开更多
文摘在大数据时代背景下,面对高校各信息化系统所积累的海量数据,如何避免数据孤岛,融合多源数据,充分发掘隐藏在数据背后的有价值信息是亟待解决的问题。针对此问题,本论文采用EDM(Educational Data Mining)方法对原始数据进行数据清洗、数据融合、数据挖掘。在数据挖掘阶段,提出一种改进型的FP—growth算法,实现对频繁模式的发现与约减,并通过挖掘出的频繁模式构建用户行为模型,最后利用用户行为模型进行决策支持和用户服务推荐。实际应用表明,本文所提数据处理方案可以实现高校内部多源海量数据的挖掘与知识发现,具有较高的实用价值。