期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
浅论数据抽取、净化和转换工具 被引量:13
1
作者 朱焱 《计算机应用》 CSCD 2000年第4期1-3,共3页
选择怎样的ECT(Extraction ,Cleanup ,Transformation)工具将是每个数据仓库构建者不可避免的问题。本文重点介绍ECT工具的类型 ,工作机理及它们之间的区别 ,一些著名商家的解决方法亦将作为例子给出。
关键词 数据仓库 数据抽取 数据净化 数据转换 软件工具
下载PDF
基于Web Log的数据预处理研究 被引量:4
2
作者 向坚持 陈晓红 +1 位作者 刘相滨 徐选华 《湖南师范大学自然科学学报》 EI CAS 北大核心 2004年第4期33-36,54,共5页
Web日志文件是进行Web挖掘的重要数据来源,对Web日志的数据预处理是Web挖掘过程中关键的一步.首先介绍了Web日志挖掘的体系结构,然后详细地分析了Web日志文件,并对基于Web日志文件的数据预处理进行了较深入的研究,提出了包括数据净化、... Web日志文件是进行Web挖掘的重要数据来源,对Web日志的数据预处理是Web挖掘过程中关键的一步.首先介绍了Web日志挖掘的体系结构,然后详细地分析了Web日志文件,并对基于Web日志文件的数据预处理进行了较深入的研究,提出了包括数据净化、数据抽取、数据转换和数据集成等过程的具有实际应用价值的数据预处理的实现方法. 展开更多
关键词 WEB日志挖掘 数据预处理 基于Web WEB挖掘 日志文件 数据抽取 数据净化 过程 实际 实现方法
下载PDF
用SQL Server2000构建数据仓库的尝试
3
作者 周怡 周卫平 李燕茹 《数理医药学杂志》 2003年第1期75-76,共2页
介绍了作者采用 SQL server2 0 0 0构建对广州市死亡状况数据仓库的尝试 ,探讨了在目前国内医药业的信息系统环境下 。
关键词 数据仓库 数据挖掘 数据净化 医药行业
下载PDF
移动网管平台中数据仓库数据抽取、净化和集成
4
作者 熊丽荣 蔡家楣 +1 位作者 郑河荣 郭行波 《计算机应用研究》 CSCD 北大核心 2002年第4期140-141,共2页
将数据仓库运用到移动通信网络管理平台是当前比较受关注的一项技术。而数据抽取、净化和整合是数据仓库构建过程中最复杂的部分。
关键词 数据仓库 数据抽取 数据净化 数据整合 移动通信网络管理平台 数据集成
下载PDF
事务数据向数据仓库转移的方法 被引量:3
5
作者 陈文平 夏红霞 +1 位作者 郑巧仙 李耿 《武汉理工大学学报(信息与管理工程版)》 CAS 2002年第3期87-90,共4页
数据转移是联结事务型数据环境和决策支持环境的纽带 ,对这一技术的研究有着重要意义。从讨论数据转移面临的问题开始 ,逐步就数据抽取、数据净化、数据转换和数据集成等数据转移的重要环节进行深入的探讨 ,给出若干数据转移问题的解决... 数据转移是联结事务型数据环境和决策支持环境的纽带 ,对这一技术的研究有着重要意义。从讨论数据转移面临的问题开始 ,逐步就数据抽取、数据净化、数据转换和数据集成等数据转移的重要环节进行深入的探讨 ,给出若干数据转移问题的解决方法和实现实例。 展开更多
关键词 数据转移 数据抽取 数据净化 数据转换 数据集成 数据
下载PDF
Web数据挖掘在高校教务考试中的应用 被引量:3
6
作者 黄永平 王健 《现代电子技术》 2009年第16期69-72,共4页
介绍Web数据挖掘概念的分类、校园内网络化考试考前练习中的数据资源以及校园网络化考试考前练习中Web数据挖掘的主要过程。将传统的数据挖掘与Web结合起来进行Web数据挖掘,通过此系统,可以大大简化传统的考试过程。实践证明,通过对学... 介绍Web数据挖掘概念的分类、校园内网络化考试考前练习中的数据资源以及校园网络化考试考前练习中Web数据挖掘的主要过程。将传统的数据挖掘与Web结合起来进行Web数据挖掘,通过此系统,可以大大简化传统的考试过程。实践证明,通过对学生平时练习的Web数据进行挖掘分析,可以更合理地控制网络化考试试题的难易程度,有利于进行个性化辅导以及有利于管理员维护试题库。 展开更多
关键词 WEB数据挖掘 日志挖掘 数据净化 数据
下载PDF
一种改进的基于Web使用挖掘的数据预处理方法的研究 被引量:2
7
作者 浦慧忠 《安徽电子信息职业技术学院学报》 2014年第2期48-51,共4页
本文从各种数据源采集方法出发,分析各自的局限性,首先确定面向服务器端进行Web使用挖掘,然后进一步分析服务器端数据源的特性,给出针对此数据源的一种数据预处理方案及改进方法,提出数据净化、用户识别、会话识别等关键预处理步骤,为... 本文从各种数据源采集方法出发,分析各自的局限性,首先确定面向服务器端进行Web使用挖掘,然后进一步分析服务器端数据源的特性,给出针对此数据源的一种数据预处理方案及改进方法,提出数据净化、用户识别、会话识别等关键预处理步骤,为数据挖掘过程提供尽可能准确的目标数据。 展开更多
关键词 WEB使用挖掘 数据预处理 数据净化 用户识别 会话识别
下载PDF
个人不拟合对IRT项目参数估计的影响及净化对策 被引量:1
8
作者 刘拓 曹亦薇 戴晓阳 《中国临床心理学杂志》 CSSCI CSCD 2011年第5期622-624,659,共4页
目的:探讨个人不拟合对IRT二参数模型项目参数估计的影响,并使用数据净化方法降低这种影响,提高个人拟合指标探测率。方法:基于二参数模型和lz指标进行分析。使用ICC面积法比较项目参数估计的变化,并使用数据净化的方法提高lz指标探测... 目的:探讨个人不拟合对IRT二参数模型项目参数估计的影响,并使用数据净化方法降低这种影响,提高个人拟合指标探测率。方法:基于二参数模型和lz指标进行分析。使用ICC面积法比较项目参数估计的变化,并使用数据净化的方法提高lz指标探测效果。结果:①不拟合被试比率越大,项目参数估计偏差越大;②增加测验长度可以降低个人不拟合对项目参数估计的影响;③加大样本量对降低个人不拟合对项目参数估计的影响没有作用;④数据净化方法可以有效的提高lz指标的探测效果。结论:个人不拟合会影响二参数模型的项目参数估计,数据净化方法可以校准项目参数估计,提高lz指标探测效果。 展开更多
关键词 项目反应理论 个人拟合 项目特征曲线 数据净化
原文传递
浅谈Web数据挖掘在教育网站中的应用
9
作者 田英 《计算机与网络》 2007年第23期36-38,共3页
随着Web技术的发展,Internet/Intranet构架取代传统的客户机/服务器构架技术的出现导致各类基于Internet/ Intranet的教育网站风起云涌。用户对这些网站的浏览会产生大量的网络日志。本文主要利用Web数据挖掘技术对访问教育网站所生成... 随着Web技术的发展,Internet/Intranet构架取代传统的客户机/服务器构架技术的出现导致各类基于Internet/ Intranet的教育网站风起云涌。用户对这些网站的浏览会产生大量的网络日志。本文主要利用Web数据挖掘技术对访问教育网站所生成的大量数据进行分析和挖掘,并通过分析结果进一步改进完善网站功能使其更好地发挥教育指导功能。 展开更多
关键词 数据挖掘 WEB日志 数据净化
下载PDF
基于SEG阶段控制方法的军队油料自然损耗数据净化研究
10
作者 李必鑫 黄金 +1 位作者 樊荣 苏永东 《后勤工程学院学报》 2017年第3期53-58,共6页
军队油料自然损耗标准是军队开展油料正规化建设和标准化管理的基本依据,是军队油料供应标准制度体系的重要组成部分。以往标准修定过程中,对于数据质量的控制,多采用人为干预、经验判断的方式,尚缺一套系统完备的数据质量控制方法。为... 军队油料自然损耗标准是军队开展油料正规化建设和标准化管理的基本依据,是军队油料供应标准制度体系的重要组成部分。以往标准修定过程中,对于数据质量的控制,多采用人为干预、经验判断的方式,尚缺一套系统完备的数据质量控制方法。为进一步提高标准的科学性和客观性,提出了一种基于SEG阶段控制方法的军队油料自然损耗数据净化方法,针对统计设计、统计调查、统计处理3个阶段,引入SPSS统计分析方法、EDA质量控制方法和改进Grabbs分析方法,根据各类自然损耗数据特征和标准工作实际需要,对整理类数据、探索类数据和验证类数据进行全过程分类净化,充分发挥各方法优势,有效提高了油料自然损耗数据的可靠性和准确性,增强了标准制定过程中数据质量控制环节的科学性,为制定颁发军队油料自然损耗标准奠定了坚实的数据基础。 展开更多
关键词 SEG方法 阶段控制 油料自然损耗 数据净化
下载PDF
中文微博数据净化算法比较研究
11
作者 邹鸿程 周刚 +1 位作者 杨亚强 李旭东 《计算机工程》 CAS CSCD 2012年第20期41-44,48,共5页
针对微博语言口语化和不规范导致微博数据质量低下的问题,利用质心、度-中心值和特征向量-中心值3种算法对微博话题数据进行净化,从而提高数据质量。通过比较净化前后话题帖子的规范性、相关性和有益性等属性指标分析算法性能。实验结... 针对微博语言口语化和不规范导致微博数据质量低下的问题,利用质心、度-中心值和特征向量-中心值3种算法对微博话题数据进行净化,从而提高数据质量。通过比较净化前后话题帖子的规范性、相关性和有益性等属性指标分析算法性能。实验结果表明,经过3种净化算法处理,话题帖子的整体质量尤其是规范性指标均有所提高,质心算法对于有益性指标有较好的净化效果,度-中心值和特征向量-中心值算法有助于得到强相似度的话题帖子。 展开更多
关键词 微博 质量指标 过滤 中心值 数据净化
下载PDF
隐私保护下关联规则挖掘方法 被引量:4
12
作者 沈中林 崔建国 《中国民航大学学报》 CAS 2007年第A01期108-110,114,共4页
从输入隐私保护和输出隐私保护2个角度介绍了隐私保护关联规则挖掘的有效方法。输入隐私保护采用数据扭曲的策略,输出隐私保护采用修改敏感事务值的策略。使用这2种策略的挖掘方法在取得很好隐私性同时,挖掘到的关联规则准确率也很好。
关键词 数据挖掘 隐私保护 关联规则 概率数据歪曲 频繁项 数据净化处理
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部