期刊文献+
共找到5,952篇文章
< 1 2 250 >
每页显示 20 50 100
数据质量和数据清洗研究综述 被引量:266
1
作者 郭志懋 周傲英 《软件学报》 EI CSCD 北大核心 2002年第11期2076-2082,共7页
对数据质量,尤其是数据清洗的研究进行了综述.首先说明数据质量的重要性和衡量指标,定义了数据清洗问题.然后对数据清洗问题进行分类,并分析了解决这些问题的途径.最后说明数据清洗研究与其他技术的结合情况,分析了几种数据清洗框架.最... 对数据质量,尤其是数据清洗的研究进行了综述.首先说明数据质量的重要性和衡量指标,定义了数据清洗问题.然后对数据清洗问题进行分类,并分析了解决这些问题的途径.最后说明数据清洗研究与其他技术的结合情况,分析了几种数据清洗框架.最后对将来数据清洗领域的研究问题作了展望. 展开更多
关键词 数据质量 数据清洗 数据库系统 数据集成 相似重复记录
下载PDF
数据挖掘技术在Web预取中的应用研究 被引量:116
2
作者 徐宝文 张卫丰 《计算机学报》 EI CSCD 北大核心 2001年第4期430-436,共7页
WWW以其多媒体的传输及良好的交互性而倍受青睐 .虽然近几年来网络速度得到了很大的提高 ,但是由于接入 Internet的用户数量剧增以及 Web服务和网络固有的延迟 ,使得网络越来越拥挤 ,用户的服务质量得不到很好的保证 .为此文中提出了一... WWW以其多媒体的传输及良好的交互性而倍受青睐 .虽然近几年来网络速度得到了很大的提高 ,但是由于接入 Internet的用户数量剧增以及 Web服务和网络固有的延迟 ,使得网络越来越拥挤 ,用户的服务质量得不到很好的保证 .为此文中提出了一种智能 Web预取技术 ,它能够加快用户浏览 Web页面时获取页面的速度 .该技术通过简化的 WWW数据模型表示用户浏览器缓冲器中的数据 ,在此基础上利用数据挖掘技术挖掘用户的兴趣关联规则 ,存放在兴趣关联知识库中 ,作为对用户行为进行预测的依据 .在用户端 ,智能代理负责用户兴趣的挖掘及基于兴趣关联知识库的 Web预取 ,从而对用户实现透明的浏览器加速 . 展开更多
关键词 WWW 数据模型 数据挖掘 浏览器 Web 数据预取 数据库 知识库
下载PDF
大数据时代下数据质量的挑战 被引量:140
3
作者 宗威 吴锋 《西安交通大学学报(社会科学版)》 CSSCI 北大核心 2013年第5期38-43,共6页
大数据是物联网数据感知、云计算数据计算、三网融合数据服务实现的核心基础。大数据时代的到来对企业存储和管理数据、从数据中提取有价值的信息提出了挑战。数据质量是有效分析和利用大数据的前提,是大数据产生跨区域、跨行业、跨部... 大数据是物联网数据感知、云计算数据计算、三网融合数据服务实现的核心基础。大数据时代的到来对企业存储和管理数据、从数据中提取有价值的信息提出了挑战。数据质量是有效分析和利用大数据的前提,是大数据产生跨区域、跨行业、跨部门价值的保障。为此,梳理了大数据的基本特征,结合中国当下企业发展现状及大数据在国内的发展态势,从流程、技术和管理视角讨论了大数据时代下企业保证数据质量的挑战、重要性及应对措施。 展开更多
关键词 大数据 数据质量 数据生命周期 数据分析技术 数据管理
下载PDF
数据质量研究综述 被引量:102
4
作者 韩京宇 徐立臻 董逸生 《计算机科学》 CSCD 北大核心 2008年第2期1-5,12,共6页
数据质量管理是信息系统建设的首要问题。本文首先回顾了数据质量的定义和质量提高策略的分类,然后对数据质量研究涉及的两个主要方面,即数据质量评估和数据质量提高技术的各种方法进行了比较和分析,并对有代表性的数据质量提高工具进... 数据质量管理是信息系统建设的首要问题。本文首先回顾了数据质量的定义和质量提高策略的分类,然后对数据质量研究涉及的两个主要方面,即数据质量评估和数据质量提高技术的各种方法进行了比较和分析,并对有代表性的数据质量提高工具进行了介绍。最后提出了一个评估驱动的数据质量提高框架,并对数据质量研究方向进行了展望。 展开更多
关键词 数据质量 数据清洗 机器学习 数据审计
下载PDF
对SRTM3和GTOPO30地形数据质量的评估 被引量:103
5
作者 陈俊勇 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2005年第11期941-944,共4页
高分辨率的地形数据在基础地理信息系统、地球重力场建模和大地水准面求定等工程中至关重要。SRTM有3″×3″(SRTM3)和1″×1″(SRTM1)两种分辨率。就全球而言,SRTM3的原始数据已于2004年解密。SRTM3的高程基准是EGM96的大地水... 高分辨率的地形数据在基础地理信息系统、地球重力场建模和大地水准面求定等工程中至关重要。SRTM有3″×3″(SRTM3)和1″×1″(SRTM1)两种分辨率。就全球而言,SRTM3的原始数据已于2004年解密。SRTM3的高程基准是EGM96的大地水准面,平面基准是WGS84;标称绝对高程精度是±16m,绝对平面精度是±20m。SRTM3的数据只覆盖60°N至54°S带状区域内的DSM。对覆盖全球的GTOPO30的DTM也作了概要介绍。 展开更多
关键词 地形数据 DTM DSM SRTM GTOPO30 质量评估
下载PDF
分布应用集成核心技术研究综述 被引量:75
6
作者 徐罡 黄涛 +1 位作者 刘绍华 叶丹 《计算机学报》 EI CSCD 北大核心 2005年第4期433-444,共12页
分布应用集成技术已成为构建大型信息系统,特别是SOA的关键技术.该文在分析分布应用集成的基本特征和集成层次的基础上,阐述了其关键问题,包括数据多样性、传输载体和应用访问、协同管理、可重配和自适应、建模和形式化,进一步论述了分... 分布应用集成技术已成为构建大型信息系统,特别是SOA的关键技术.该文在分析分布应用集成的基本特征和集成层次的基础上,阐述了其关键问题,包括数据多样性、传输载体和应用访问、协同管理、可重配和自适应、建模和形式化,进一步论述了分布应用集成与Grid,SOA及B2B等技术的联系与区别.从不同的角度对这些问题作了全面的概述,既分析了存在的问题,又论述了已有技术在处理这雪问题上的优势和不足并探讨了相关的新兴技术,展望了未来发展方向. 展开更多
关键词 分布应用集成 中间件 面向服务的体系 B2B 网格
下载PDF
基于大数据的高校教学质量评价体系构建 被引量:112
7
作者 马星 王楠 《清华大学教育研究》 CSSCI 北大核心 2018年第2期38-43,共6页
大数据时代对高等教育发展来说既是机遇也是挑战。对于高校教学质量评价而言,以大数据为依托可以收集更多的数据材料作为评价的依据,但与此同时,这也为从体量巨大的数据材料中找到准确、有效的信息增加了难度。在大数据背景下,只有将&qu... 大数据时代对高等教育发展来说既是机遇也是挑战。对于高校教学质量评价而言,以大数据为依托可以收集更多的数据材料作为评价的依据,但与此同时,这也为从体量巨大的数据材料中找到准确、有效的信息增加了难度。在大数据背景下,只有将"以学生为中心"和"以数据为依托"作为高校教学质量评价的价值引领和技术支持,逐步构建具有全过程、多层级、双功能特征的评价体系,才能实现由大数据带来的学习变革。为了实现这一目标,高等学校要实现常态化地收集数据、多样化地应用数据、制度化地管理数据。 展开更多
关键词 大数据 以学生为中心 学生学习结果 教育效能 质量评价
原文传递
数据治理研究述评 被引量:111
8
作者 张宁 袁勤俭 《情报杂志》 CSSCI 北大核心 2017年第5期129-134,163,共7页
[目的/意义]数据治理是数据科学时代关注的研究课题,对数据治理的概念、体系、内容和应用的相关研究进行述评,以期将数据治理研究引向深入。[方法/过程]采用文献调研法,对国内外文献进行系统脉络梳理和整体内容述评。[结果/结论]目前研... [目的/意义]数据治理是数据科学时代关注的研究课题,对数据治理的概念、体系、内容和应用的相关研究进行述评,以期将数据治理研究引向深入。[方法/过程]采用文献调研法,对国内外文献进行系统脉络梳理和整体内容述评。[结果/结论]目前研究主要集中在"框架模型的设计""价值的探讨"和"不同领域的应用"等,现有研究存在"实证研究较少""数据治理框架模型的设计欠缺优化"等问题,"框架体系""政策标准""成熟度模型""数据质量"等仍是未来研究应关注的重点领域,海量异质数据的治理是未来最值得关注的新兴研究领域。 展开更多
关键词 数据治理 数据质量 数据科学
下载PDF
数据ETL研究综述 被引量:104
9
作者 徐俊刚 裴莹 《计算机科学》 CSCD 北大核心 2011年第4期15-20,共6页
数据抽取、转换和装载(Extraction,Transformation and Loading,简称ETL)是数据仓库化的关键环节,对数据仓库数据质量有着至关重要的影响。随着信息化的发展,ETL已经成为当前较活跃的研究领域之一,但是ETL理论和技术的发展还不成熟。针... 数据抽取、转换和装载(Extraction,Transformation and Loading,简称ETL)是数据仓库化的关键环节,对数据仓库数据质量有着至关重要的影响。随着信息化的发展,ETL已经成为当前较活跃的研究领域之一,但是ETL理论和技术的发展还不成熟。针对当前ETL研究中存在的一些问题和需要考虑的各种因素,从ETL各个阶段存在的主要问题出发,列举了各种研究方法及研究成果,并进行了分析。最后,总结并提出了ETL的未来研究方向和今后工作的建议。 展开更多
关键词 ETL 数据仓库 数据质量 元数据
下载PDF
数据质量评估方法研究 被引量:90
10
作者 杨青云 赵培英 +2 位作者 杨冬青 唐世渭 童云海 《计算机工程与应用》 CSCD 北大核心 2004年第9期3-4,15,共3页
数据质量管理已经成为当今数据管理的关键问题,并得到了广泛的研究和应用。数据质量评估作为数据质量管理中的必要过程和基础部分,目前缺乏一种定量的系统的方法。针对数据质量评估中的这一问题,该文介绍了一些基本的数据质量评估指标,... 数据质量管理已经成为当今数据管理的关键问题,并得到了广泛的研究和应用。数据质量评估作为数据质量管理中的必要过程和基础部分,目前缺乏一种定量的系统的方法。针对数据质量评估中的这一问题,该文介绍了一些基本的数据质量评估指标,提出了一种数据质量评估模型,并阐述了该模型的构造技术和计算方法。 展开更多
关键词 数据质量数据质量评估 数据质量评估模型
下载PDF
利用光谱反射率估算叶片生化组分和籽粒品质指标研究 被引量:83
11
作者 王纪华 黄文江 +2 位作者 赵春江 杨敏华 王之杰 《遥感学报》 EI CSCD 北大核心 2003年第4期277-284,共8页
对可见光至短波红外波段 (35 0— 2 5 0 0nm)冬小麦田间冠层光谱反射率与叶片含氮量间的关系进行了相关分析。结果表明 ,82 0— 110 0nm波段的光谱反射率与叶片含氮量极显著正相关 ;115 0— 130 0nm波段的光谱反射率与叶片含氮量显著正... 对可见光至短波红外波段 (35 0— 2 5 0 0nm)冬小麦田间冠层光谱反射率与叶片含氮量间的关系进行了相关分析。结果表明 ,82 0— 110 0nm波段的光谱反射率与叶片含氮量极显著正相关 ;115 0— 130 0nm波段的光谱反射率与叶片含氮量显著正相关 ,以上两波段为叶片全氮的敏感波段。对各生育时期叶片全氮与其他生化组分的关系进行了回归分析 ,并建立了相关的回归方程 ,显著性检验结果表明 ,方程具有较高的可靠性。小麦的叶片含氮量可以估算其它生化组分及干物质指标含量 ,开花期叶片含氮量可用来估测籽粒蛋白质和干面筋等品质指标含量。 展开更多
关键词 光谱反射率 冬小麦 叶片含氮量 生化组分 估算 籽粒品质指标 品质监测 遥感监测
下载PDF
北欧气象观测资料的质量控制 被引量:94
12
作者 熊安元 《气象科技》 北大核心 2003年第5期314-320,共7页
气象观测资料的质量对气象及相关领域的研究具有重要影响 ,如何进行气象观测资料的质量控制 ,确保资料的代表性和准确性 ,是气象资料工作者迫切需要解决的科学问题。气象观测资料的质量控制技术和方法各国均不相同 ,北欧 5国的合作研究... 气象观测资料的质量对气象及相关领域的研究具有重要影响 ,如何进行气象观测资料的质量控制 ,确保资料的代表性和准确性 ,是气象资料工作者迫切需要解决的科学问题。气象观测资料的质量控制技术和方法各国均不相同 ,北欧 5国的合作研究成果具有先进性和很好的代表性。简要介绍了北欧国家对实时和非实时气象资料进行质量控制的流程 ,所采用的方法、技术等。北欧气象资料从观测台站到资料中心经历了QC0、QC1、QC2和HQC4个级别的质量控制流程 ;质量控制方法可分为单站质量控制和空间质量控制两大类 ,每类方法又分为不同的检查方案 ; 展开更多
关键词 气象观测 质量控制 气象资料 质量标识
下载PDF
数据素养能力指标体系构建及高校师生数据素养能力现状调查与分析 被引量:91
13
作者 隆茜 《图书馆》 CSSCI 北大核心 2015年第12期51-56,62,共7页
文章在调研国内外文献的基础上,构建了数据素养能力评价维度与具体指标体系,并以此调研了高校不同群体(大学教师、博士生、硕士生、本科生)的数据素养能力现状。研究发现不同群体在数据素养能力上具有显著性差异,高校图书馆可通过设置... 文章在调研国内外文献的基础上,构建了数据素养能力评价维度与具体指标体系,并以此调研了高校不同群体(大学教师、博士生、硕士生、本科生)的数据素养能力现状。研究发现不同群体在数据素养能力上具有显著性差异,高校图书馆可通过设置数据馆员岗位、建设数据服务网页及开展差异化的数据素养教育等方式提升高校师生的数据素养能力。 展开更多
关键词 数据素养 能力 维度 评价 指标体系
下载PDF
GIS不确定性框架体系与数据不确定性研究方法 被引量:64
14
作者 邬伦 于海龙 +1 位作者 高振纪 承继成 《地理学与国土研究》 CSSCI CSCD 北大核心 2002年第4期1-5,共5页
该文分析了GIS数据不确定性研究现状,总结了GIS中数据不确定性的研究问题,提出GIS中数据不确定的框架体系,并结合非线性复杂科学的研究方法,对GIS数据不确定性的研究方法进行了分析、归纳和阐述。
关键词 GIS 数据质量 不确定性 地理信息系统 空间统计理论
下载PDF
部分地面要素历史基础气象资料质量检测 被引量:83
15
作者 任芝花 余予 +1 位作者 邹凤玲 许艳 《应用气象学报》 CSCD 北大核心 2012年第6期739-747,共9页
为深入了解地面基础气象资料中存在的问题,进一步提高资料质量,综合利用国家级和省级气象资料部门存储的1951—2009年2474个国家级地面气象站观测的气温、气压、水汽压、相对湿度、风向、风速、降水量7种要素信息化基础数据,检测并分析... 为深入了解地面基础气象资料中存在的问题,进一步提高资料质量,综合利用国家级和省级气象资料部门存储的1951—2009年2474个国家级地面气象站观测的气温、气压、水汽压、相对湿度、风向、风速、降水量7种要素信息化基础数据,检测并分析了数据中存在的问题。结果显示:国家级和省级气象部门存储的资料中均存在大量与实际观测数据不符的信息化问题,包括资料的替代问题、要素数据类似缺测问题以及数据录入错误等;还存在国家级和省级气象部门保存的基准基本站资料不一致现象,包括资料序列长短不同、对外服务时提供自动还是人工观测数据不一致、更正不同步造成的数据不同等。该文针对上述资料问题给出了详细的检测方法及检测结果。为了确保数据的正确性,有必要在此次数据质量检测经验的基础上,对所有历史月报数据文件中的所有要素观测值进行彻底检测与更正。 展开更多
关键词 地面 基础气象资料 数据质量 质量检测
下载PDF
城市街道空间品质大规模量化测度研究进展 被引量:78
16
作者 龙瀛 唐婧娴 《城市规划》 CSSCI CSCD 北大核心 2019年第6期107-114,共8页
伴随我国人居环境建设从重“量”走向提“质”,城市建成环境的科学评估与定量研究亟待展开,街道作为重要的公共领域,其空间品质与活力成为重要的方向之一。本文从街道空间品质的概念、大规模量化方法和空间品质测度方法三个方面切入,梳... 伴随我国人居环境建设从重“量”走向提“质”,城市建成环境的科学评估与定量研究亟待展开,街道作为重要的公共领域,其空间品质与活力成为重要的方向之一。本文从街道空间品质的概念、大规模量化方法和空间品质测度方法三个方面切入,梳理了国内、国外街道空间品质量化研究方法的进展。总体而言,街道物质空间的测度在不同的方面已有一定的方法积累、但少有多种方法的集成应用,利用可获得性高的街景图片进行街道空间测度是国际上新兴的研究方向,空间品质的影响机理研究还有待深入,已有研究少有以科学认识为基础的规划设计方法讨论。 展开更多
关键词 大数据 品质 测度 建成环境 公共空间
下载PDF
现阶段中国的总和生育率究竟是多少?——来自户籍登记数据的新证据 被引量:76
17
作者 翟振武 陈佳鞠 李龙 《人口研究》 CSSCI 北大核心 2015年第6期22-34,共13页
现阶段中国的总和生育率究竟是多少?要想得到这一问题的可靠答案,数据质量是关键。2015年户籍登记数据中5~7岁组人口数是目前可获最新且最接近这3个队列实际人口情况的数据,基于这一数据估计2008~2010年中国育龄妇女的总和生育率... 现阶段中国的总和生育率究竟是多少?要想得到这一问题的可靠答案,数据质量是关键。2015年户籍登记数据中5~7岁组人口数是目前可获最新且最接近这3个队列实际人口情况的数据,基于这一数据估计2008~2010年中国育龄妇女的总和生育率能够得到比较可靠的结果。文章估计得出2008~2010年间中国的总和生育率大致在1.63~1.66之间,整体处于平缓波动之中。而且由于户籍登记数据在低龄组不可避免地存在漏登现象,因而在此估计出的总和生育率水平是对2008—2010年间中国育龄妇女生育“真水平”的低限估计,由此可以推断出2008年、2009年和2010年中国的总和生育率至少应该在1.66、1.66和1.63以上。 展开更多
关键词 生育水平 总和生育率 户籍登记数据 数据质量
原文传递
城市道路网规划指标体系 被引量:58
18
作者 陆建 王炜 《交通运输工程学报》 EI CSCD 2004年第4期62-67,共6页
分析了城市道路网质与量的功能,研究了城市道路网的规划指标体系,提出城市道路网规划指标体系宜划分为空间指标体系和交通质量指标体系两大类,并分别确定了7个空间指标和3个交通质量指标的定义及量化方法。应用结果表明,指标量化计算中... 分析了城市道路网质与量的功能,研究了城市道路网的规划指标体系,提出城市道路网规划指标体系宜划分为空间指标体系和交通质量指标体系两大类,并分别确定了7个空间指标和3个交通质量指标的定义及量化方法。应用结果表明,指标量化计算中所需要的基础数据在城市道路网规划阶段便于获取,便于不同城市结合自身特点确定规划指标。 展开更多
关键词 交通规划 城市道路网 规划指标 量化方法
下载PDF
大数据环境下的数据治理框架研究及应用 被引量:68
19
作者 杨琳 高洪美 +1 位作者 宋俊典 张绍华 《计算机应用与软件》 2017年第4期65-69,共5页
大数据技术及应用创新促进了数据的业务化。从数据中发现问题到解决问题、从业务支撑到业务创新、从商业智能到决策指引,数据与业务相伴相生,大数据环境下的机遇与风险共存。通过对当前国内外数据治理理论、方法和新的应用需求分析,提... 大数据技术及应用创新促进了数据的业务化。从数据中发现问题到解决问题、从业务支撑到业务创新、从商业智能到决策指引,数据与业务相伴相生,大数据环境下的机遇与风险共存。通过对当前国内外数据治理理论、方法和新的应用需求分析,提出大数据环境下的数据治理框架,包含数据治理目标、治理保障、治理域和治理方法论等。并分析大数据治理框架的应用,对组织开展大数据环境下的数据治理具有重要的参考价值和意义。 展开更多
关键词 大数据 数据治理框架 数据质量 数据安全隐私
下载PDF
便携式X射线荧光光谱法与原子吸收/原子荧光法测定土壤重金属的对比研究 被引量:67
20
作者 冉景 王德建 +3 位作者 王灿 薄录吉 郑继成 姚利鹏 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2014年第11期3113-3118,共6页
应用便携式X射线荧光光谱仪(PXRF)分别在原位和实验室条件下对53个土壤样品中的Cu,Pb,As,Cr,Ni和Zn等重金属进行测定,并与原子吸收/原子荧光法测定值进行对比,建立一元线性回归模型分析PXRF数据质量。通过测定土壤样品原位含水量并选取... 应用便携式X射线荧光光谱仪(PXRF)分别在原位和实验室条件下对53个土壤样品中的Cu,Pb,As,Cr,Ni和Zn等重金属进行测定,并与原子吸收/原子荧光法测定值进行对比,建立一元线性回归模型分析PXRF数据质量。通过测定土壤样品原位含水量并选取部分样品进行室内水分定量实验,分析土壤水分对于PXRF测定结果的影响。结果表明,PXRF检出限分别为Cu:10.6mg·kg-1,Pb:8.1mg·kg-1,As:5.7mg·kg-1,Cr:22.5mg·kg-1,Ni:21.6mg·kg-1,Zn:10.4mg·kg-1;原位测定时Pb,Cr,Ni和Zn可以达到定量水平;经过风干磨细处理,Cu,Pb,Cr,Ni和Zn在实验室条件下可以达到定量水平,说明X射线荧光光谱法适用于土壤重金属的快速测定与评价。水分对于PXRF测定结果具有"稀释"作用,原位条件下土壤含水量<15%时与>25%时样品的平均相对误差分别为-17%与-31%;实验室条件下土壤含水量从风干土水平提高到30%,测定的平均相对误差由10%变为-24%。土壤水分升高可能会导致数据质量和准确性降低,建议原位测定时控制土壤含水量在25%以内。 展开更多
关键词 X射线荧光 土壤重金属 土壤水分 线性回归 数据质量
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部