期刊文献+
共找到717篇文章
< 1 2 36 >
每页显示 20 50 100
数据素养能力指标体系构建及高校师生数据素养能力现状调查与分析 被引量:93
1
作者 隆茜 《图书馆》 CSSCI 北大核心 2015年第12期51-56,62,共7页
文章在调研国内外文献的基础上,构建了数据素养能力评价维度与具体指标体系,并以此调研了高校不同群体(大学教师、博士生、硕士生、本科生)的数据素养能力现状。研究发现不同群体在数据素养能力上具有显著性差异,高校图书馆可通过设置... 文章在调研国内外文献的基础上,构建了数据素养能力评价维度与具体指标体系,并以此调研了高校不同群体(大学教师、博士生、硕士生、本科生)的数据素养能力现状。研究发现不同群体在数据素养能力上具有显著性差异,高校图书馆可通过设置数据馆员岗位、建设数据服务网页及开展差异化的数据素养教育等方式提升高校师生的数据素养能力。 展开更多
关键词 数据素养 能力 维度 评价 指标体系
下载PDF
数据仓库中维的建模和查询 被引量:22
2
作者 李琪白 英彩 《计算机研究与发展》 EI CSCD 北大核心 2002年第5期612-618,共7页
维是数据仓库的重要组成部分 ,也是 OL AP的主要查询对象 ,但标准的星形 /雪花模型对实际应用中维的建模存在明显缺陷 ,而且 SQL 语言对维实体、维层次结构不能提供直接、有效的支持 ,使得 OL AP查询的表达较为繁琐、冗长 .为此 ,提出... 维是数据仓库的重要组成部分 ,也是 OL AP的主要查询对象 ,但标准的星形 /雪花模型对实际应用中维的建模存在明显缺陷 ,而且 SQL 语言对维实体、维层次结构不能提供直接、有效的支持 ,使得 OL AP查询的表达较为繁琐、冗长 .为此 ,提出了一个基于关系数据库的 SQL( D)数据模型 ,它给出了层次链、层次树、维的正式定义 ,支持不平衡、异构的维层次结构 ;并对 SQL 作了相应的扩充 ,支持维的定义、维层次比较、维的引用和维聚集层次的指定 ,使得原先冗长、复杂的 OL AP查询表达式变得简洁、易于理解 . 展开更多
关键词 数据仓库 建模 查询 层次结构 联机分析处理 关系数据库 数据模型
下载PDF
健康医疗大数据中隐私利益的群体维度 被引量:46
3
作者 刘士国 熊静文 《法学论坛》 CSSCI 北大核心 2019年第3期125-135,共11页
大数据背景下健康医疗信息的结构性变化,使原本孤立的个体隐私利益彼此关联,同时生发出群体层面的隐私形态。现行健康医疗隐私规则所提供的个体隐私保护机制几近失效,且缺乏群体隐私的理论框架,暴露出个人主义保护观念的弊端。为适应大... 大数据背景下健康医疗信息的结构性变化,使原本孤立的个体隐私利益彼此关联,同时生发出群体层面的隐私形态。现行健康医疗隐私规则所提供的个体隐私保护机制几近失效,且缺乏群体隐私的理论框架,暴露出个人主义保护观念的弊端。为适应大数据下健康医疗隐私利益的新特征,识别隐私利益的群体维度可以作为一项有益的尝试。生命伦理从个体自治到社会合作的转向、健康医疗数据的公共属性以及群体隐私利益的逻辑自洽,为此构想提供了正当性基础。识别隐私利益的群体维度,意味着一方面将个人隐私权放在群体语境中实现,个体需要适当地降低隐私期待,并弱化对健康医疗数据使用的个体同意与持续控制;另一方面认可群体隐私利益的存在,将对个人可识别健康信息的关注转移到统计学意义上的群体可识别健康信息上来。 展开更多
关键词 健康医疗 大数据 隐私利益 个人主义 群体维度
原文传递
地质数据的分形结构 被引量:32
4
作者 孟宪国 赵鹏大 《地球科学(中国地质大学学报)》 EI CAS CSCD 北大核心 1991年第2期207-212,共6页
本文以空间序列数据为基础建立了相空间,根据关联函数探讨了地质数据的分形结构,鉴别了空间吸引子的存在性并给出其分形维数,研究了地质数据的混沌特性。
关键词 地质数据 分形结构 空间序列
下载PDF
数据驱动的电力系统运行方式分析 被引量:41
5
作者 侯庆春 杜尔顺 +3 位作者 田旭 刘飞 张宁 康重庆 《中国电机工程学报》 EI CSCD 北大核心 2021年第1期1-12,共12页
随着电网中高比例可再生能源及电力电子设备渗透率的提高,电力系统的运行形态将发生深刻变化,基于经验选择的电力系统方式分析,越来越难以应对电力系统运行、规划、保护和稳定分析的要求。为此,该文基于电力系统时序运行模拟数据,提出... 随着电网中高比例可再生能源及电力电子设备渗透率的提高,电力系统的运行形态将发生深刻变化,基于经验选择的电力系统方式分析,越来越难以应对电力系统运行、规划、保护和稳定分析的要求。为此,该文基于电力系统时序运行模拟数据,提出了数据驱动的电力系统运行方式及其形态变化分析方法。该方法首先对高维运行模拟数据进行预处理,通过聚类和紧密度指标饱和点分别辨识典型运行模式及其数量,利用t-SNE降维算法提取主要特征并可视化运行方式的时空变化规律;接着,从定量的角度,提出了描述电力系统运行方式分散性、季节一致性、时序多变性的评估指标。最后,以甘肃电网实际算例系统分析了高比例可再生能源对电力系统运行方式的影响,验证了文中数据驱动方法的有效性。实验结果表明,电力系统运行方式的分散性及典型运行方式的数量会随着可再生能源渗透率的上升而迅速增加。此外,电力系统运行方式与季节的耦合性逐渐减弱。 展开更多
关键词 数据驱动 高比例可再生能源 电力系统运行方式 电力系统运行模拟 降维 聚类
下载PDF
我国地方政府开放数据的数据质量评价研究——以北京、广州和哈尔滨为例 被引量:40
6
作者 李晓彤 翟军 郑贵福 《情报杂志》 CSSCI 北大核心 2018年第6期141-145,共5页
[目的/意义]随着我国政府开放数据的发展,质量问题日益凸现。而对数据质量的微观评价,不仅是用户选择数据集的依据,也是提供者质量管理的基础。[方法/过程]通过对北京、广州和哈尔滨三地1900多个数据集的调查分析,归纳出影响数据可用性... [目的/意义]随着我国政府开放数据的发展,质量问题日益凸现。而对数据质量的微观评价,不仅是用户选择数据集的依据,也是提供者质量管理的基础。[方法/过程]通过对北京、广州和哈尔滨三地1900多个数据集的调查分析,归纳出影响数据可用性的16类质量问题,进而构建7个质量维度和度量指标,计算数据平台中全部数据集各个质量指标的平均值和标准差。[结果/结论]各地在完整性、准确性和一致性等维度上总体得分偏低,且不同数据集之间的质量差异较大,用户在使用数据之前应进行质量检查,政府部门更要采取措施提升数据质量。 展开更多
关键词 开放政府数据 数据质量 质量评价 质量维度 度量指标
下载PDF
Scientific design and preliminary results of three-dimensional variational data assimilation system of GRAPES 被引量:33
7
作者 XUE JiShan ZHUANG ShiYu +4 位作者 ZHU GuoFu ZHANG Hua LIU ZhiQuan LIU Yan ZHUANG ZhaoRong 《Chinese Science Bulletin》 SCIE EI CAS 2008年第22期3446-3457,共12页
The scientific design and preliminary results of the data assimilation component of the Global-Regional Prediction and Assimilation System (GRAPES) recently developed in China Meteorological Administration (CMA) are p... The scientific design and preliminary results of the data assimilation component of the Global-Regional Prediction and Assimilation System (GRAPES) recently developed in China Meteorological Administration (CMA) are presented in this paper. This is a three-dimensional variational (3DVar) assimilation system set up on global and regional grid meshes favorable for direct assimilation of the space-based remote sensing data and matching the frame work of the prediction model GRAPES. The state variables are assumed to decompose balanced and unbalanced components. By introducing a simple transformation from the state variables to the control variables with a recursive or spectral filter, the convergence rate of iteration for minimization of the cost function in 3DVar is greatly accelerated. The definition of dynamical balance depends on the characteristic scale of the circulation considered. The ratio of the balanced to the unbalanced parts is controlled by the prescribed statistics of background errors. Idealized trials produce the same results as the analytic solution. The results of real data case studies show the capability of the system to improve analysis compared to the traditional schemes. Finally, further development of the system is discussed. 展开更多
关键词 数值天气预报 气象学 天气预测 气象分析
原文传递
高维类别属性数据流离群点快速检测算法 被引量:21
8
作者 周晓云 孙志挥 +1 位作者 张柏礼 杨宜东 《软件学报》 EI CSCD 北大核心 2007年第4期933-942,共10页
提出类别属性数据流数据离群度量——加权频繁模式离群因子(weighted frequent pattern outlier factor,简称WFPOF),并在此基础上给出一种快速数据流离群点检测算法FODFP-Stream(fast outlier detection for high dimensional categoric... 提出类别属性数据流数据离群度量——加权频繁模式离群因子(weighted frequent pattern outlier factor,简称WFPOF),并在此基础上给出一种快速数据流离群点检测算法FODFP-Stream(fast outlier detection for high dimensional categorical data streams based on frequent pattern).该算法通过动态发现和维护频繁模式来计算离群度,能够有效地处理高维类别属性数据流,并可进一步扩展到数值属性和混合属性数据流.对仿真数据集和真实数据集的实验检测均验证该算法具有良好的适用性和有效性. 展开更多
关键词 数据流 离群点检测 频繁模式 高维 概念转移
下载PDF
国家治理的大数据赋能:向度与限度 被引量:26
9
作者 陈潭 《中南大学学报(社会科学版)》 CSSCI 北大核心 2021年第5期133-143,共11页
作为国家治理函数中的重要技术变量,大数据的嵌入能够更为精准地探寻国家治理规则和社会运行规律,从而有利于加强和提升国家治理的效能。大数据赋能国家治理的向度主要体现在两个方面:在国家治理结构方面,助力治理主体走向协同化、治理... 作为国家治理函数中的重要技术变量,大数据的嵌入能够更为精准地探寻国家治理规则和社会运行规律,从而有利于加强和提升国家治理的效能。大数据赋能国家治理的向度主要体现在两个方面:在国家治理结构方面,助力治理主体走向协同化、治理层级走向扁平化和治理空间走向透明化;在国家治理功能方面,助力政府决策走向科学化、社会治理走向精细化和公共服务走向高效化。然而,作为一种价值中立的技术工具,大数据驱动国家治理的实践也存在着数据主权风险、数据安全风险、数据垄断风险。由此,在运用大数据技术加强和完善国家治理时,我们必须维护数据主权、反对数据霸权;必须维护数据安全、保护数据隐私;必须坚持数据共享、强化数据协同。 展开更多
关键词 国家治理 数据赋能 价值向度 风险规避
下载PDF
基于面板数据的灰色指标关联模型构建及其应用 被引量:22
10
作者 党耀国 尚中举 +1 位作者 王俊杰 冯宇 《控制与决策》 EI CSCD 北大核心 2019年第5期1077-1084,共8页
针对现有面板数据灰色关联模型中对象的排列顺序变换引起灰色关联序不一致的缺陷,提出一种基于面板数据的新型灰色指标关联模型.考虑到面板数据的时间维度和对象维度差异特征,在时间维上利用增量表征指标的发展水平,对象维上引入离差表... 针对现有面板数据灰色关联模型中对象的排列顺序变换引起灰色关联序不一致的缺陷,提出一种基于面板数据的新型灰色指标关联模型.考虑到面板数据的时间维度和对象维度差异特征,在时间维上利用增量表征指标的发展水平,对象维上引入离差表征指标的分布特征,同时将两个维度上的方向差异作为正负关联判断依据,构建时间维度和对象维度的关联系数,得到面板数据的灰色指标关联模型,并对模型的唯一性、对称性和可比性等性质进行证明.最后将该模型应用于苏南五市空气质量与主要污染物浓度的关联分析中,验证了灰色指标关联度不受对象排列顺序的影响,且能够反映指标间的正负关联关系. 展开更多
关键词 灰色关联模型 面板数据 时间维度 对象维度 增量 离差 大气污染
原文传递
基于改进DCGAN的数据增强方法 被引量:22
11
作者 甘岚 沈鸿飞 +1 位作者 王瑶 张跃进 《计算机应用》 CSCD 北大核心 2021年第5期1305-1313,共9页
针对小样本数据在深度学习中训练难的问题,为提高DCGAN训练效率,提出了一种改进的DCGAN算法对小样本数据进行增强。首先,使用Wasserstein距离替换原模型中的损失模型;其次,在生成网络和判别网络中加入谱归一化,以得到稳定的网络结构;最... 针对小样本数据在深度学习中训练难的问题,为提高DCGAN训练效率,提出了一种改进的DCGAN算法对小样本数据进行增强。首先,使用Wasserstein距离替换原模型中的损失模型;其次,在生成网络和判别网络中加入谱归一化,以得到稳定的网络结构;最后,通过极大似然估计算法和实验估算得到样本的最佳噪声输入维度,从而提高生成样本的多样性。在MNIST、Celeb A和Cartoon这三个数据集上的实验结果表明:改进后的DCGAN所生成样本的清晰度以及识别率比改进前均得到了明显提高,其中平均识别率在这几个数据集上分别提高了8.1%、16.4%和16.7%,几种清晰度评价指标在各数据集上均有不同程度的提高。可见该方法能够有效地实现小样本数据增强。 展开更多
关键词 小样本 数据增强 DCGAN Wasserstein距离 谱归一化 内在维数
下载PDF
基于关系数据库构造多维数据模型 被引量:7
12
作者 刘义 李亮 《计算机工程》 EI CAS CSCD 北大核心 2000年第9期21-22,114,共3页
该文重点研究基于关系型数据库如何组织数据以满足多维分析的需要,即如何对星形模式的维表进行分解,分解成多个具有层次关系的、标准化的、低粒度的维表,以易于实现由上而下(drill down)及由下而上(roll uhp)的... 该文重点研究基于关系型数据库如何组织数据以满足多维分析的需要,即如何对星形模式的维表进行分解,分解成多个具有层次关系的、标准化的、低粒度的维表,以易于实现由上而下(drill down)及由下而上(roll uhp)的数据挖掘(data mining). 展开更多
关键词 多维数据 关系数据库 数据模型
下载PDF
计算法学:展开维度、发展趋向与视域前瞻 被引量:19
13
作者 于晓虹 《现代法学》 CSSCI 北大核心 2020年第1期158-178,共21页
在大数据时代的开放结构中,计算法学延伸了实证法学研究的知性体系和学科范畴,使法学研究迈向了更为纵深、更为宽广的畛域。计算法学在方法论上的基本立场深嵌于法学与社会科学的交叉研究范式中,如司法政治学、法社会学、犯罪学等。在... 在大数据时代的开放结构中,计算法学延伸了实证法学研究的知性体系和学科范畴,使法学研究迈向了更为纵深、更为宽广的畛域。计算法学在方法论上的基本立场深嵌于法学与社会科学的交叉研究范式中,如司法政治学、法社会学、犯罪学等。在计算法学方兴未艾之际,对这些学科研究主题及其理念分殊进行梳理和总结也就尤有意义。从既有的域外研究成果来看,计算法学研究的方法运用逐渐趋向科学成熟,研究视域不断拓宽,数据驱动与算法驱动多维推进,研究模式呈现出跨学科合作趋向。计算法学研究虽然在中国尚处于起步阶段,但是法律实务界和各大高校追摹大数据前沿的脚步从未停歇,计算法学在中国未来的发展也是可期可盼的。 展开更多
关键词 计算法学 法学实证研究 大数据 展开维度
下载PDF
基于核主成分分析的数据流降维研究 被引量:17
14
作者 高宏宾 侯杰 李瑞光 《计算机工程与应用》 CSCD 2013年第11期105-109,共5页
分析了数据流降维算法PCA和KPCA的原理和实现方法。针对在大型数据集上PCA线性降维无法有效实现降维且KPCA的降维效率差,提出了一种新的降维策略GKPCA算法。该算法将数据集先分组,对每一组执行KPCA,然后过滤重新组合数据集,再次应用KPC... 分析了数据流降维算法PCA和KPCA的原理和实现方法。针对在大型数据集上PCA线性降维无法有效实现降维且KPCA的降维效率差,提出了一种新的降维策略GKPCA算法。该算法将数据集先分组,对每一组执行KPCA,然后过滤重新组合数据集,再次应用KPCA算法,达到简化样本空间,降低了时间复杂度和空间复杂度。实验分析表明,GKPCA算法不仅能取得良好的降维效果,而且时间消耗少。 展开更多
关键词 核主成分分析 数据流 降维
下载PDF
偏最小二乘法降维在微阵列数据判别分析中的应用 被引量:15
15
作者 钱国华 荀鹏程 +1 位作者 陈峰 于浩 《中国卫生统计》 CSCD 北大核心 2007年第2期120-123,共4页
目的探讨微阵列数据的判别分析方法。方法首先采用偏最小二乘法对高维数据降维,然后再用Fisher’s线性判别。文中同时介绍了偏最小二乘法的基本原理、基本算法,讨论了成分数选择等问题,并以实际微阵列数据展示了其效果。结果偏最小二乘... 目的探讨微阵列数据的判别分析方法。方法首先采用偏最小二乘法对高维数据降维,然后再用Fisher’s线性判别。文中同时介绍了偏最小二乘法的基本原理、基本算法,讨论了成分数选择等问题,并以实际微阵列数据展示了其效果。结果偏最小二乘法降维不但实现了数据的可视化,而且取得了较好的后期判别效果。结论偏最小二乘法是一种新的实用的降维方法,可用于微阵列数据判别分析的前期降维。 展开更多
关键词 偏最小二乘法 微阵列数据 降维 判别分析
下载PDF
一种基于区域划分的数据流子空间聚类方法 被引量:15
16
作者 于翔 印桂生 +1 位作者 许宪东 王建伟 《计算机研究与发展》 EI CSCD 北大核心 2014年第1期88-95,共8页
数据流子空间聚类的主要目的是在合理的时间段内准确找到数据流特征子空间中的聚类.现有的数据流子空间聚类算法受参数影响较大,通常要求预先给出聚类数目或特征子空间,且聚类结果不能及时反映数据流的变化情况.针对以上缺陷,提出一种... 数据流子空间聚类的主要目的是在合理的时间段内准确找到数据流特征子空间中的聚类.现有的数据流子空间聚类算法受参数影响较大,通常要求预先给出聚类数目或特征子空间,且聚类结果不能及时反映数据流的变化情况.针对以上缺陷,提出一种新的数据流子空间聚类算法SC-RP,SC-RP无需预先给出聚类数目或特征子空间,对孤立点不敏感,可实现快速聚类,通过区域树结构记录数据流的变化并及时更新统计信息,进而根据数据流的变化调整聚类结果.通过在真实数据集与仿真数据集上的实验,证明了SC-RP在聚类精度和速度上优于现有的数据流子空间聚类算法,且对聚类数目及数据维度均具有良好的伸缩性. 展开更多
关键词 数据挖掘 数据流 子空间聚类 特征选择 维度约简
下载PDF
基于统计方法的数据挖掘算法研究 被引量:6
17
作者 王政霞 黄大荣 《湖北民族学院学报(自然科学版)》 CAS 2005年第1期42-44,共3页
在统计方法的基础上提出了一种根据数据集合本身的统计特性数据挖掘算法.该算法利用数据本身的统计特性对数据仓库中的数据进行分析,在给定重要性比例程度的前提下,经过系列的统计运算,得到简化的数据仓库集,并根据分析得到了数据挖掘... 在统计方法的基础上提出了一种根据数据集合本身的统计特性数据挖掘算法.该算法利用数据本身的统计特性对数据仓库中的数据进行分析,在给定重要性比例程度的前提下,经过系列的统计运算,得到简化的数据仓库集,并根据分析得到了数据挖掘算法的流程图.提出了比例大小关系函数,反映了数据自身的统计特性,分析表明:这种算法极大的提高了数据的有效水平. 展开更多
关键词 数据仓库 统计特性 数据挖掘 量纲的统一
下载PDF
通过数据挖掘技术预测学生学习成绩 被引量:14
18
作者 张兴科 王浩 《科技信息》 2007年第22期43-43,102,共2页
介绍了数据挖掘的基本知识,数据挖掘的功能与方法,并通过数据挖掘,找出了影响学生学习成绩的关键环节。
关键词 数据挖掘 知识 决策树 学习
下载PDF
基于星型模型的数据仓库中维变技术的研究 被引量:7
19
作者 徐 骥 陶树平 《计算机工程》 CAS CSCD 北大核心 2002年第4期91-93,208,共4页
描述了基于星型模型的数据仓库中维表的纠错改变和自然改变的一些特征,分析了由此引发的问题,提出并实现了一种新的解决方法,并给出实例验证其可行性。
关键词 数据仓库 星型模型 维变 增量更新 数据库
下载PDF
谷歌流感趋势的成功与失误 被引量:13
20
作者 秦磊 谢邦昌 《统计研究》 CSSCI 北大核心 2016年第2期107-110,共4页
大数据时代下机遇与挑战并存,如何基于传统方法去处理大数据引人深思。本文以谷歌流感趋势(GFT)为案例,介绍了大数据在疾病疫情监测方面的主要技术及相关成果,阐述了大数据在使用中的关键问题,并结合复杂的统计学工具给出了一些改进措... 大数据时代下机遇与挑战并存,如何基于传统方法去处理大数据引人深思。本文以谷歌流感趋势(GFT)为案例,介绍了大数据在疾病疫情监测方面的主要技术及相关成果,阐述了大数据在使用中的关键问题,并结合复杂的统计学工具给出了一些改进措施。谷歌流感趋势的成功取决于相关关系的应用,其失误却来源于模型的构造、因果关系和相关关系的冲突等问题。谷歌流感趋势案例的分析与启示对政府今后在大数据解决方案中有重要的理论和实践意义。 展开更多
关键词 谷歌流感趋势 大数据 小数据 降维 回归预测
下载PDF
上一页 1 2 36 下一页 到第
使用帮助 返回顶部