期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
基于群数据科学研究的报告规范:TRIPOD‑Cluster指南清单解读及拓展
1
作者 韩莎莎 吴鹏 +8 位作者 王则一 崔逸凡 杨浩翔 周正元 Larry Han 杨林 贾金柱 邵瑞太 王辰 《数字医学与健康》 2023年第1期12-21,共10页
基于群数据的科学研究在医学健康照护领域备受关注。群数据指由多个数据集组成的数据集群。群数据具有明显的群特性,即不同数据集间个体的异质性。为了规范基于群数据的研究报告模式,研究人员于2022年11月在The BMJ发表了“Transparent ... 基于群数据的科学研究在医学健康照护领域备受关注。群数据指由多个数据集组成的数据集群。群数据具有明显的群特性,即不同数据集间个体的异质性。为了规范基于群数据的研究报告模式,研究人员于2022年11月在The BMJ发表了“Transparent reporting of multivariable prediction models developed or validated using clustered data:TRIPOD‑Cluster checklist”(TRIPOD‑Cluster指南清单)。本文对该指南清单的关键内容进行了解读和评述,旨在促进对该指南清单的正确理解和应用。同时,从基于群数据模型的异质性和因果可解释性两个方面对该指南清单进行了拓展和延伸。 展开更多
关键词 群数据 研究报告规范 TRIPOD‑cluster 异质性 因果可解释性
原文传递
用于精准预测的人工蜂群聚类数据挖掘算法研究 被引量:1
2
作者 金红军 《数字技术与应用》 2020年第10期95-97,共3页
为了提高数据挖掘算法的查全率,为精准预测工作提供更加精准的数据支持,利用人工蜂群聚类技术在传统数据挖掘算法的基础上进行优化设计。针对不同的精准预测任务准备对应的数据样本,并通过选择、预处理和数据转换三个步骤,实现对初始样... 为了提高数据挖掘算法的查全率,为精准预测工作提供更加精准的数据支持,利用人工蜂群聚类技术在传统数据挖掘算法的基础上进行优化设计。针对不同的精准预测任务准备对应的数据样本,并通过选择、预处理和数据转换三个步骤,实现对初始样本数据的处理。利用人工蜂群聚类技术分类样本数据,并剔除离群数据。在设置关联规则的约束下,得出数据挖掘结果。通过算法性能的测试对比实验得出结论:与传统的数据挖掘算法相比,人工蜂群聚类数据挖掘算法的查全率提高了1.3%,将其应用到精准预测工作中,可以有效的降低预测误差。 展开更多
关键词 精准预测 人工蜂群 聚类数据 数据挖掘算法
下载PDF
Modeling the Evolution of Chorus Waves into Hiss Waves in the Magnetosphere
3
作者 贺艺华 周庆华 +4 位作者 杨昶 周晓萍 刘斯 唐立军 肖伏良 《Plasma Science and Technology》 SCIE EI CAS CSCD 2014年第7期657-660,共4页
In this study, we analyze Cluster observations of whistler-mode chorus and hiss waves during the event of August 19-21, 2006. Chorus is present outside the plasmasphere and hiss occurs inside the plasmasphere. Using a... In this study, we analyze Cluster observations of whistler-mode chorus and hiss waves during the event of August 19-21, 2006. Chorus is present outside the plasmasphere and hiss occurs inside the plasmasphere. Using a recently constructed plasma boundary layer model, we perform a ray-tracing study on the propagation of chorus. Numerical results show that chorus can penetrate into the plasmasphere through the plasma boundary layer, evolving into hiss. The current data analysis and modeling provide a further observational support for the previous findings that chorus is the origin of plasmaspheric hiss. 展开更多
关键词 cluster data CHORUS hiss ray tracing
下载PDF
Shrinkage Estimation of Semiparametric Model with Missing Responses for Cluster Data
4
作者 Mingxing Zhang Jiannan Qiao +1 位作者 Huawei Yang Zixin Liu 《Open Journal of Statistics》 2015年第7期768-776,共9页
This paper simultaneously investigates variable selection and imputation estimation of semiparametric partially linear varying-coefficient model in that case where there exist missing responses for cluster data. As is... This paper simultaneously investigates variable selection and imputation estimation of semiparametric partially linear varying-coefficient model in that case where there exist missing responses for cluster data. As is well known, commonly used approach to deal with missing data is complete-case data. Combined the idea of complete-case data with a discussion of shrinkage estimation is made on different cluster. In order to avoid the biased results as well as improve the estimation efficiency, this article introduces Group Least Absolute Shrinkage and Selection Operator (Group Lasso) to semiparametric model. That is to say, the method combines the approach of local polynomial smoothing and the Least Absolute Shrinkage and Selection Operator. In that case, it can conduct nonparametric estimation and variable selection in a computationally efficient manner. According to the same criterion, the parametric estimators are also obtained. Additionally, for each cluster, the nonparametric and parametric estimators are derived, and then compute the weighted average per cluster as finally estimators. Moreover, the large sample properties of estimators are also derived respectively. 展开更多
关键词 SEMIPARAMETRIC PARTIALLY Linear Varying-Coefficient Model MISSING RESPONSES cluster data Group Lasso
下载PDF
改进的k-平均聚类算法研究 被引量:50
5
作者 孙士保 秦克云 《计算机工程》 CAS CSCD 北大核心 2007年第13期200-201,209,共3页
聚类算法的好坏直接影响聚类的效果。该文讨论了经典的k-平均聚类算法,说明了它存在不能很好地处理符号数据和对噪声与孤立点数据敏感等不足,提出了一种基于加权改进的k-平均聚类算法,克服了k-平均聚类算法的缺点,并从理论上分析了该算... 聚类算法的好坏直接影响聚类的效果。该文讨论了经典的k-平均聚类算法,说明了它存在不能很好地处理符号数据和对噪声与孤立点数据敏感等不足,提出了一种基于加权改进的k-平均聚类算法,克服了k-平均聚类算法的缺点,并从理论上分析了该算法的复杂度。实验证明,用该方法实现的数据聚类与传统的基于平均值的方法相比较,能有效提高数据聚类效果。 展开更多
关键词 聚类算法 k-平均 聚类数据挖掘
下载PDF
北斗RDSS在海洋工程数据传输中的应用 被引量:11
6
作者 何嗣隆 叶方舟 王远飞 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2014年第4期173-179,共7页
海洋一直是传统通信技术的最大盲区.因为缺乏有效的通信手段,造成船岸之间信息交流困难,高度信息化的海上工程船舶成为漂浮在海上的信息孤岛.北斗卫星导航系统将导航与通信集成,为解决船岸一体化提供了可行的技术途径.本文基于北斗RDSS(... 海洋一直是传统通信技术的最大盲区.因为缺乏有效的通信手段,造成船岸之间信息交流困难,高度信息化的海上工程船舶成为漂浮在海上的信息孤岛.北斗卫星导航系统将导航与通信集成,为解决船岸一体化提供了可行的技术途径.本文基于北斗RDSS(Radio—Determina—tion Satellite Service,卫星无线电测定业务)短报文通信原理,提出了北斗集群数传解决海洋工程船大数据量传输的技术方案.通过制定通信协议,建立有效的数据处理算法和压缩算法,将包含船机状态数据、施工工况数据、船位信息等数千个物理量实时发送到岸上指挥中心,实现了海上作业的船岸一体化,为海上作业船舶的生产调度和业务管理提供了信息技术保障. 展开更多
关键词 北斗RDSS 海洋工程数据传输 北斗集群数传
下载PDF
一种改进的k-means聚类算法在入侵检测中的应用 被引量:7
7
作者 尹珧人 王德广 《科学技术与工程》 2008年第16期4701-4705,共5页
讨论了经典的k-平均聚类算法,说明了它存在不能很好地处理符号数据和对噪声与孤立点数据敏感等不足,提出了一种改进的k-平均聚类算法,克服了k-平均聚类算法的缺点,并从理论上分析了该算法的复杂度。实验证明,用该方法实现的数据聚类与... 讨论了经典的k-平均聚类算法,说明了它存在不能很好地处理符号数据和对噪声与孤立点数据敏感等不足,提出了一种改进的k-平均聚类算法,克服了k-平均聚类算法的缺点,并从理论上分析了该算法的复杂度。实验证明,用该方法实现的数据聚类与传统的基于平均值的方法相比较,能有效提高数据聚类效果以及入侵检测的准确度。 展开更多
关键词 入侵检测 聚类算法 k-平均 聚类数据挖掘
下载PDF
全国林业资源数据集群存储技术研究 被引量:3
8
作者 黄颖 谢阳生 《吉林大学学报(信息科学版)》 CAS 2014年第3期316-320,共5页
为解决全国大规模一体化林业资源管理,设计了适用于全国林业资源数据的分布式空间数据存储系统。通过数据分块、索引分级、集群合并,将各省和国家的林业资源数据集群在逻辑上合并成一个大数据集群。分布式空间数据存储系统的应用和全国... 为解决全国大规模一体化林业资源管理,设计了适用于全国林业资源数据的分布式空间数据存储系统。通过数据分块、索引分级、集群合并,将各省和国家的林业资源数据集群在逻辑上合并成一个大数据集群。分布式空间数据存储系统的应用和全国数据集群的合并加快了数据处理速度,统一了数据管理过程,建立了全向的并发数据通道。为实现林业资源数据的全国一体化应用做了积极探索。 展开更多
关键词 林业资源 大数据 集群数据 集群数据存储 林地一张图
下载PDF
利用通信数据的移动用户行为分析 被引量:5
9
作者 黄文彬 徐山川 +1 位作者 马龙 王军 《现代图书情报技术》 CSSCI 2015年第5期80-87,共8页
【目的】了解移动用户的行为模式并建立用户模型。【方法】基于国内电信运营商随机抽取某市一万个移动用户一周的日志记录,包含4万余条通话记录和200余万条网络请求,每条请求包含对应的基站标号以及基站地理位置。从消费能力、通话量、... 【目的】了解移动用户的行为模式并建立用户模型。【方法】基于国内电信运营商随机抽取某市一万个移动用户一周的日志记录,包含4万余条通话记录和200余万条网络请求,每条请求包含对应的基站标号以及基站地理位置。从消费能力、通话量、网络请求量、位移量4个维度在这批数据中提取14种基本特征指标,并利用K-means方法聚类。【结果】将移动用户区分成规律通话型、随机上网型、居家节约型和随机高消费型4类用户模型。【局限】用户量与数据量有限,没有采用更复杂的机器学习算法构建用户模型。【结论】研究结果对移动应用个性化服务的改进具有重要的参考价值。 展开更多
关键词 用户行为分析 移动用户研究 聚类 数据挖掘
原文传递
面向拒止环境的无人机集群数据链网络拓扑优化策略研究 被引量:2
10
作者 张超琦 迟凯 《现代导航》 2023年第6期446-450,共5页
针对现有无人机集群在卫导和通信拒止环境下,由于网络连通性降效导致任务遂行能力严重降级的问题,分析了国内外基于数据链网络降低拒止环境影响的最新研究现状,提出了一种基于任务优先级的动态优化连接度拓扑自适应位置选择策略,实现多... 针对现有无人机集群在卫导和通信拒止环境下,由于网络连通性降效导致任务遂行能力严重降级的问题,分析了国内外基于数据链网络降低拒止环境影响的最新研究现状,提出了一种基于任务优先级的动态优化连接度拓扑自适应位置选择策略,实现多个无人机集群在拒止环境下通过大区域拓扑连接获取拒止区域外信息,从而降低或抵消拒止影响,有效提升了无人机集群生存能力和任务遂行能力。 展开更多
关键词 集群数据链网络 自适应拓扑优化 拒止环境
下载PDF
一种改进的k-中心聚类算法研究
11
作者 曾超群 李文科 张刚华 《电脑与信息技术》 2010年第2期45-48,共4页
聚类算法的好坏直接影响聚类的效果。文章讨论了经典的k-中心聚类算珐,说明了它存在不能很好地处理大数据集的问题,提出了一种基于加权改进的k-中心聚类算法,克服了k-中心聚类算法的一些缺点,并从理论上分析了该算祛的复杂度。实验证明... 聚类算法的好坏直接影响聚类的效果。文章讨论了经典的k-中心聚类算珐,说明了它存在不能很好地处理大数据集的问题,提出了一种基于加权改进的k-中心聚类算法,克服了k-中心聚类算法的一些缺点,并从理论上分析了该算祛的复杂度。实验证明,用该方法实现的数据聚类与传统的基于中心的方法相比较,能有效提高数据聚类效果。 展开更多
关键词 PAM 聚类算法 k-中心 聚类数据挖掘
下载PDF
Joint Design of Clustering and In-cluster Data Route for Heterogeneous Wireless Sensor Networks 被引量:1
12
作者 Liang Xue Ying Liu +2 位作者 Zhi-Qun Gu Zhi-Hua Li Xin-Ping Guan 《International Journal of Automation and computing》 EI CSCD 2017年第6期637-649,共13页
A heterogeneous wireless sensor network comprises a number of inexpensive energy constrained wireless sensor nodes which collect data from the sensing environment and transmit them toward the improved cluster head in ... A heterogeneous wireless sensor network comprises a number of inexpensive energy constrained wireless sensor nodes which collect data from the sensing environment and transmit them toward the improved cluster head in a coordinated way. Employing clustering techniques in such networks can achieve balanced energy consumption of member nodes and prolong the network lifetimes.In classical clustering techniques, clustering and in-cluster data routes are usually separated into independent operations. Although separate considerations of these two issues simplify the system design, it is often the non-optimal lifetime expectancy for wireless sensor networks. This paper proposes an integral framework that integrates these two correlated items in an interactive entirety. For that,we develop the clustering problems using nonlinear programming. Evolution process of clustering is provided in simulations. Results show that our joint-design proposal reaches the near optimal match between member nodes and cluster heads. 展开更多
关键词 Heterogeneous wireless sensor networks clustering technique in-cluster data routes integral framework network lifetimes
原文传递
分簇VLIW结构下利用数据依赖图优化调度的研究 被引量:1
13
作者 杨旭 何虎 孙义和 《计算机学报》 EI CSCD 北大核心 2011年第1期182-192,共11页
应用的需求促使如今的处理器必须尽可能高地利用程序中所存在的指令级并行度,然而,高指令级并行的硬件和指令调度技术会给寄存器资源带来极大的压力.要在单一寄存器堆的情况下,既维持高的指令级并行度,又保持高的运行时钟频率是一件非... 应用的需求促使如今的处理器必须尽可能高地利用程序中所存在的指令级并行度,然而,高指令级并行的硬件和指令调度技术会给寄存器资源带来极大的压力.要在单一寄存器堆的情况下,既维持高的指令级并行度,又保持高的运行时钟频率是一件非常困难的事情,这是因为,当指令级并行度足够高时,在单一寄存器堆情况下,寄存器堆访问端口数目的限制会使得对寄存器堆的访问时间成为制约性能提高的关键因素.为了在利用高的指令级并行度的同时维持高的运行时钟频率,可以将寄存器堆和功能单元划分到不同的簇中.每一个簇中的功能单元可以直接访问簇内的寄存器堆,而簇间的数据交互则需要占用专用的资源来进行.因此,分簇结构下的编译器不仅要通过调度实现最大程序的指令级并行度,还应该对指令的分簇进行细致的安排以限制簇间的数据交互.该文致力于通过对数据依赖图(Data Dependence Graph)分析和划分,从而在最小化簇间的数据交互的同时,平衡各簇的利用情况,提高能够获得的指令级并行度,从而优化分簇式VLIW结构的调度性能.实验结果证明,该文所提出的方法可以极大地减少簇间的数据交互量,提高所能获得的指令级并行度,从而对调度结果的性能加以改善. 展开更多
关键词 分簇 VLIW结构 数据依赖图 指令调度 簇间数据交互
下载PDF
基于城市群数据的人力资本错配对产业结构的影响研究 被引量:1
14
作者 张祁越 李兴平 《中阿科技论坛(中英文)》 2022年第8期74-78,共5页
本文利用2000—2019年的四个城市群数据,通过构造指标及变量,借助计量模型实证检验人力资本错配对产业结构升级的影响,通过分析得出:(1)成渝城市群和长三角城市群的经济发展水平以及产业结构相对东部较为落后,人力资本储备与产业结构不... 本文利用2000—2019年的四个城市群数据,通过构造指标及变量,借助计量模型实证检验人力资本错配对产业结构升级的影响,通过分析得出:(1)成渝城市群和长三角城市群的经济发展水平以及产业结构相对东部较为落后,人力资本储备与产业结构不适配,人力资本过剩;珠三角城市群的经济发展速度较快,对人才的需求紧迫,人力资本配置不足;东北地区受重工业衰退的影响,人才流出较为严重,哈长城市群经济发展中人力资本配置不足;(2)人力资本配置过度较人力资本配置不足带来的负效用更大。基于以上问题,本文观点认为:不同城市群要明确发展目标,完善劳动力市场机制;政府要激励实体经济发展,创造更多的社会财富,促进人力资本与产业结构协调发展。 展开更多
关键词 城市群数据 人力资本 产业结构 回归分析
下载PDF
主成分分析在经前期综合症数据处理中的应用 被引量:1
15
作者 杨玉凤 《中国卫生产业》 2013年第13期164-165,167,共3页
"经前期综合症(PMS)肝气逆证辨证规范与疗效评价标准研究"项目收集了较大数量的数据,应用主成分分析进行降维处理,提取出经前期综合症的主证候要素并探讨证候要素的分布,运用SQLAS(Analysis Services)实现聚集检验,初步构建... "经前期综合症(PMS)肝气逆证辨证规范与疗效评价标准研究"项目收集了较大数量的数据,应用主成分分析进行降维处理,提取出经前期综合症的主证候要素并探讨证候要素的分布,运用SQLAS(Analysis Services)实现聚集检验,初步构建经前期综合症的辩证及数学模型。 展开更多
关键词 经前期综合症 主成分分析 辩证 模型
下载PDF
林业资源数据集群的快速索引设计 被引量:1
16
作者 李惺颖 谢阳生 +2 位作者 唐小明 罗鹏 黄龙 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2013年第6期1111-1117,共7页
设计一种快速索引以管理分布存储的林业资源数据,通过大量独立数据节点共同负载数据请求,减少数据访问过程的互斥,实现了空间与属性数据的分布式存储并行访问.实验结果表明,基于目前的应用服务器集群,应用该快速索引方法,能以较低的改... 设计一种快速索引以管理分布存储的林业资源数据,通过大量独立数据节点共同负载数据请求,减少数据访问过程的互斥,实现了空间与属性数据的分布式存储并行访问.实验结果表明,基于目前的应用服务器集群,应用该快速索引方法,能以较低的改进成本提高整个数据集群的快速统计和更新能力. 展开更多
关键词 林业资源 集群数据存储 多库存储 并行索引
下载PDF
现场直播式地理空间信息服务的构思与体系 被引量:18
17
作者 张永生 《测绘学报》 EI CSCD 北大核心 2011年第1期1-4,共4页
在应急快速反应场合,现场空间位置信息、动态影像信息的实时采集、高效处理和便捷提供,已经成为地理空间信息服务的基本要求。以旋翼无人机(VTUAV)为平台的集成传感器实时探测、车载移动集群式高速处理和宽带无线网络信息发布为技术途径... 在应急快速反应场合,现场空间位置信息、动态影像信息的实时采集、高效处理和便捷提供,已经成为地理空间信息服务的基本要求。以旋翼无人机(VTUAV)为平台的集成传感器实时探测、车载移动集群式高速处理和宽带无线网络信息发布为技术途径,本文构思一种地理空间信息直播服务(LGI)的样式和技术体系,结合典型应用的实际需求,具体分析了技术实现的环节、要点及未来推进服务需要突破的主要关键技术。 展开更多
关键词 地理空间信息 直播服务 实时采集 集群计算处理 宽带无线网络
下载PDF
集群并发环境下大规模矢量数据负载均衡算法 被引量:5
18
作者 郭明强 谢忠 黄颖 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2013年第9期1131-1134,共4页
为了提高集群环境下网络地理信息系统(WebGIS)大规模矢量数据的并发访问性能,提出了集群并发环境下大规模矢量数据内容网格化负载均衡算法,研究了大规模矢量数据内容网格化方法,集群并发访问时内容网格的自动识别、分析、聚合、反馈算法... 为了提高集群环境下网络地理信息系统(WebGIS)大规模矢量数据的并发访问性能,提出了集群并发环境下大规模矢量数据内容网格化负载均衡算法,研究了大规模矢量数据内容网格化方法,集群并发访问时内容网格的自动识别、分析、聚合、反馈算法,实现了面向任务的负载均衡。实验表明,本算法能在大规模、高强度的矢量数据提取和显示中均衡地分发请求,使集群服务器充分发挥其优势从而获得最小的请求响应时间。 展开更多
关键词 网络地理信息系统 集群 矢量数据 网格 负载均衡
原文传递
基于数据仓库的JMS中数据管理方法的研究 被引量:3
19
作者 张小芳 古清月 《计算机工程与设计》 CSCD 北大核心 2007年第5期1189-1192,1201,共5页
在分析JMS数据管理的目标的基础上,重点研究了系统数据和用户数据的管理模型。对系统数据,重点研究了集群配置数据和日志数据的管理方法,提出使用OGSA的分布式消息结构来管理JMS中的分布式日志。对用户数据,研究了作业和作业网络及其实... 在分析JMS数据管理的目标的基础上,重点研究了系统数据和用户数据的管理模型。对系统数据,重点研究了集群配置数据和日志数据的管理方法,提出使用OGSA的分布式消息结构来管理JMS中的分布式日志。对用户数据,研究了作业和作业网络及其实例的数据管理以及用户数据传输方法,提出了使用数据仓库来分析作业执行历史,设计了JMS的数据仓库模式,该模式能满足用户的多种查询和分析要求。有效地解决了JMS中的数据存储、查询、分析和共享等问题。 展开更多
关键词 数据仓库 作业管理系统 数据挖掘 分布式日志 集群配置数据
下载PDF
Traditional Chinese Medicine symptom pattern analysis for Parkinson's disease 被引量:3
20
作者 Chen Hongzhi He Jiancheng +2 位作者 Teng Long Yuan Canxing Zhang Zhe 《Journal of Traditional Chinese Medicine》 SCIE CAS CSCD 2017年第5期688-694,共7页
OBJECTIVE: To use the theory of Traditional Chinese Medicine to identify the major symptom patterns of Parkinson's disease.METHODS: Journal databases were searched for relevant articles in the last 30 years. Artic... OBJECTIVE: To use the theory of Traditional Chinese Medicine to identify the major symptom patterns of Parkinson's disease.METHODS: Journal databases were searched for relevant articles in the last 30 years. Articles were reviewed for symptom patterns of Parkinson's disease and analyzed using frequency analysis, cluster analysis, and other methods of data extraction.RESULTS: The analyses indicated that the most frequent symptom patterns of Parkinson's disease are Yin deficiency of kidney and liver, deficiency of Qi and blood, phlegm heat and wind stirring, blood stasis and wind stirring, and deficiency of Yin and Yang.CONCLUSION: Taken together, the analyses identified the primary symptom patterns of Parkinson's disease as Yin deficiency of kidney and liver, deficiency of Qi and blood, phlegm heat and wind stirring, and blood stasis and wind stirring. 展开更多
关键词 Parkinson disease Symptom complex cluster analysis data extraction
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部