期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
科学研究中的长尾数据及其监护 被引量:7
1
作者 赵艳枝 《情报资料工作》 CSSCI 北大核心 2015年第3期22-25,共4页
文章分析了科学研究的长尾现象,长尾数据的概念、属性和价值,并结合数据生命周期理论,论述了长尾数据监护的内容和特点,以期为国内开展科研长尾数据监护实践提供理论支持。
关键词 长尾理论 科学数据 长尾数据 数据监护
原文传递
德国通用科研数据基础设施项目GeRDI的建设与启示 被引量:4
2
作者 王敬 王彦兵 《农业图书情报学报》 2022年第3期28-36,共9页
[目的/意义]对德国通用科研数据基础设施项目GeRDI进行研究,总结成功建设经验,为中国科研数据基础设施的建设提供参考。[方法/过程]使用文献调研和网络调研方法,详细介绍GeRDI组织模式、设计原则、元数据模式以及架构设计。[结果/结论]... [目的/意义]对德国通用科研数据基础设施项目GeRDI进行研究,总结成功建设经验,为中国科研数据基础设施的建设提供参考。[方法/过程]使用文献调研和网络调研方法,详细介绍GeRDI组织模式、设计原则、元数据模式以及架构设计。[结果/结论]认为中国应在国家层面制定科研数据基础设施建设的战略规划;采用基于科研社区需求驱动的建设模式;同时兼容现有的协议、标准,并能适应未来的不断变化。 展开更多
关键词 科研数据基础设施 GeRDI 长尾数据 FAIR原则
下载PDF
一种提高预测结果多样性的资源分配算法 被引量:3
3
作者 邓晓军 满君丰 +1 位作者 文志强 王昱 《控制工程》 CSCD 北大核心 2015年第6期1137-1141,共5页
近些年,推荐系统的结果多样性引起了人们的广泛关注。为了提高推荐结果的多样性,同时保证一定的推荐准确性,应用产品数据中的长尾数据项来提高推荐结果的多样性,提出了一种包含资源分配和推荐2个阶段的推荐算法。在资源分配中,将"... 近些年,推荐系统的结果多样性引起了人们的广泛关注。为了提高推荐结果的多样性,同时保证一定的推荐准确性,应用产品数据中的长尾数据项来提高推荐结果的多样性,提出了一种包含资源分配和推荐2个阶段的推荐算法。在资源分配中,将"被推荐的机会"视为资源,通过预定义的分配策略将这些资源分配给所有的项。在推荐阶段,按照每个用户对所有项的偏好情况计算每个用户所分配的资源,并基于资源的分布情况对用户进行推荐。最后,给出了一种用于平衡推荐准确性与多样性的权衡算法。实验表明,提出的推荐算法与相关推荐算法相比较能更好的应用长尾数据,在保证推荐结果准确性的同时大大提高了推荐结果的多样性。 展开更多
关键词 推荐系统 长尾数据 多样性 学习算法
下载PDF
The Uses and Benefits of Big Data for Geological Surveys 被引量:1
4
作者 Michael H.STEPHENSON 《Acta Geologica Sinica(English Edition)》 SCIE CAS CSCD 2019年第S01期64-65,共2页
’Long tail’data is the difficult-to-get-at data that sits in libraries,institutes and on the computers of individual scientists.Informatics specialists like to contrast it with the smaller number of large,more acces... ’Long tail’data is the difficult-to-get-at data that sits in libraries,institutes and on the computers of individual scientists.Informatics specialists like to contrast it with the smaller number of large,more accessible data sets(e.g.Sinha et al.,2013).The name’long tail’derives from graphs drawn of the size of data sets against their number:there are relatively few large datasets and a lot of smaller ones. 展开更多
关键词 long tail data informatics BIOSTRATIGRAPHY GEOLOGICAL survey
下载PDF
长尾数据共享研究进展 被引量:13
5
作者 杨平 田野 《图书情报工作》 CSSCI 北大核心 2014年第8期133-138,共6页
长尾数据是一种重要的科研资源,由于缺乏关注度与技术支持,它的利用价值被长期忽视。在简要概括其定义、属性以及重要性等的基础上,从壁垒与对策研究、基础架构研究、用户行为研究、图书馆与图书馆员责任能力研究、有机共享研究5个方面... 长尾数据是一种重要的科研资源,由于缺乏关注度与技术支持,它的利用价值被长期忽视。在简要概括其定义、属性以及重要性等的基础上,从壁垒与对策研究、基础架构研究、用户行为研究、图书馆与图书馆员责任能力研究、有机共享研究5个方面梳理长尾数据共享理论研究现状。此外,基于数据生命周期理论归纳促进长尾数据共享的5种常用管理工具,包括DM PTool、DataUp、EZID、Merritt repository、数据出版平台。最后,总结长尾数据共享所面临的社会和技术障碍以及相应的对策建议并提出未来的研究建议。 展开更多
关键词 E-SCIENCE 长尾数据 数据监护 共享因素 数据管理工具
原文传递
开启区块链地质应用新时代 被引量:5
6
作者 周永章 刘楠 +1 位作者 陈川 杨威 《地质通报》 CAS CSCD 北大核心 2020年第1期1-6,共6页
人类已经叩响了区块链时代的大门,但在地质领域,区块链的应用几乎还处于空白的状态。哪怕是像深时数字地球(DDE)这样极具雄心的大科学项目,也没有意识到区块链技术有助于分散在科学家个人或实验室的“长尾数据”的有效收集和利用。地质... 人类已经叩响了区块链时代的大门,但在地质领域,区块链的应用几乎还处于空白的状态。哪怕是像深时数字地球(DDE)这样极具雄心的大科学项目,也没有意识到区块链技术有助于分散在科学家个人或实验室的“长尾数据”的有效收集和利用。地质科学信息是一个超大型共享数据库,需要许多人彼此信任去协作完成数据库的改写,区块链将是非常好的支撑技术。区块链基于其系统特性和智能合约提供有丰富交互接口,特别是其具有去中心化、不可篡改、隐私保护特性,为区块链技术在地质领域应用提供了重要的基础。地质勘查实物、资料、数据的溯源管理,面向更广泛科学共同体的长尾数据的收集,应该是区块链地质应用的重要突破口。地质通证使打造全球地质社区成为可能。 展开更多
关键词 区块链 地质大数据 地质数据溯源管理 深时数字地球(DDE) 长尾数据收集 地质通证 全球地质社区
下载PDF
基于深度学习的长尾数据集分类精度提高的研究
7
作者 王中洲 陈亮 魏胜楠 《沈阳理工大学学报》 CAS 2021年第5期31-35,共5页
基于深度学习的轮胎缺陷检测过程中,由于轮胎数据集为长尾数据集,某些缺陷类别的轮胎图片数量较少,造成此类缺陷的数据分类精度不高。本文在双边分支神经网络(BBN)分类算法的基础上,通过改进特征提取网络的结构、损失函数和权衡参数提... 基于深度学习的轮胎缺陷检测过程中,由于轮胎数据集为长尾数据集,某些缺陷类别的轮胎图片数量较少,造成此类缺陷的数据分类精度不高。本文在双边分支神经网络(BBN)分类算法的基础上,通过改进特征提取网络的结构、损失函数和权衡参数提高轮胎数据集中尾类数据分类精度。以主流数据集长尾CIFAR-10、长尾CIFAR-100和本实验室自制轮胎数据集为测试数据进行实验分析,实验结果表明数据集的尾类小样本数据的分类精度提高约10%。 展开更多
关键词 数据分类 双边分支神经网络 长尾数据集 损失函数
下载PDF
长尾数据监护与图书馆的职责——伊利诺伊香槟大学图书馆范例研究 被引量:9
8
作者 赵艳枝 《国家图书馆学刊》 CSSCI 北大核心 2015年第3期79-84,共6页
长尾数据是一种重要的学术资源,是科研创新的源头,但由于缺乏关注与技术支持而长期被忽视。基于科学研究的长尾理论和国内外研究现状发现,图书馆可以作为主导长尾数据监护工作的最佳机构。在伊利诺伊香槟大学图书馆开展的环境科学长尾... 长尾数据是一种重要的学术资源,是科研创新的源头,但由于缺乏关注与技术支持而长期被忽视。基于科学研究的长尾理论和国内外研究现状发现,图书馆可以作为主导长尾数据监护工作的最佳机构。在伊利诺伊香槟大学图书馆开展的环境科学长尾科研数据监管实践中,需求调查、制订数据管理计划、科研数据的组织、数据保存和共享、数据监护评价等是数据监护的主要内容,数据监护工作重心从"大科学"向"小科学"转移,数据管理工作从科学研究的下游向上游转移,国书馆的职责从协助向主导转变,图书馆员从单一的"管理员"向多元化角色转变。图1。表2。参考文献14。 展开更多
关键词 长尾理论 长尾数据 数据监护 图书馆 小科学
下载PDF
基于生命周期管理的科学长尾数据管护研究 被引量:9
9
作者 杨滟 孙建军 《情报理论与实践》 CSSCI 北大核心 2016年第4期45-50,共6页
科学数据的保管和重用能够推动进一步的科学研究和新的科学发展,然而长期以来许多机构和个人在很大程度上忽略了对科学数据,特别是科学长尾数据的保管和利用。文章围绕没有被有效索引和存储,容易被各类人员忽视的科学长尾数据展开讨论... 科学数据的保管和重用能够推动进一步的科学研究和新的科学发展,然而长期以来许多机构和个人在很大程度上忽略了对科学数据,特别是科学长尾数据的保管和利用。文章围绕没有被有效索引和存储,容易被各类人员忽视的科学长尾数据展开讨论。从长尾经济学的概念出发描述了这类数据在科学发展中的关键作用,分析了这类数据的特征,以及科学长尾数据妥善保管和利用中存在的一些社会和技术壁垒。以数据管护生命周期理论为基础探讨科学长尾数据管护可能的解决方案,论述了科学长尾数据生命周期不同阶段的可能举措。 展开更多
关键词 科学数据 长尾数据 数据管护 生命周期
原文传递
结合长尾数据解决方法的野生动物目标检测 被引量:4
10
作者 蔡前舟 郑伯川 +1 位作者 曾祥银 侯金 《计算机应用》 CSCD 北大核心 2022年第4期1284-1291,共8页
基于红外相机图像的野生动物目标检测有利于研究和保护野生动物。由于不同种类的野生动物数量差别大,红外相机采集到的野生动物数据集存在种类数量分布不均的长尾数据问题,进而影响目标检测神经网络模型的整体性能提升。针对野生动物的... 基于红外相机图像的野生动物目标检测有利于研究和保护野生动物。由于不同种类的野生动物数量差别大,红外相机采集到的野生动物数据集存在种类数量分布不均的长尾数据问题,进而影响目标检测神经网络模型的整体性能提升。针对野生动物的长尾数据导致的目标检测精度低的问题,提出了一种基于两阶段学习和重加权相结合的长尾数据解决方法,并将该方法用于基于YOLOv4-Tiny的野生动物目标检测。首先,采集、标注并构建了一个新的野生动物数据集,该数据集具有明显的长尾数据特征;其次,采用基于迁移学习的两阶段方法训练神经网络,第一阶段在分类损失函数中采用无加权方式进行训练,而在第二阶段提出了两种改进的重加权方法,并以第一阶段所得权重作为预训练权重进行重加权训练;最后,对野生动物测试集进行测试。实验结果表明,在分类损失采用交叉熵损失函数和焦点损失函数下,所提出的长尾数据解决方法达到了60.47%和61.18%的平均精确率均值(mAP),相较于无加权方法在两种损失函数下分别提高了3.30个百分点和5.16个百分点,相较于所提改进的有效样本加权方法在焦点损失函数下提高了2.14个百分点,说明该方法能提升YOLOv4-Tiny网络对具有长尾数据特征的野生动物数据集的目标检测性能。 展开更多
关键词 长尾数据 目标检测 两阶段学习 重加权 YOLOv4-Tiny
下载PDF
基于改进联邦学习长尾数据的故障诊断研究
11
作者 刘伟民 展翼鹤 +2 位作者 郑爱云 黄继德 郑直 《仪器仪表学报》 EI CAS CSCD 北大核心 2024年第9期145-156,共12页
由于无法采集到齿轮和轴承的某样故障类型的充足故障样本,使其呈现长尾分布形式,导致无法有效构建神经网络诊断模型;当引入联邦学习方法解决上述长尾问题时,无法有效地提取尾部故障类型样本的特征信息。针对上述问题,本文提出一种改进... 由于无法采集到齿轮和轴承的某样故障类型的充足故障样本,使其呈现长尾分布形式,导致无法有效构建神经网络诊断模型;当引入联邦学习方法解决上述长尾问题时,无法有效地提取尾部故障类型样本的特征信息。针对上述问题,本文提出一种改进联邦学习方法。首先,采用联邦特征对诊断模型再训练,提高对尾部样本的故障特征提取能力;其次,引入CBAM注意力机制,对联邦学习中的ResNet网络模型进行改进,增强对通道和空间的关键局部特征信息的提取能力和效率;再次,将传统卷积替换为非对称卷积,增强对样本的非对称特征信息的提取能力和效率;最后,采用间隔校准算法优化网络模型的分类边距,以获取更高的诊断准确率和效率。基于齿轮和轴承的实测故障样本的实验分析可知,所提改进联邦学习方法可有效地提升平均和最高准确率,二者分别为8.78%和3.40%。 展开更多
关键词 联邦学习 长尾数据 注意力机制 非对称卷积 间隔校准算法
下载PDF
大数据科研环境驱动的长尾数据策管机制研究 被引量:3
12
作者 朱维乔 《图书馆工作与研究》 CSSCI 北大核心 2018年第5期53-58,共6页
本文论述了大数据环境下长尾数据在推动科学研究与发展中的重要作用,在此基础上分析了大数据科研环境下长尾数据策管机制构建的必要性和可行性,阐述了长尾数据策管机制构建的具体内容,探讨了大数据环境下科研长尾数据策管机制的实现壁... 本文论述了大数据环境下长尾数据在推动科学研究与发展中的重要作用,在此基础上分析了大数据科研环境下长尾数据策管机制构建的必要性和可行性,阐述了长尾数据策管机制构建的具体内容,探讨了大数据环境下科研长尾数据策管机制的实现壁垒与相应对策,以促进科学创新的实现。 展开更多
关键词 大数据 长尾数据 数据策管
下载PDF
石油企业长尾物资数据研究
13
作者 邱天 《石油化工技术与经济》 CAS 2024年第5期16-18,共3页
针对国有大型石油企业在供应链管理中存在的物资数据问题,包括数据重复、相近数据识别困难、数据分析能力有待提升以及经济价值收益不明显等,对长尾物资数据进行深入研究,明确界定了长尾物资的概念和范畴,制定了相关标准,并应用于业务... 针对国有大型石油企业在供应链管理中存在的物资数据问题,包括数据重复、相近数据识别困难、数据分析能力有待提升以及经济价值收益不明显等,对长尾物资数据进行深入研究,明确界定了长尾物资的概念和范畴,制定了相关标准,并应用于业务实践。研究结果显示,通过对长尾物资数据的研究,企业能够有效降低采购成本,提升物资使用效率。 展开更多
关键词 长尾物资数据 标准化 清单 数据质量
下载PDF
基于长尾数据监管的图书馆服务研究 被引量:2
14
作者 江银凤 《大学图书情报学刊》 2016年第4期73-77,88,共6页
文章结合大数据时代长尾理论,探讨长尾数据在图书馆服务中需求的增长、图书馆参与数据监管服务的迫切性及图书馆在长尾数据监管中所产生的形态,论述长尾数据监管在图书馆服务中的应用,包括监管重心转移、资源长尾聚合、知识产权保护及... 文章结合大数据时代长尾理论,探讨长尾数据在图书馆服务中需求的增长、图书馆参与数据监管服务的迫切性及图书馆在长尾数据监管中所产生的形态,论述长尾数据监管在图书馆服务中的应用,包括监管重心转移、资源长尾聚合、知识产权保护及服务角色转变等对策措施,以期为图书馆长尾数据监管实践提供参考。 展开更多
关键词 长尾数据 数据监管 数据生命周期
下载PDF
面向长尾分布数据的在线流特征选择 被引量:2
15
作者 范凯钧 林耀进 +2 位作者 张智慧 毛煜 王晨曦 《昆明理工大学学报(自然科学版)》 北大核心 2023年第1期77-88,共12页
在开放动态环境下分类学习的任务中,数据通常存在类别长尾分布的特点,且数据标记空间存在层次化结构关系以及动态性.针对实际任务中不同的需求,许多特征选择算法被提出,但是这些已有的特征选择算法忽略数据的长尾分布特点和特征空间的... 在开放动态环境下分类学习的任务中,数据通常存在类别长尾分布的特点,且数据标记空间存在层次化结构关系以及动态性.针对实际任务中不同的需求,许多特征选择算法被提出,但是这些已有的特征选择算法忽略数据的长尾分布特点和特征空间的不确定性.针对上述问题,文中提出基于邻域粗糙集的长尾分布数据在线流特征选择算法.借助邻域粗糙集模型,并考虑邻域内样本间的关系后,定义了自适应邻域关系,设计基于稀有类样本重要性的依赖度计算公式.同时,利用层次结构降低类别不平衡性,提出在线冗余度分析和在线重要度分析两种在线特征评价指标,用于选出具有高可分离性和强区分性的特征子集.实验结果表明所提算法优于其它先进算法. 展开更多
关键词 特征选择 长尾分布数据集 在线流特征选择 层次分类 邻域粗糙集
原文传递
DAST-SR:群智感知中具有地理相关性的连续长尾数据的精确聚合方法
16
作者 仲雅雯 王玉峰 《长江信息通信》 2021年第8期19-23,共5页
大数据时代,众包系统需要通过聚合多个数据提供者的数据来获得准确的真相。在基于指纹识别的蓝牙定位应用场景中,通过对数据的长尾特性、连续性和地理关系的研究,提出了一种处理具有地理相关性的连续长尾数据的机制,即an accurate data ... 大数据时代,众包系统需要通过聚合多个数据提供者的数据来获得准确的真相。在基于指纹识别的蓝牙定位应用场景中,通过对数据的长尾特性、连续性和地理关系的研究,提出了一种处理具有地理相关性的连续长尾数据的机制,即an accurate data aggregation mechanism processing sequential long-tail data with spatial relativity(DAST-SR)。为了捕获数据的长尾特性,该机制使用数据源出现错误的置信上限来估计可信度。而为了捕获数据的连续特性和地理相关性,该机制联合使用数据源提供的数据、前一时刻的聚合真相和相关实体的聚合真相作为虚拟源,聚合获得真相。通过虚拟数据集上的仿真,与an accurate data aggregation mechanism incorporating sequential long-tail characteristics(DAST)、Dynamic Truth Discovery(DynaTD)和truth discovery on correlated entities(TD-corr)相比,DAST-SR聚合结果的平均绝对误差和均方根误差最小,聚合的结果更加准确。 展开更多
关键词 群智感知 真相发现 长尾数据 连续数据 地理相关性
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部