期刊文献+
共找到41篇文章
< 1 2 3 >
每页显示 20 50 100
时空众包数据管理技术研究综述 被引量:56
1
作者 童咏昕 袁野 +2 位作者 成雨蓉 陈雷 王国仁 《软件学报》 EI CSCD 北大核心 2017年第1期35-58,共24页
近年来,众包为传统数据管理提供了一种通过汇聚群体智慧求解问题的新模式,并成为当前数据库领域的研究热点之一.特别是随着移动互联网技术与共享经济模式的快速发展,众包技术已融入到各类具有时空数据的应用场景中,例如各类O2O(online-t... 近年来,众包为传统数据管理提供了一种通过汇聚群体智慧求解问题的新模式,并成为当前数据库领域的研究热点之一.特别是随着移动互联网技术与共享经济模式的快速发展,众包技术已融入到各类具有时空数据的应用场景中,例如各类O2O(online-to-offline)应用、实时交通监控与动态物流管理等.简言之,这种应用众包技术处理时空数据的方式称为时空众包数据管理.对近期在时空众包数据管理方面的研究工作进行综述,首先阐述了时空众包的概念,解释了其与传统众包技术的关系,并介绍了各类典型的时空众包应用;随后描述了时空众包应用平台的工作流程及其任务特点;然后讨论了时空众包数据管理的3项核心研究问题和3类应用技术;最后,总结了时空众包数据管理技术的研究现状并展望了其未来潜在的研究方向,为相关研究人员提供了有价值的参考. 展开更多
关键词 时空众包 共享经济 O2O模式 任务分配 质量控制 隐私保护
下载PDF
空间众包环境下的3类对象在线任务分配 被引量:47
2
作者 宋天舒 童咏昕 +1 位作者 王立斌 许可 《软件学报》 EI CSCD 北大核心 2017年第3期611-630,共20页
随着移动互联网技术与O2O(offline-to-online)商业模式的发展,各类空间众包平台变得日益流行,如滴滴出行、百度外卖等空间众包平台更与人们日常生活密不可分.在空间众包研究中,任务分配问题更是其核心问题之一,该问题旨在研究如何将实... 随着移动互联网技术与O2O(offline-to-online)商业模式的发展,各类空间众包平台变得日益流行,如滴滴出行、百度外卖等空间众包平台更与人们日常生活密不可分.在空间众包研究中,任务分配问题更是其核心问题之一,该问题旨在研究如何将实时出现的空间众包任务分配给适宜的众包工人.但大部分现有研究所基于的假设过强,存在两类不足:(1)现有工作通常假设基于静态场景,即,全部众包任务和众包工人的时空信息在任务分配前已完整获知,但众包任务与众包工人在实际应用中动态出现,且需实时地对其进行任务分配,因此,现存研究结果在实际应用中缺乏可行性;(2)现有研究均假设仅有两类众包参与对象,即众包任务与众包工人,而忽略了第三方众包工作地点对任务分配的影响.综上所述,为弥补上述不足,提出了一类新型动态任务分配问题,即,空间众包环境下的3类对象在线任务分配.该问题不但囊括了任务分配中的3类研究对象,即众包任务、众包工人和众包工作地点,而且关注动态环境.进而设计了随机阈值算法,给出了该算法在最差情况下的竞争比分析.采用在线学习方法进一步优化了随机阈值算法,提出自适应随机阈值算法,并证明该优化策略可逼近随机阈值算法使用不同阈值所能达到的最佳效果.最终通过在真实数据集和具有不同分布人造数据集上进行的大量实验,验证了算法的效果与性能. 展开更多
关键词 空间众包 任务分配 在线算法 竞争比分析
下载PDF
一种新的智慧城市数据共享和融合框架——SCLDF 被引量:35
3
作者 陈真勇 徐州川 +2 位作者 李清广 吕卫锋 熊璋 《计算机研究与发展》 EI CSCD 北大核心 2014年第2期290-301,共12页
智慧城市是物联网、云计算、移动网络、大数据等为代表的信息技术与城市化发展相结合的产物.如何有效地实现对智慧城市中海量、异构、多源数据的数据共享和融合是智慧城市必须要解决的核心问题.首先分析了传统数据融合技术的特点,然后... 智慧城市是物联网、云计算、移动网络、大数据等为代表的信息技术与城市化发展相结合的产物.如何有效地实现对智慧城市中海量、异构、多源数据的数据共享和融合是智慧城市必须要解决的核心问题.首先分析了传统数据融合技术的特点,然后阐述了当前可以用来解决智慧城市大数据共享和融合问题的技术.在此基础上提出了一种新的智慧城市数据共享和融合框架——智慧城市数据互联框架(smart city linked data framework),并详细阐述了其总体架构以及架构中每层的作用、关键技术和需要解决的问题,最后详细阐述了数据语义标注标签和数据互联层相关问题. 展开更多
关键词 智慧城市 数据融合 语义网 关联数据 数据互联网络 数据活化
下载PDF
新型数据管理系统研究进展与趋势 被引量:32
4
作者 崔斌 高军 +3 位作者 童咏昕 许建秋 张东祥 邹磊 《软件学报》 EI CSCD 北大核心 2019年第1期164-193,共30页
随着各类新型计算技术和新兴应用领域的浮现,传统数据库技术面临新的挑战,正在从适用常规应用的单一处理方法逐步转为面向各类特殊应用的多种数据处理方式.分析并展望了新型数据管理系统的研究进展和趋势,涵盖分布式数据库、图数据库、... 随着各类新型计算技术和新兴应用领域的浮现,传统数据库技术面临新的挑战,正在从适用常规应用的单一处理方法逐步转为面向各类特殊应用的多种数据处理方式.分析并展望了新型数据管理系统的研究进展和趋势,涵盖分布式数据库、图数据库、流数据库、时空数据库和众包数据库等多个领域.具体而言:分布式数据管理技术是支持可扩展的海量数据处理的关键技术;以社交网络为代表的大规模图结构数据的处理需求带来了图数据库技术的发展;流数据管理技术用来应对数据动态变化的管理需求;时空数据库主要用于支持移动对象管理;对多源、异构而且劣质数据源的集成需求催生出新型的众包数据库技术.最后讨论了新型数据库管理系统的未来发展趋势. 展开更多
关键词 分布式数据库 图数据库 流数据库 时空数据库 众包数据库
下载PDF
面向Internet数据中心的资源管理 被引量:25
5
作者 张伟 宋莹 +2 位作者 阮利 祝明发 肖利民 《软件学报》 EI CSCD 北大核心 2012年第2期179-199,共21页
Internet数据中心向多元化、智能化、自动化、规模化与标准化道路发展,其规模越来越大、越来越复杂,这为如何有效管理资源带来极大的冲击与挑战.当前,资源管理已成为Internet数据中心亟待解决的重要问题,其重要性与紧迫性已不容忽视.分... Internet数据中心向多元化、智能化、自动化、规模化与标准化道路发展,其规模越来越大、越来越复杂,这为如何有效管理资源带来极大的冲击与挑战.当前,资源管理已成为Internet数据中心亟待解决的重要问题,其重要性与紧迫性已不容忽视.分析了Internet数据中心资源管理面临的两大挑战:(1)满足并发多应用SLAs(service level agreements)的兼容性;(2)提高系统服务的能量有效性.以挑战为主线,对近十几年来国内外在满足SLA、降低功耗、同时满足SLA和降低功耗方面所取得的资源管理研究成果进行了全面的概括总结和分析,最后进行总结并对未来的研究发展趋势提出观点. 展开更多
关键词 数据中心 资源管理 SLA(service LEVEL agreement) 功耗 虚拟化
下载PDF
一种新的快速特征选择和数据分类方法 被引量:20
6
作者 陈铁明 马继霞 +1 位作者 Samuel H.Huang 蔡家楣 《计算机研究与发展》 EI CSCD 北大核心 2012年第4期735-745,共11页
针对数据分类问题提出一种新型高效的特征选择和规则提取方法.首先通过减少初始区间数量改进Chi-Merge离散化方法,再采用改进的Chi-Merge离散化连续型特征变量;特征离散化后,统计样本数据在每个特征子集划分下的频数表,并根据频数表计... 针对数据分类问题提出一种新型高效的特征选择和规则提取方法.首先通过减少初始区间数量改进Chi-Merge离散化方法,再采用改进的Chi-Merge离散化连续型特征变量;特征离散化后,统计样本数据在每个特征子集划分下的频数表,并根据频数表计算数据不一致率,再利用顺序前向最优搜索的方法,快速确定特征数量由小到大的每一个最优特征子集;根据特征子集对应的数据不一致率差异最小化原则,完成特征个数最小化的最优特征子集筛选;根据最优特征子集的数据频数表,可直接提取数据分类规则.实验表明,快速提取的规则可获得较好的分类效果.基于该特征选择方法,提出一种面向分布式同构数据的快速分类模型,不但具有良好的分类效果,还支持对样本数据内容的隐私保护. 展开更多
关键词 离散化 频数表 特征选择 规则提取 数据分类 隐私保护
下载PDF
面向企业数据孤岛的联邦排序学习 被引量:16
7
作者 史鼎元 王晏晟 +1 位作者 郑鹏飞 童咏昕 《软件学报》 EI CSCD 北大核心 2021年第3期669-688,共20页
排序学习(learning-to-rank,简称LTR)模型在信息检索领域取得了显著成果,而该模型的传统训练方法需要收集大规模文本数据.然而,随着数据隐私保护日渐受到人们重视,从多个数据拥有者(如企业)手中收集数据训练排序学习模型的方式变得不可... 排序学习(learning-to-rank,简称LTR)模型在信息检索领域取得了显著成果,而该模型的传统训练方法需要收集大规模文本数据.然而,随着数据隐私保护日渐受到人们重视,从多个数据拥有者(如企业)手中收集数据训练排序学习模型的方式变得不可行.各企业之间数据被迫独立存储,形成了数据孤岛.由于排序模型训练需要使用查询记录、文档等诸多隐私信息,数据孤岛难以融合打通,这制约了排序学习模型的训练.联邦学习能够让多数据拥有方在隐私保护的前提下联合训练模型,是一种打通数据孤岛的新方法.在其启发下,提出了一种新的框架,即面向企业数据孤岛的联邦排序学习,它同时解决了联邦学习场景下排序学习所面临的两大挑战,即交叉特征生成与缺失标签处理.为了应对多方交叉特征的生成问题,使用了一种基于略图(sketch)数据结构与差分隐私的方法,其相比于传统加密方法具有更高的效率,同时还具有隐私性与结果精度的理论保证.为了应对缺失标签问题,提出了一种新的联邦半监督学习方法.最终,通过在公开数据集上的大量实验,验证了所提方法的有效性. 展开更多
关键词 排序学习 企业数据孤岛 联邦学习 略图 差分隐私
下载PDF
一种基于Wi-Fi信号指纹的楼宇内定位算法 被引量:12
8
作者 牛建伟 刘洋 +1 位作者 卢邦辉 宋文芳 《计算机研究与发展》 EI CSCD 北大核心 2013年第3期568-577,共10页
由于GPS无法在楼宇内使用,而目前的楼宇内定位技术一般都需要预先部署额外的设施,因此楼宇内无基础设施定位成为了一个热点研究问题.提出了一种利用Wi-Fi接入点的MAC地址和RSSI(received signal strength indication)值,通过机器分类的... 由于GPS无法在楼宇内使用,而目前的楼宇内定位技术一般都需要预先部署额外的设施,因此楼宇内无基础设施定位成为了一个热点研究问题.提出了一种利用Wi-Fi接入点的MAC地址和RSSI(received signal strength indication)值,通过机器分类的方式实现楼宇内房间级定位的算法R-kNN(relativity k-nearest neighbor).R-kNN是一种属性加权k近邻算法,它通过将AP之间的相关性反应在权值的分配上,有效地降低了维度冗余对分类准确率的负面影响.R-kNN没有对房间和AP的物理位置做出任何假设,只需要使用环境中现存的AP就可以取得较好的定位效果,无需部署任何额外设施或修改现有设施.实验结果表明,在AP数量较多的楼宇环境中,R-kNN能够取得比k近邻算法和朴素贝叶斯分类器更好的定位效果. 展开更多
关键词 楼宇内定位 WI-FI RSSI K近邻算法 属性加权k近邻算法
下载PDF
大规模拼车算法研究进展 被引量:12
9
作者 徐毅 童咏昕 李未 《计算机研究与发展》 EI CSCD 北大核心 2020年第1期32-52,共21页
随着共享经济的发展,拼车这一由多位乘客协商共同乘坐同一辆车并分担费用的共享出行模式正得到广泛应用.在移动互联网与普适计算的推动下,拼车体现出数据量大、动态性强、目标多样、应用范围广等新特点.这些新特点使得求解大规模拼车问... 随着共享经济的发展,拼车这一由多位乘客协商共同乘坐同一辆车并分担费用的共享出行模式正得到广泛应用.在移动互联网与普适计算的推动下,拼车体现出数据量大、动态性强、目标多样、应用范围广等新特点.这些新特点使得求解大规模拼车问题的难度大大增加,并催生了众多大规模拼车算法的学术研究.拼车中各类关于社会影响因素的实际问题也成为新型研究热点.为了面向大规模拼车算法进行系统性介绍,首先介绍了拼车问题的概念定义与工作流程.随后,对大规模拼车系统的核心算法问题,即路线规划问题进行了系统地分类、介绍与分析,并进一步详细讨论了大规模拼车涉及的激励机制、隐私保护、安全保障等社会影响因素.最后,分析展望了该领域未来的潜在研究方向,为从事拼车算法的相关研究人员和从业者提供参考和帮助. 展开更多
关键词 拼车算法 路线规划 激励机制 隐私保护 安全保障
下载PDF
一种基于社交事件关联的故事脉络生成方法 被引量:12
10
作者 李莹莹 马帅 +3 位作者 蒋浩谊 刘喆 胡春明 李雄 《计算机研究与发展》 EI CSCD 北大核心 2018年第9期1972-1986,共15页
推特和新浪微博等社交网络已成为报道公共事件的重要平台,它们为监控事件及其演化提供了宝贵的数据.然而,这些数据包含的非正式词语和碎片化文本使得从中提取描述性的信息具有一定的挑战.另外,从快速生成的大量微博监控事件演化也有一... 推特和新浪微博等社交网络已成为报道公共事件的重要平台,它们为监控事件及其演化提供了宝贵的数据.然而,这些数据包含的非正式词语和碎片化文本使得从中提取描述性的信息具有一定的挑战.另外,从快速生成的大量微博监控事件演化也有一定难度.提出在社交网络中监控事件并对具有相同主题的事件演化进行分析.这既可以在粗粒度水平获得事件的概述,又可以在细粒度水平获得事件的详细信息.通过3个连续的组件实现该任务.1)用结构化的方法从微博检测事件;2)基于事件的隐式语义信息对事件聚类并将聚类获得的簇定义为故事;3)用基于图的方法为每个故事生成故事脉络,故事脉络用包含摘要的有向无环图表示故事内事件的演化.用户体验评估实验表明:提出的方法比现有方法具有更高的准确性和可理解性,并能够帮助用户监控事件及其演化. 展开更多
关键词 社交网络 事件演化 故事脉络 聚类 主题模型
下载PDF
基于形式化方法的航空电子系统检测 被引量:11
11
作者 李睿 连航 +1 位作者 马世龙 黎涛 《软件学报》 EI CSCD 北大核心 2015年第2期181-201,共21页
随着航空型号的快速发展,航空电子系统的数字化程度越来越高,软件在其中所占的比例越来越大.对航空电子系统中的软件进行测试和检测是保证航空电子系统质量及可信运行的基础.通过分析航空电子系统软件体系结构,对航空电子系统进行形式... 随着航空型号的快速发展,航空电子系统的数字化程度越来越高,软件在其中所占的比例越来越大.对航空电子系统中的软件进行测试和检测是保证航空电子系统质量及可信运行的基础.通过分析航空电子系统软件体系结构,对航空电子系统进行形式化建模,并在此基础上,提出了一种形式化的系统级综合检测方法,从静态和动态两个方面对航空电子系统进行检测,最后通过设计并实现一个综合检测系统来验证该方法的有效性. 展开更多
关键词 模型检测 系统形式化 航空电子系统 软件配置项 有限状态自动机
下载PDF
基于大数据的软件智能化开发方法与环境 被引量:9
12
作者 谢冰 彭鑫 +3 位作者 尹刚 李宣东 魏峻 孙海龙 《大数据》 2021年第1期3-21,1,共20页
阐述了围绕软件工程大数据的汇聚组织、知识表示提炼、软件工具智能化和智能开发服务环境等关键技术开展的一系列研究工作,建立了基于大数据的软件智能化开发技术体系,研发关键性的软件智能化开发工具,形成了“人-工具-数据”融合的新... 阐述了围绕软件工程大数据的汇聚组织、知识表示提炼、软件工具智能化和智能开发服务环境等关键技术开展的一系列研究工作,建立了基于大数据的软件智能化开发技术体系,研发关键性的软件智能化开发工具,形成了“人-工具-数据”融合的新一代软件智能化开发环境,并构建了软件智能化开发云平台。面向万众创新的社会需求,构建了服务大众的公共服务平台;针对企业创新能力的提升,提供了智能化的企业软件开发环境。 展开更多
关键词 软件复用 大数据 智能化软件开发 知识图谱 推荐
下载PDF
同步语言的时间可预测多线程代码生成方法 被引量:9
13
作者 杨志斌 赵永望 +4 位作者 黄志球 胡凯 马殿富 Jean-Paul BODEVEIX Mamoun FILALI 《软件学报》 EI CSCD 北大核心 2016年第3期611-632,共22页
能够提供更强计算能力的多核处理器将在安全关键系统中得到广泛应用,但是由于现代处理器所使用的流水线、乱序执行、动态分支预测、Cache等性能提高机制以及多核之间的资源共享,使得系统的最坏执行时间分析变得非常困难.为此,国际学术... 能够提供更强计算能力的多核处理器将在安全关键系统中得到广泛应用,但是由于现代处理器所使用的流水线、乱序执行、动态分支预测、Cache等性能提高机制以及多核之间的资源共享,使得系统的最坏执行时间分析变得非常困难.为此,国际学术界提出时间可预测系统设计的思想,以降低系统的最坏执行时间分析难度.已有研究主要关注硬件层次及其编译方法的调整和优化,而较少关注软件层次,即,时间可预测多线程代码的构造方法以及到多核硬件平台的映射.提出一种基于同步语言模型驱动的时间可预测多线程代码生成方法,并对代码生成器的语义保持进行证明;提出一种基于AADL(architecture analysis and design language)的时间可预测多核体系结构模型,作为研究的目标平台;最后,给出多线程代码到多核体系结构模型的映射方法,并给出系统性质的分析框架. 展开更多
关键词 安全关键系统 多核处理器 时间可预测 同步语言 AADL(architecture analysis and design language)
下载PDF
一种非结构化数据库的四面体数据模型 被引量:9
14
作者 李未 郎波 《中国科学:信息科学》 CSCD 2010年第8期1039-1053,共15页
文中针对非结构化数据管理提出了一种四面体模型.该模型用4个刻面分别描述了一个非结构化数据的基本属性、语义特征、底层特征以及原始数据等组成元素,并描述了这些元素之间的内在联系.设计了四面体模型的实现结构以及数据操作语言.四... 文中针对非结构化数据管理提出了一种四面体模型.该模型用4个刻面分别描述了一个非结构化数据的基本属性、语义特征、底层特征以及原始数据等组成元素,并描述了这些元素之间的内在联系.设计了四面体模型的实现结构以及数据操作语言.四面体模型能够实现各类非结构化数据的统一的、集成的以及关联的描述,并能够支持关联检索和数据挖掘等智能检索服务.最后给出了一个视频样例库中数据的描述与操作实例. 展开更多
关键词 非结构化数据 数据模型 查询语言 关联检索 智能服务
原文传递
一种基于算子的可扩展复杂事件处理模型 被引量:8
15
作者 孟由 栾钟治 +1 位作者 谢明 钱德沛 《软件学报》 EI CSCD 北大核心 2014年第11期2715-2730,共16页
随着大数据处理的深入发展,系统单位时间内产生的数据日趋庞大,数据间的关联关系日趋复杂,这使得传统的"存储-查询"或者"发布-订阅"的方式无法很好地满足诸如故障监控、股票分析、医疗及生命保障等对大数据具有实... 随着大数据处理的深入发展,系统单位时间内产生的数据日趋庞大,数据间的关联关系日趋复杂,这使得传统的"存储-查询"或者"发布-订阅"的方式无法很好地满足诸如故障监控、股票分析、医疗及生命保障等对大数据具有实时处理需求的系统.复杂事件处理技术实现的是将用户对特定的事件序列的查询需求映射到特定识别结构上.该结构从多个持续的数据流中分析并提取满足特定模式的事件序列.该技术能够很好地支持对大量数据进行实时在线分析.但由于在数据处理的过程中,系统不可能预置全部的查询语义,许多系统在使用过程中会需要使用新的语义,以查询新产生的模式.因此,一种支持扩展的语义的复杂事件处理模型是非常必要的.同时,现有的复杂事件处理模型仅针对某几类特定的查询进行描述以及优化,对整体模型缺乏统一描述,导致许多模型在多规则复杂查询的情况下效率欠佳.针对上述问题,提出了基于算子的可扩展复杂事件处理模型.该模型能够良好地支持现有的各类查询语义,具有较快的识别速度.基于该模型的形式化描述,对系统在识别过程中的性能消耗进行了详细分析,给出了模型构造最优算法.通过实验验证了算子模型优化方案的正确性.实验结果表明,经过优化后的树结构事件处理速度比开源复杂事件处理引擎Esper快3倍以上. 展开更多
关键词 事件处理 事件算子 实时处理 匹配树
下载PDF
基于神经网络的自动源代码摘要技术综述 被引量:7
16
作者 宋晓涛 孙海龙 《软件学报》 EI CSCD 北大核心 2022年第1期55-77,共23页
源代码的摘要可以帮助软件开发人员快速地理解代码,帮助维护人员更快地完成维护任务.但是,手工编写摘要代价高、效率低,因此人们试图利用计算机自动地为源代码生成摘要.近年来,基于神经网络的代码摘要技术成为自动源代码摘要研究的主流... 源代码的摘要可以帮助软件开发人员快速地理解代码,帮助维护人员更快地完成维护任务.但是,手工编写摘要代价高、效率低,因此人们试图利用计算机自动地为源代码生成摘要.近年来,基于神经网络的代码摘要技术成为自动源代码摘要研究的主流技术和软件工程领域的研究热点.首先阐述了代码摘要的概念和自动代码摘要的定义,回顾了自动代码摘要技术的发展历程,并介绍了生成式摘要的质量评估方法和评估指标;然后分析了神经代码摘要算法的通用结构、工作流程和面临的主要挑战;给出了代表性算法的分类,并对每类算法的设计原理、特点和限制条件进行了分析.最后,讨论并展望了未来神经代码摘要技术的发展趋势和研究方向. 展开更多
关键词 智能软件工程 代码摘要 程序理解 神经网络 深度学习
下载PDF
基于相关性反馈的开源系统跨层需求追踪方法 被引量:1
17
作者 田家豪 张莉 +1 位作者 连小利 赵倩慧 《软件学报》 EI CSCD 北大核心 2024年第3期1321-1340,共20页
大型复杂软件系统的需求分析与生成是一个由上而下逐层分解的过程,跨层需求间追踪关系的构建对于项目的管理、开发与演化都至关重要.开源系统的松耦合贡献方式需要每位参与者能便捷地理解需求的来龙去脉及需求状态,这依赖跨层需求间的追... 大型复杂软件系统的需求分析与生成是一个由上而下逐层分解的过程,跨层需求间追踪关系的构建对于项目的管理、开发与演化都至关重要.开源系统的松耦合贡献方式需要每位参与者能便捷地理解需求的来龙去脉及需求状态,这依赖跨层需求间的追踪.问题描述日志是开源系统中需求的常见呈现方式,其无固定模板要求,内容多样(含文本、代码、调试信息等),术语使用自由,跨层需求间抽象层次大,给自动追踪带来极大的挑战.提出一种面向关键特征维度的相关性反馈方法,通过静态分析项目代码结构,抽取代码相关术语及其间的关联强度,构建代码词汇库,以缓解跨层需求的抽象层次差距及用语不统一的问题;通过度量词汇对需求描述的重要性并基于此筛选关键特征维度,以对查询语句进行针对性的优化,有效减少需求描述长度、内容形式等方面的噪音.通过在3个开源系统需求集上针对两个场景的实验,表明所提方法相比基线方法在跨层需求追踪方面的优越性,相比VSM、Standard Rocchio和Trace BERT,F2值的最大提升分别可达29.01%、7.45%和59.21%. 展开更多
关键词 需求追踪 相关性反馈 开源系统 问题日志
下载PDF
面向多方安全的数据联邦系统 被引量:4
18
作者 李书缘 季与点 +4 位作者 史鼎元 廖旺冬 张利鹏 童咏昕 许可 《软件学报》 EI CSCD 北大核心 2022年第3期1111-1127,共17页
大数据时代,数据作为生产要素具有重要价值.因此,通过数据共享实现大规模数据的分析挖掘与利用具有重要意义.然而,近年来日益严格的隐私安全保护要求使得数据分散异质的多方之间不能任意共享数据,加剧了“数据孤岛”问题.数据联邦能让... 大数据时代,数据作为生产要素具有重要价值.因此,通过数据共享实现大规模数据的分析挖掘与利用具有重要意义.然而,近年来日益严格的隐私安全保护要求使得数据分散异质的多方之间不能任意共享数据,加剧了“数据孤岛”问题.数据联邦能让多数据拥有方在保护隐私的前提下完成联合查询.因此,基于“数据不动计算动”的联邦计算思想实现了一种多方安全的关系型数据联邦系统.该系统适配多种关系型数据库,能够为用户屏蔽底层多数据拥有方的数据异构性.系统基于秘密共享实现了支持多方安全的基础操作多方安全算子库,优化了算子的结果重建过程,提高了其执行效率.在此基础上,系统支持求和、求均值、求最值、等值连接和任意连接等查询操作,并充分利用多方特点减少各数据拥有方之间的数据交互,降低安全开销,从而有效支持高效数据共享.最后,在标准测试数据集TPC-H上进行实验,实验结果说明:与目前的数据联邦系统SMCQL和Conclave相比,该系统能够支持更多的数据拥有方参与,并且在多种查询操作上有更高的执行效率,最快可超越现有系统3.75倍. 展开更多
关键词 数据联邦 数据库系统 安全多方计算
下载PDF
路网感知的在线轨迹压缩方法 被引量:4
19
作者 左一萌 林学练 +1 位作者 马帅 姜家豪 《软件学报》 EI CSCD 北大核心 2018年第3期734-755,共22页
随着定位技术的高速发展,定位传感器被广泛应用于智能手机、车载导航等移动设备中,用于采集移动对象位置数据并将数据上传至服务器.该技术的应用方便了位置跟踪、预测和分析,同时也带来了轨迹数据量大、数据冗余、传输和存储代价高等问... 随着定位技术的高速发展,定位传感器被广泛应用于智能手机、车载导航等移动设备中,用于采集移动对象位置数据并将数据上传至服务器.该技术的应用方便了位置跟踪、预测和分析,同时也带来了轨迹数据量大、数据冗余、传输和存储代价高等问题.轨迹压缩技术即是针对该问题而提出的,它通过保留关键轨迹点和去除冗余轨迹点信息,降低了轨迹数据的传输和存储开销.分析了近年来轨迹压缩领域的研究进展,针对现有研究工作的不足,提出了一种路网感知的在线轨迹压缩方法,包括针对轨迹压缩的距离有界的隐马尔可夫地图匹配算法和误差有界的高效轨迹压缩算法等,实现了该方法的原型系统ROADER(road-network aware and error-bounded trajectory compression).基于真实数据集的实验结果表明,该系统在压缩率、误差和执行时间等方面均显著优于同类算法. 展开更多
关键词 时空数据时序数据压缩 轨迹压缩 地图匹配 在线压缩
下载PDF
基于时空信息转换方程的药品销量预测模型 被引量:1
20
作者 靳东辉 杨小博 郭炳晖 《计算机应用》 CSCD 北大核心 2023年第S01期107-111,共5页
针对药品销售中高维短时间序列预测问题,利用时空信息转换方程及储备池计算方法构建了一种基于时空信息(STI)转换方程的药品销售量预测模型。首先针对药品销售时间序列数据样本量较小的特点,引入储备池计算方法拓展数据样本信息维度,将... 针对药品销售中高维短时间序列预测问题,利用时空信息转换方程及储备池计算方法构建了一种基于时空信息(STI)转换方程的药品销售量预测模型。首先针对药品销售时间序列数据样本量较小的特点,引入储备池计算方法拓展数据样本信息维度,将多个不同药品销售量时序数据中的动力学信息引入储备池。使用时空信息转换方程对时间信息与空间信息进行转化,最后在储备池运算的基础上对时空信息转化方程求解,对目标药品的销售量进行有效的时间序列预测。通过将提出的基于时空信息转换方程的时序预测模型与神经网络预测模型在特定药品销售数据集进行时序预测验证并进行横向对比,相较于GRU(Gated Recurrent Unit),所提模型在测试时间节点上的均方根误差(MSE)及运算时间分别减小了13.27%和95.60%、皮尔逊相关系数提高了34个百分点;相较于长短期记忆模型(LSTM),所提模型在测试时间节点上的均方根误差及运算时间分别减小了69.85%和98.00%,而皮尔逊相关系数提高了44个百分点;相较于卷积神经网络模型(CNN),在测试节点的均方根误差及运算时间分别减少了48.96%和88.53%,皮尔逊相关系数提高了33个百分点。证明了基于时空信息转换方程的药品销售预测模型在测试集时间节点上的预测效果要优于GRU、LSTM、CNN时序预测模型,同时也说明模型具有更高的运算效率。 展开更多
关键词 医药销售 小样本学习 时序预测 时空信息转换方程 储备池计算 相关性分析
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部