随着汽车行业的不断发展和智能化进程的加速,AUTOSAR已成为一种广泛采用的汽车软件架构标准,ARXML(AUTOSAR结构化文档)是该架构标准中描述车辆电子控制单元(electronic control unit,ECU)的重要资源。针对大量数据密度高且内容复杂的AR...随着汽车行业的不断发展和智能化进程的加速,AUTOSAR已成为一种广泛采用的汽车软件架构标准,ARXML(AUTOSAR结构化文档)是该架构标准中描述车辆电子控制单元(electronic control unit,ECU)的重要资源。针对大量数据密度高且内容复杂的ARXML文档查询处理效率的问题,提出了一种基于动态融合索引树的结构化文档查询处理算法。算法从节点关系规则出发,对单个文档中的内部节点和不同文档中节点之间的关系规则进行分析,在保留节点原始关系的同时构建了带有外部关系的节点关系结构,并基于结构化文档查询表达式对该结构进行改进,最后将其扩展成动态融合索引树结构,降低文档解析处理时间消耗,提高查询性能。复杂性分析和实验结果表明,使用动态融合索引树结构的文档查询效率高于现有的查询方法,具备一定的实用性。展开更多
随着有序时间序列数据的出现,序列模式挖掘成为数据挖掘领域的一个分支.其中带通配符的序列模式挖掘又是该领域中一个重要的研究问题,同时随着数据规模越来越大,算法的挖掘效率尤为重要.现有算法多采用树型结构来实现数据的压缩表示,树...随着有序时间序列数据的出现,序列模式挖掘成为数据挖掘领域的一个分支.其中带通配符的序列模式挖掘又是该领域中一个重要的研究问题,同时随着数据规模越来越大,算法的挖掘效率尤为重要.现有算法多采用树型结构来实现数据的压缩表示,树的结构和模式匹配方法对挖掘效率有决定性的影响.该文首先设计一个新的树结构索引树I-Tree(Index-Tree)来维护原始序列数据以及序列模式和模式索引信息;然后在索引树的基础上,提出一个新的带通配符的序列模式挖掘算法ITM(Index-Tree based sequential pattern Mining).算法ITM主要用4个策略提高算法的挖掘效率:(1)将原始序列中相同项压缩到一个节点上,该节点只记录项在原始序列中的索引;(2)采用迭代的方式,长度k+1的序列模式是用长度k(k>0)的候选序列模式产生;(3)采用前缀树的结构,逐层将k+1的候选序列模式压缩到索引树上,叶子节点上记录序列模式最后一项的索引;(4)整个挖掘过程,只用一棵索引树.算法ITM通过采用以上索引树压缩原始序列数据以及存储候选序列模式,有效地缩小搜索空间,从而算法效率得到显著提升.另一种提高挖掘效率的思路,是在挖掘过程中允许有小部分的模式丢失,来换取挖掘效率的大幅度提升,即所谓的近似模式挖掘.该文也给出了一个近似序列模式挖掘算法AITM(Approximate Index-Tree based sequential pattern Mining),该近似算法通过估计超序列模式的支持数,将非候选节点提前删掉,减少索引树上的节点个数,从而提高算法的时空效率;但是也因为估计的支持数可能会小于实际值,从而丢失了部分频繁的序列模式.该文实验中,提出的两个算法分别与算法MGCS、MAPB和MAPD进行了对比实验,采用3个典型数据序列进行测试,并设计了3组实验:(1)不同的最小支持度对算法的效率影响;(2)算法的扩展性;(3)通配符长度对算法效率�展开更多
针对传统无监督图像显著性目标检测鲁棒性不强、学习算法复杂度高的问题,提出了一种新的鲁棒无监督显著性目标检测方法--三元结构化矩阵分解目标检测。该方法利用低秩矩阵三元分解降低奇异值分解(singular value decomposition)的算法...针对传统无监督图像显著性目标检测鲁棒性不强、学习算法复杂度高的问题,提出了一种新的鲁棒无监督显著性目标检测方法--三元结构化矩阵分解目标检测。该方法利用低秩矩阵三元分解降低奇异值分解(singular value decomposition)的算法复杂度,结合高层先验知识,提升复杂背景下的显著性目标检测性能。通过分层稀疏正则化和构造索引树,解决显著图的细节缺失问题。在3种标准多目标数据集上对主流无监督显著性目标检测方法进行了实验对比,结果表明,所提方法学习时间最多可以降低40%,并且F-measure指标在超过50%的阈值范围内鲁棒性优于当前最好的无监督检测算法。展开更多
随着硬件和通信技术的飞速发展,数据流技术已广泛应用于金融分析、网络监控及传感器网络等诸多领域,这类应用通常具有高速、海量、连续和实时等特性.因此,在数据流上渐进、实时地更新索引成为一个极具价值和挑战性的问题.为了克服现有...随着硬件和通信技术的飞速发展,数据流技术已广泛应用于金融分析、网络监控及传感器网络等诸多领域,这类应用通常具有高速、海量、连续和实时等特性.因此,在数据流上渐进、实时地更新索引成为一个极具价值和挑战性的问题.为了克服现有支持频繁更新的索引树性能大都深受处理器缓存失效率的影响,提出了一种新颖的基于双Memo的量化R*索引树-QDM-Tree(Quantized R*-tree with Double Memos),并给出了相应的插入、删除、更新和范围查询算法,理论分析表明:与已有R*树及其变种相比,该索引树能成倍地压缩树结点,具有更强支持频繁更新的能力.展开更多
文摘随着汽车行业的不断发展和智能化进程的加速,AUTOSAR已成为一种广泛采用的汽车软件架构标准,ARXML(AUTOSAR结构化文档)是该架构标准中描述车辆电子控制单元(electronic control unit,ECU)的重要资源。针对大量数据密度高且内容复杂的ARXML文档查询处理效率的问题,提出了一种基于动态融合索引树的结构化文档查询处理算法。算法从节点关系规则出发,对单个文档中的内部节点和不同文档中节点之间的关系规则进行分析,在保留节点原始关系的同时构建了带有外部关系的节点关系结构,并基于结构化文档查询表达式对该结构进行改进,最后将其扩展成动态融合索引树结构,降低文档解析处理时间消耗,提高查询性能。复杂性分析和实验结果表明,使用动态融合索引树结构的文档查询效率高于现有的查询方法,具备一定的实用性。
文摘随着有序时间序列数据的出现,序列模式挖掘成为数据挖掘领域的一个分支.其中带通配符的序列模式挖掘又是该领域中一个重要的研究问题,同时随着数据规模越来越大,算法的挖掘效率尤为重要.现有算法多采用树型结构来实现数据的压缩表示,树的结构和模式匹配方法对挖掘效率有决定性的影响.该文首先设计一个新的树结构索引树I-Tree(Index-Tree)来维护原始序列数据以及序列模式和模式索引信息;然后在索引树的基础上,提出一个新的带通配符的序列模式挖掘算法ITM(Index-Tree based sequential pattern Mining).算法ITM主要用4个策略提高算法的挖掘效率:(1)将原始序列中相同项压缩到一个节点上,该节点只记录项在原始序列中的索引;(2)采用迭代的方式,长度k+1的序列模式是用长度k(k>0)的候选序列模式产生;(3)采用前缀树的结构,逐层将k+1的候选序列模式压缩到索引树上,叶子节点上记录序列模式最后一项的索引;(4)整个挖掘过程,只用一棵索引树.算法ITM通过采用以上索引树压缩原始序列数据以及存储候选序列模式,有效地缩小搜索空间,从而算法效率得到显著提升.另一种提高挖掘效率的思路,是在挖掘过程中允许有小部分的模式丢失,来换取挖掘效率的大幅度提升,即所谓的近似模式挖掘.该文也给出了一个近似序列模式挖掘算法AITM(Approximate Index-Tree based sequential pattern Mining),该近似算法通过估计超序列模式的支持数,将非候选节点提前删掉,减少索引树上的节点个数,从而提高算法的时空效率;但是也因为估计的支持数可能会小于实际值,从而丢失了部分频繁的序列模式.该文实验中,提出的两个算法分别与算法MGCS、MAPB和MAPD进行了对比实验,采用3个典型数据序列进行测试,并设计了3组实验:(1)不同的最小支持度对算法的效率影响;(2)算法的扩展性;(3)通配符长度对算法效率�
文摘针对传统无监督图像显著性目标检测鲁棒性不强、学习算法复杂度高的问题,提出了一种新的鲁棒无监督显著性目标检测方法--三元结构化矩阵分解目标检测。该方法利用低秩矩阵三元分解降低奇异值分解(singular value decomposition)的算法复杂度,结合高层先验知识,提升复杂背景下的显著性目标检测性能。通过分层稀疏正则化和构造索引树,解决显著图的细节缺失问题。在3种标准多目标数据集上对主流无监督显著性目标检测方法进行了实验对比,结果表明,所提方法学习时间最多可以降低40%,并且F-measure指标在超过50%的阈值范围内鲁棒性优于当前最好的无监督检测算法。
文摘随着硬件和通信技术的飞速发展,数据流技术已广泛应用于金融分析、网络监控及传感器网络等诸多领域,这类应用通常具有高速、海量、连续和实时等特性.因此,在数据流上渐进、实时地更新索引成为一个极具价值和挑战性的问题.为了克服现有支持频繁更新的索引树性能大都深受处理器缓存失效率的影响,提出了一种新颖的基于双Memo的量化R*索引树-QDM-Tree(Quantized R*-tree with Double Memos),并给出了相应的插入、删除、更新和范围查询算法,理论分析表明:与已有R*树及其变种相比,该索引树能成倍地压缩树结点,具有更强支持频繁更新的能力.