提出了一种新的稀疏数据立方计算方法CFD(Computation by Functional Dependencies),它采用自底向上的顺序划分数据立方的各个维,同时按自顶向下的顺序计算聚集,从而充分利用了数据立方的各个group-by之间的共性。CFD和以前所有的立方...提出了一种新的稀疏数据立方计算方法CFD(Computation by Functional Dependencies),它采用自底向上的顺序划分数据立方的各个维,同时按自顶向下的顺序计算聚集,从而充分利用了数据立方的各个group-by之间的共性。CFD和以前所有的立方计算方法不同:一是既能避免计算冰山数据立方中不满足最小支持度的grorp-by,同时也利用了聚集函数的特征来加速聚集计算;二是利用维之间的依赖关系能有效减少划分时间。实验表明,和以前的算法相比CFD的性能明显提高。展开更多
文摘提出了一种新的稀疏数据立方计算方法CFD(Computation by Functional Dependencies),它采用自底向上的顺序划分数据立方的各个维,同时按自顶向下的顺序计算聚集,从而充分利用了数据立方的各个group-by之间的共性。CFD和以前所有的立方计算方法不同:一是既能避免计算冰山数据立方中不满足最小支持度的grorp-by,同时也利用了聚集函数的特征来加速聚集计算;二是利用维之间的依赖关系能有效减少划分时间。实验表明,和以前的算法相比CFD的性能明显提高。