摘要
数据流处理的关键是应用高效的单趟扫描算法,创建数据流的概要结构。现有的概要结构存在着重构误差较大的缺点。作者针对这个问题,结合数据流分层遗忘概要结构,采用simHash算法提取数据流中的概要信息,形成一种新的数据流分层遗忘概要结构(simHash-Based Hierarchical Amnesic Synopsis,SH-HAS)。本文将SH-HAS结构用在CUP99和Covertype数据集上,实验验证了该结构的可靠性和稳定性。
出处
《电脑知识与技术》
2019年第5X期6-7,共2页
Computer Knowledge and Technology