期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
多维布隆算法在Redis指纹自动过期中的应用 被引量:1
1
作者 贾小云 杜晓旭 《计算机应用与软件》 北大核心 2020年第8期33-38,共6页
针对Scrapy-Redis框架占用空间严重,且Redis一旦键过期就会删除全部去重集合内数据的情况,设计基于多维Bloom过滤器的指纹自动过期算法,并采用Python语言实现。实现后的代码通过替换去重类和修改框架内方法等操作,集成到Scrapy-Redis框... 针对Scrapy-Redis框架占用空间严重,且Redis一旦键过期就会删除全部去重集合内数据的情况,设计基于多维Bloom过滤器的指纹自动过期算法,并采用Python语言实现。实现后的代码通过替换去重类和修改框架内方法等操作,集成到Scrapy-Redis框架中。在测试阶段,将使用重构后框架与使用Redis散列表设置指纹过期时间的方法进行了对比,结果显示重构后框架更能在大规模爬虫中节省大量空间,同时能够在满足误判率低于万分之一的情况下实现指纹的自动过期。 展开更多
关键词 多维布隆算法 Scrapy-Redis 指纹过期 爬虫 亿级规模
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部