祝贺我们组2019级硕士生谢榕彪及博士生李猛同学论文"Hash Adaptive Bloom Filter"被数据库领域顶会 IEEE International Conference on Data Engineering (ICDE 2021) 接收!
ICDE 是 IEEE 的旗舰会议,和SIGMOD,VLDB并称数据库领域三大顶会,入选中国计算机学会(CCF)A类会议,旨在解决设计,构建,管理和评估高级数据密集型系统和应用程序中的研究问题。在过去的三十多年中,IEEE ICDE 一直是研究人员,从业人员,开发人员和用户探索前沿思想并交流技术,工具和经验的领先论坛。
论文简介: 近年来,机器学习和传统索引的融合表现出强大潜力,但受限于学习型索引的昂贵计算开销,应用十分受限;针对filter索引,我们设计了一种哈希函数可变的filter结构HABF,不仅拥有和学习型索引相当的空间利用率,更大幅度提高索引查询效率。HABF的关键思想是为正键(元素在集合中)定制散列函数,以避免代价高昂的负键,并将定制的散列函数打包到名为 HashExpressor 的轻量级数据结构中。然后,在查询时给定一个元素,HABF遵循两轮模式来检查该元素是否在集合中。进一步,我们从理论上分析了HABF的性能并限定了预期的误报率。我们在代表性的数据集上进行了大量的实验,结果表明,HABF在精度、构造时间、查询时间和内存空间消耗方面优于标准Bloom过滤器及其前沿的变体。