-
Cython中的咆哮位图:roaringbitmap
资源介绍
Cython中咆哮的位图
咆哮的位图是一种有效的压缩数据结构,用于存储一组整数。 咆哮位图将一组32位整数存储在一系列数组和位图中,以空间最小的方式(始终为2 ** 16位或更小)。
此数据结构可用于存储大量整数,例如,用于搜索引擎和数据库使用的倒排索引。 特别是,可以快速计算一系列集合的交集,这些交集可用于将查询实现为子查询的并集。
此实现基于和上的Java和C实现。
此实现的其他功能:
倒排列表表示:大部分已满的块都紧凑地存储为非成员数组(而不是成员数组或固定大小的位图)。
不变的咆哮位图的集合可以通过mmap有效地序列化到单个文件中。
CRoaring缺少功能:
游程编码块
各种AVX2 / SSE优化
另请参阅PyRoaringBitmap,CRoaring的Python包装器: :
执照,要求
该代码已根据GNU GPL v2或您选择的任何更高版本授权。
Py