漫画:什么是Bitmap算法?
2021-03-17 09:24
标签:去重 and 需求 内存数据库 star 利用 元素 end 数据库 两个月之前—— 为满足用户标签的统计需求,小灰利用Mysql设计了如下的表结构,每一个维度的标签都对应着Mysql表的一列: 要想统计所有90后的程序员该怎么做呢? 用一条求交集的SQL语句即可: Select count(distinct Name) as 用户数 from table whare age = ‘90后‘ and Occupation = ‘程序员‘ ; 要想统计所有使用苹果手机或者00后的用户总合该怎么做? 用一条求并集的SQL语句即可: Select count(distinct Name) as 用户数 from table whare Phone = ‘苹果‘ or age = ‘00后‘ ; 两个月之后—— ——————————————— 给定长度是10的bitmap,每一个bit位分别对应着从0到9的10个整型数。此时bitmap的所有位都是0。 把整型数4存入bitmap,对应存储的位置就是下标为4的位置,将此bit置为1。 把整型数2存入bitmap,对应存储的位置就是下标为2的位置,将此bit置为1。 把整型数1存入bitmap,对应存储的位置就是下标为1的位置,将此bit置为1。 要问此时bitmap里存储了哪些元素?显然是4,3,2,1,一目了然。 Bitmap不仅方便查询,还可以去除掉重复的整型数。 让每一个标签存储包含此标签的所有用户ID,每一个标签都是一个独立的Bitmap。 几点说明: 本文的灵感来源于京东金融数据部张洪雨同学的项目经历,感谢这位大神的技术分享。 —————END————— 喜欢本文的朋友们,欢迎长按下图关注订阅号梦见,收看更多精彩内容 漫画:什么是Bitmap算法? 标签:去重 and 需求 内存数据库 star 利用 元素 end 数据库 原文地址:https://blog.51cto.com/14982143/2550926