如何用Redis统计独立用户访问量？

发布时间：2021-03-09 13:13:34 所属栏目：动态来源：互联网

导读：点：简单，容易实现，查询也是非常方便，数据准确性非常高。缺点：占用内存过大，。随着key的增多，性能也会下降。小网站还行，拼多多这种数亿PV的网站肯定受不了。使用Bitset 我们知道，对于一个32位的int，如果我们只用来记录id，那么只能够记录一个用户

点：简单，容易实现，查询也是非常方便，数据准确性非常高。

缺点：占用内存过大，。随着key的增多，性能也会下降。小网站还行，拼多多这种数亿PV的网站肯定受不了。

使用Bitset

我们知道，对于一个32位的int，如果我们只用来记录id，那么只能够记录一个用户，但如果我们转成2进制，每位用来表示一个用户，那么我们就能够一口气表示32个用户，空间节省了32倍!

对于有大量数据的场景，如果我们使用bitset，那么可以节省非常多的内存。

对于没有登陆的用户，我们也可以使用哈希算法，把对应的用户标识哈希成一个数字id。bitset非常的节省内存，假设有1亿个用户，也只需要100000000/8/1024/1024约等于12兆内存。

优点：占用内存更小，查询方便，可以指定查询某个用户，数据可能略有瑕疵，对于非登陆的用户，可能不同的key映射到同一个id，否则需要维护一个非登陆用户的映射，有额外的开销。

缺点：如果用户非常的稀疏，那么占用的内存可能比方法一更大。

使用概率算法

对于拼多多这种多个页面都可能非常多访问量的网站，如果所需要的数量不用那么准确，可以使用概率算法。

事实上，我们对一个网站的UV的统计，1亿跟1亿零30万其实是差不多的。

在Redis中，已经封装了HyperLogLog算法，他是一种基数评估算法。这种算法的特征，一般都是数据不存具体的值，而是存用来计算概率的一些相关数据。

（编辑：通化站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

索尼中国地区 PS5 销	新款MacBook Air已在路
迫不及待了粉丝自制虚	你想知道视频如何加水