Redis之HyperLogLog

本文深入解析HyperLogLog数据结构,一种基于基数算法的独立总数统计方法,尤其适用于微博日活、月活数统计。介绍了pfadd、pfcount、pfmerge三个核心指令,对比了HLL与Bitmaps在数据获取、误差容忍度及内存消耗上的区别。

一、数据结构
实质字符串,基于基数算法,利用极小的内存空间完成独立总数的统计。
二、常用指令三个

1、pfadd key element[element...]
pfadd user:view:20200822 "uuid1" "uuid2" "uuid3"
2、pfcount key [key...]
pfcount user:view:20200822
3、pfmerge destkey sourcekey[sourcekey...]
pfmerge user:view:20200822_20200823 user:view:20200822 user:view:20200823
pfcount user:view:20200822_20200823

三、使用场景:主要用于统计独立总数,譬如微博统计日活数,月活数
注意:
1、只为了统计总数,而不需要获取单条数据。
2、允许一定范围误差。毕竟节省内存。官方百万误差率0.81%

四、HLL和Bitmaps的区别
1、Bitmaps可以获取单条数据,如获取某id用户某天是否访问过网站,HLL 则不行。
2、Bitmaps无误差,但HHL 海量数据下更节省内存。
3、Bitmaps 可汇总的指令多,and/or/not/xor 等,HLL 只可以求并集。

一、基础信息 数据集名称:Bottle Fin实例分割数据集 图片数量: 训练集:4418张图片 验证集:1104张图片 总计:5522张图片 分类类别: - 类别0: 数字0 - 类别1: 数字1 - 类别2: 数字2 - 类别3: 数字3 - 类别4: 数字4 - 类别5: 数字5 - 类别6: Bottle Fin 标注格式:YOLO格式,包含多边形坐标,适用于实例分割任务。 数据格式:图片格式常见如JPEG或PNG,具体未指定。 二、适用场景 实例分割AI模型开发:数据集支持实例分割任务,帮助构建能够精确识别和分割图像中多个对象的AI模型,适用于对象检测和分割应用。 工业自动化与质量控制:可能应用于制造、物流或零售领域,用于自动化检测和分类物体,提升生产效率。 计算机视觉研究:支持实例分割算法的学术研究,促进目标检测和分割技术的创新。 教育与实践培训:可用于高校或培训机构的计算机视觉课程,作为实例分割任务的实践资源,帮助学生理解多类别分割。 三、数据集优势 多类别设计:包含7个不同类别,涵盖数字和Bottle Fin对象,增强模型对多样对象的识别和分割能力。 高质量标注:标注采用YOLO格式的多边形坐标,确保分割边界的精确性,提升模型训练效果。 数据规模适中:拥有超过5500张图片,提供充足的样本用于模型训练和验证,支持稳健的AI开发。 即插即用兼容性:标注格式直接兼容主流深度学习框架(如YOLO),便于快速集成到各种实例分割项目中。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值