从中位数的不足说开去

本文探讨了统计学中平均数与中位数的使用场景及局限性,通过对比分析,阐述了两者在反映数据集中趋势时的不同优势与不足。文章指出,尽管中位数能在一定程度上避免极端值的影响,但它无法揭示数据的总体结构,也不能替代平均数在某些统计分析中的作用。

转载来源

    近日,看到一本书稿,主要内容是统计学和政府统计工作的基础知识。其中有一个问题,讲的是平均数和中位数。而讲中位数时,在介绍了其基本概念、作用之后,该书还指出了其两点不足。一是不能推算总体。因为其只是一系列个体数字由大到小排序后,位居中间的那个数字的数值,上面和下面的数字可能有各种各样的情况;二是不能分出结构。除非是把一个大的总体,再划分成若干小的总体,并在每个总体所有数字中寻找居中的那一个。但对一个或大或小的总体而言,中位数只有这么一个,没有更多的结构数据。

    坦率说,笔者虽然学过统计,且边干边学地几乎干了一辈子统计,但因为不是统计专业的科班出身,基础知识很不牢固。虽然这些年也说过、写过中位数,但还真的没有细想过这一指标的优缺点。曾几何时,我们都是用各种各样的平均数来说明问题,如平均工资、人均收入、人均GDP等等。而随着统计数据越来越受到各界的关注,对平均数的质疑之声也越来越高,“被平均”、“拖后腿”的说法也不胫而走,成为人们调侃统计数据的常用语。在质疑、调侃声中,一些貌似有专业味道的声音也日渐强烈,“为什么不用中位数?”我曾向以一位顶尖高校的教授解释过,因为工资统计表由各个单位填报,没有每个职工个人的数据;要不,您给我们指点指点。但这位教授既不说出具体办法,却依然对我们冷嘲热讽。

    终于有一天,我们的城乡居民可支配收入中位数横空出世了。记得笔者当时就曾在多家纸媒发文,除肯定此举的积极意义外也指出,即使使用中位数,高于和低于这个数字的也依然各占一半,也依然会有人感到与自己的实际情况不符。不过,此后几年,中位数的发布由年度延伸到季度,且既有全体居民的,也有分城镇居民和农村居民的,并与人均收入的分组数据同时发布,使各界可以对城乡居民的收入水平有全面和多角度的了解认识,社会各界的质疑之声也明显减弱了。近日看到这部书稿中关于中位数不足的介绍,我顿时想,当年社会上有人说“为什么不用中位数取代平均数”,但即使我们有中位数,也取代不了平均数啊!

    而由中位数的不足,或可以给我们以下启示:

    其一,一个统计指标能说明一定的问题,但也只能说明一定的问题。一个指标不可能说明和解决所有的问题。我们使用这个指标,就必须严格按照这个指标的口径范围把握,特别是一些国际通行的统计指标。而对一些非国际通行的指标,也要保持口径范围的一致性、连续性和可比性。

    其二,在条件允许的情况下,为了从不同的角度观察和分析问题,我们的统计指标应尽可能地多一些。所谓条件允许,就是不增加基层负担,且能够保证数据质量。在此前提下,我们可以也应该尽可能汇总生成更多一些的综合性指标。如中位数的发布,显然就属于这种情况。我们的居民收入调查进行了许多年,可以计算并发布中位数。但我们很长时间没有做这件事。后来做了,显然比不做要好得多。

    其三,在做好以上两点的基础上,我们的宣传、科普工作可以更加深入和到位。从当年社会强烈呼唤中位数、甚至呼吁以中位数替代平均数,到后来我们正式发布中位数,似乎鲜有声音像今天这样把两者的意义、作用、乃至利弊讲清楚。而从今往后,再有类似的情况,我们真的应该也可以把该说的话说到说透。您呼唤以中位数替代平均数,我们不仅把两者都提供给您,还要告诉您它们的作用和不足,以便于您更好地认识统计工作和使用统计数据。

【SCI复现】含可再生能源与储能的区域微电网最优运行:应对不确定性的解鲁棒性与非预见性研究(Matlab代码实现)内容概要:本文围绕含可再生能源与储能的区域微电网最优运行展开研究,重点探讨应对不确定性的解鲁棒性与非预见性策略,通过Matlab代码实现SCI论文复现。研究涵盖多阶段鲁棒调度模型、机会约束规划、需求响应机制及储能系统优化配置,结合风电、光伏等可再生能源出力的不确定性建模,提出兼顾系统经济性与鲁棒性的优化运行方案。文中详细展示了模型构建、算法设计(如C&CG算法、大M法)及仿真验证全过程,适用于微电网能量管理、电力系统优化调度等领域的科研与工程实践。; 适合人群:具备一定电力系统、优化理论和Matlab编程基础的研究生、科研人员及从事微电网、能源管理相关工作的工程技术人员。; 使用场景及目标:①复现SCI级微电网鲁棒优化研究成果,掌握应对风光负荷不确定性的建模与求解方法;②深入理解两阶段鲁棒优化、分布鲁棒优化、机会约束规划等先进优化方法在能源系统中的实际应用;③为撰写高水平学术论文或开展相关课题研究提供代码参考和技术支持。; 阅读建议:建议读者结合文档提供的Matlab代码逐模块学习,重点关注不确定性建模、鲁棒优化模型构建与求解流程,并尝试在不同场景下调试与扩展代码,以深化对微电网优化运行机制的理解。
个人防护装备实例分割数据集 一、基础信息 数据集名称:个人防护装备实例分割数据集 图片数量: 训练集:4,524张图片 分类类别: - Gloves(手套):工作人员佩戴的手部防护装备。 - Helmet(安全帽):头部防护装备。 - No-Gloves(未戴手套):未佩戴手部防护的状态。 - No-Helmet(未戴安全帽):未佩戴头部防护的状态。 - No-Shoes(未穿安全鞋):未佩戴足部防护的状态。 - No-Vest(未穿安全背心):未佩戴身体防护的状态。 - Shoes(安全鞋):足部防护装备。 - Vest(安全背心):身体防护装备。 标注格式:YOLO格式,包含实例分割的多边形坐标和类别标签,适用于实例分割任务。 数据格式:来源于实际场景图像,适用于计算机视觉模型训练。 二、适用场景 工作场所安全监控系统开发:数据集支持实例分割任务,帮助构建能够自动识别工作人员个人防护装备穿戴状态的AI模型,提升工作环境安全性。 建筑与工业安全检查:集成至监控系统,实时检测PPE穿戴情况,预防安全事故,确保合规性。 学术研究与创新:支持计算机视觉在职业安全领域的应用研究,促进AI与安全工程的结合。 培训与教育:可用于安全培训课程,演示PPE识别技术,增强员工安全意识。 三、数据集优势 精准标注与多样性:每个实例均用多边形精确标注,确保分割边界准确;覆盖多种PPE物品及未穿戴状态,增加模型鲁棒性。 场景丰富:数据来源于多样环境,提升模型在不同场景下的泛化能力。 任务适配性强:标注兼容主流深度学习框架(如YOLO),可直接用于实例分割模型开发,支持目标检测和分割任务。 实用价值高:专注于工作场所安全,为自动化的PPE检测提供可靠数据支撑,有助于减少工伤事故。
评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值