数据分析必掌握的统计学知识

统计学是数据分析的基础,包括基本统计量、概率分布、总体与样本、假设检验等核心概念。理解统计学能避免仅依赖平均数的粗糙分析,通过集中趋势(如均值、中位数)、变异性(如方差、标准差)和正态分布等,实现更科学的数据分析。此外,抽样分布、估计和假设检验等方法在验证分析和预测中起到关键作用。学习统计学有助于提升数据可视化和精细化分析能力。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

此文是《10周入门数据分析》系列的第7篇

想了解学习路线,可以先阅读 学习计划 | 10周入门数据分析


统计学是数据分析的基石。学了统计学,你会发现很多时候的分析并不靠谱。比如很多人都喜欢用平均数去分析一个事物的结果,但是这往往是粗糙的,不准确的。如果学了统计学,那么我们就能以更多更科学的角度看待数据。

大部分的数据分析,都会用到统计方面的以下知识,可以重点学习:

基本的统计量:均值、中位数、众数、方差、标准差、百分位数等

概率分布:几何分布、二项分布、泊松分布、正态分布等

总体和样本:了解基本概念,抽样的概念

置信区间与假设检验:如何进行验证分析

相关性与回归分析:一般数据分析的基本模型

通过基本的统计量,你可以进行更多元化的可视化,以实现更加精细化的数据分析。这个时候也需要你去了解更多的Excel函数来实现基本的计算,或者python、R里面一些对应的可视化方法。

有了总体和样本的概念,你就知道在面对大规模数据的时候,怎样去进行抽样分析。

你也可以应用假设检验的方法,对一些感性的假设做出更加精确地检验。

利用回归分析的方法,你可以对未来的一些数据、缺失的数据做基本的预测。

了解统计学的原理之后,你不一定能够通过工具实现,那么你需要去对应的找网上找相关的实现方法,也可以看书。先推荐一本非常简单的:吴喜之-《统计学·从数据到结论》。也可以看《商务与经济统计》,结合业务能更容易理解。

另外,如何精力允许,请掌握一些主流算法的原理,比如线性回归、逻辑回归、决策树、神经网络、关联分析、聚类、协同过滤、随机森林。再深入一点,还可以掌握文本分析、深度学习、图像识别等相关的算法。关于这些算法,不仅需要了解其原理,你最好可以流畅地阐述出来,还需要你知晓其在各行业的一些应用场景。如果现阶段不是工作刚需,可不作为重点。

本文算是一个知识点汇总,不做细致展开,让大家了解统计学有哪几大块,每一类分别用于什么样的分析场景。后面几篇会以实际案例的方式,细致讲讲描述性统计、概率分布等。

知识点汇总:

1.集中趋势

2.变异性

3.归一化

4.正态分布

5.抽样分布

6.估计

7.假设检验

8.T检验

一、集中趋势

1.众数

出现频率最高的数;

2.中位数

把样本值排序,分布在最中间的值;

样本总数为奇数时,中位数为第(n+1)/2个值;

样本总数为偶数时,中位数是第n/2个,第(n/2)+1个值的平均数;<

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值