数据科学中的统计、编程与算法知识
在数据科学领域,统计知识、编程语言的运用以及各种算法方法是非常重要的组成部分。下面将为大家详细介绍相关的内容。
统计学基础概念
- 随机变量 :它是一个从可能结果集合到值集合(例如实数)的函数。简单来说,随机变量可以将随机试验的结果用数值表示出来。
- 期望 :随机变量的期望是该随机变量所给出的递增值集合的平均值的极限。期望反映了随机变量取值的平均水平。
- 方差 :用于衡量总体与其均值的离散程度。数学上,随机变量 (X) 的方差是随机变量与 (X) 的均值 (\mu) 之差的平方的期望值,即 (Var(X) = E[(X - \mu)^2])。
- 标准差 :随机变量 (X) 的标准差是变量 (X) 的方差的平方根,即 (SD(X)=\sqrt{Var(X)})。标准差和方差一样,都是衡量数据离散程度的指标。
- 相关性 :是对随机变量之间依赖关系的度量。对于随机变量 (X) 和 (Y),相关性定义为 (corr(X,Y) = E[(X - \mu_X) * (Y - \mu_Y)]/(SD(X) * SD(Y)))。
- 因果关系 :是一种依赖关系,通过一个现象的发生来解释另一个现象的发生。需要注意的是,因果关系意味着存在相关性,但反之不成立。
- 斜率和截距 :在线性方程
超级会员免费看
订阅专栏 解锁全文
5万+

被折叠的 条评论
为什么被折叠?



