
统计学系列
to be a good girl
数据分析,SQL,机器学习
升级打怪
展开
-
回归分析
前言本文只是记录回归分析中所可能使用到的代码,具体的知识点及调参方法并未记录from sklearn.model_selection import train_test_splitimport numpy as npfrom sklearn import datasets,linear_modelimport pandas as pddata = pd.read_csv("data...原创 2020-02-02 22:53:27 · 403 阅读 · 0 评论 -
python 抽样分布实践
本次选取泰坦尼克号的数据,利用python进行抽样分布描述,主要是提供实现代码,具体的理论知识不会过多涉及。(注:是否服从T分布不是进行t检验~)字段说明:Age:年龄,指登船者的年龄。Fare:价格,指船票价格。Embark:登船的港口。需要验证的是:1、验证数据是否服从正态分布?2、验证数据是否服从T分布?3、验证数据是否服从卡方分布?我们选取年龄作为栗子进行数据验证。...原创 2019-12-08 23:07:58 · 575 阅读 · 0 评论 -
Python实现概率分布
一、概率分布概率分布,是概率论的基本概念之一,主要用以表述随机变量取值的概率规律。为了使用的方便,根据随机变量所属类型的不同,概率分布取不同的表现形式。概率分布包括离散概率分布和连续概率分布。离散数据:数据由一个个单独的数值组成,其中的每一个数值都有相应概率。连续数据:数据涵盖的是一个范围,这个范围内的任何一个数值都有可能成为事件的结果。离散概率分布包括:伯努利分布、二项分布、几何分布、...转载 2019-11-24 23:55:49 · 1628 阅读 · 0 评论 -
统计学系列:平均工资背后的统计学知识
0x00 前言让我们从最近很火的一个小案例入手:前些日子,腾讯发表了上半年的财报,随后,“腾讯月平均工资破7万”的消息不胫而走,也因此催生了不少柠檬树。不管你酸不酸,反正我是很酸的,于是乎,就跑去问了居士:“大佬,你的工资有7w+吗?”居士曰:“我倒是希望我的工资能有7w+…”他这么一说,我突然就不酸了,哈哈哈,原来居士也是“被平均”了的一分子(可能这就是一种阿Q式的心理安慰了)。那么站在统...原创 2019-09-05 17:33:36 · 3324 阅读 · 0 评论 -
数据的概括性度量
数据的概括性度量中所用到的相关知识点词汇:相关的代码实现:import pandas as pdimport numpy as npimport matplotlib.pyplot as pltpath = "D:\\数据\\wblc\\breast-cancer-wisconsin_data.csv"data = pd.read_csv(path, encoding = "UTF...原创 2019-10-05 15:43:09 · 1052 阅读 · 0 评论