- 博客(8)
- 收藏
- 关注
原创 SQL语法和常用功能汇总
SQL语法和常用功能1. 基础概念数据库:保存有组织的数据的容器(通常是一个文件或一组文件)。表:某种特定类型数据的结构化清单。模式:关于数据库和表的布局及特性的信息。列:表中的一个字段,所有表都是由一个或多个列组成的。数据类型:所允许的数据的类型,每个表列都有相应的数据类型,它限制该列中存储的数据。行:表中的一个记录。主键:一列(或一组列),其值能够唯一标识表中的每一行。SQL...
2019-03-01 21:34:06
488
原创 《利用python进行数据分析》常见问题汇总(二)
利用python进行数据分析 麦金尼 代码实测常见问题汇总第6章 数据加载、存储与文件格式逐块读取文本文件调用Series的order属性出错tot = tot.order(ascending=False)具体报错:'Series' object has no attribute 'order'错误原因:python3以后Series的order属性改为sort_values()...
2019-02-25 10:25:07
2133
原创 《利用python进行数据分析》常见问题汇总(一)
利用python进行数据分析 麦金尼 代码实测常见问题汇总第1章 准备工作IPython安装及使用:开始菜单输入cmd进入命令行;输入"pip install ipython"进行安装;输入ipython进入IPython运行模式。书中示例数据下载地址:https://github.com/wesm/pydata-book/tree/1st-edition第2章 引言本书使用...
2019-02-17 20:58:24
4880
3
原创 统计学——时间序列预测
统计学(第6版) 贾俊平 读书笔记第13章 时间序列分析和预测时间序列是同一现象在不同时间上的相继观测值排列而成的序列。本书中用t表示所观察的时间,Y表示观察值,则Yi( i =1, 2, …, n)为时间ti上的观察值。时间序列可以分为平稳序列和非平稳序列两大类。非平稳序列是包含趋势、季节性或周期性的序列,又可以分为有趋势的序列、有趋势和季节性的序列、几种成分混合而成的复合型序列。趋势是...
2019-02-15 10:43:12
19500
原创 统计学——一元线性回归与多元线性回归
统计学(第6版) 贾俊平 读书笔记第11章 一元线性回归11.1 变量间关系的度量变量之间的关系可分为两种类型,即函数关系和相关关系。其中,函数关系是一一确定的关系,给定一个自变量x,因变量y依确定的关系取相应的值;变量之间存在的不确定性的数量关系,则称为相关关系。相关系数相关关系可以通过散点图和相关系数来反映。相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量,其计算公式...
2019-02-14 17:30:35
21142
原创 统计学——独立性与相关性检验
统计学(第6版) 贾俊平 读书笔记第9章 分类数据分析9.1 分类数据与χ2统计量统计数据的类型有分类数据、顺序数据和数值型数据。分类数据是对事物进行分类的结果。例如在泰坦尼克号海难的例子中,船上共2208人,其中男性1738人,女性470人。这里,性别是分类变量,有两个类别:男性和女性,男性和女性的人数都是事件结果,以频数的方式表现。χ2检验是对分类数据的频数进行分析的统计方法。χ2可以...
2019-02-14 10:50:24
20665
原创 统计学——参数估计与假设检验
统计学(第六版)贾俊平 读书笔记第 7 章 参数估计7.1 参数估计的基本原理参数估计就是用样本统计量去估计总体的参数。比如,用样本均值估计总体均值,用样本比例估计总体比例。在参数估计中,用来估计总体参数的统计量称为估计量。样本均值、样本比例、样本方差等都可以是一个估计量。而根据一个具体的样本计算出来的估计量的数值称为估计值。参数估计的方法有点估计和区间估计两种。点估计就是中样本统计量的...
2019-02-13 17:15:04
15867
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人