两个变量的关系的统计分析及其案例

目录

第一章 数据简介 4

第二章 数据可视化原理 5

   2.1什么是数据可视化.........................................................................5

   2.2 运用到的可视化函数...................................................................5

第三章 统计假设检验 7

3.1 什么是假设检验 7

3.2 t假设检验的基本思想 7

3.3 t假设检验的基本步骤 8

第四章 数据处理代码以及结果 9

4.1源代码: 9

4.2运行结果及结论: 11

箱线图: 11

散点图: 11

数据假设检验结果: 12

  • 数据简介

下表是1985年美国50个州和哥伦比亚特区公立学校中教师的人均年工资y(美元)和对学生的人均经费投入x(美元)关系表:

  • 数据可视化原理

2.1什么是数据可视化

数据可视化,是关于数据视觉表现形式的科学技术研究。其中,这种数据的视觉表现形式被定义为,一种以某种概要形式抽提出来的信息,包括相应信息单位的各种属性和变量。

它是一个处于不断演变之中的概念,其边界在不断地扩大。主要指的是技术上较为高级的技术方法,而这些技术方法允许利用图形、图像处理计算机视觉以及用户界面,通过表达、建模以及对立体、表面、属性以及动画的显示,对数据加以可视化解释。与立体建模之类的特殊技术方法相比,数据可视化所涵盖的技术方法要广泛得多。

2.2 运用到的可视化函数

(1)箱线图

箱形图经常在学术刊物中被使用,用来表示两组或多组的数值。箱子的底部和顶部分别表示第一分位数和第三分位数,而箱子内部中间的线表示中位数。值得注意的是上下的须,存在着不同的习惯用法。最常见的形式是,下面的须表示在第一分位数外1.5×IQR(四分位距)范围内的最低值,而上面的须表示在第三分位数外1.5×IQR(四分位距)范围内的最高值。离群值(在上下须之外)被单独绘制。另一个习惯用法是,须表示了整个数据的范围。

boxplot函数中的关键属性:

x:指定要绘制箱线图的数据;

notch:是否是凹口的形式展现箱线图,默认非凹口;

sym:指定异常点的形状,默认为'o'号显示;

vert:是否需要将箱线图垂直摆放,默认垂直摆放;

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

可乐味的小明同学

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值