【读书笔记】只有浅出没有深入的数据分析(九)

在第九章主要讲解了直方图的使用,直方图主要用来度量数据的“分布,差异,集中趋势等”。

这里是“我们”想要加薪,但是也害怕被“打回原形”,或者被“封存”,这里给出了历年的加薪记录,这里有3000个人的记录。

按照书中的思路,我们先看一下加薪的分布。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

df = pd.read_csv('./hfda_data/hfda_ch09_employees.csv')

plt.figure(1)

plt.hist(df.iloc[::, 1], bins=np.arange(0, 25, 1), density=1, histtype='bar',
         facecolor='blue', edgecolor='black', rwidth=0.8, alpha=1)
plt.xlim(0, 25)
plt.xticks(np.arange(0, 25, 1))
plt.show()

看到这里作者用了r语言来制作直方图,看来我们之前设置的rwidth有点多此一举了,而且作者这次用了50个bins(breaks=50)

我们这里也更改一下

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

df = pd.read_csv('./hfda_data/hfda_ch09_employees.csv')

plt.figure(1)

plt.hist(df.iloc[::, 1], bins=np.arange(0, 25, 0.5), density=1, histtype='bar',
         facecolor='blue', edgecolor='black', alpha=1)
plt.xlim(0, 25)
plt.show()

同时书中用r语言显示了实际加薪列的汇总值,我们这里用

df.iloc[::, 1].describe()

就可以得到。

书中又将数据分成了不同的子集来制作直方图:

plt.hist(df[df.year == 2007].iloc[::, 1], bins=np.arange(0, 25, 0.5), density=1, histtype='bar',
         facecolor='blue', edgecolor='black', alpha=1)

这里我们只考虑 df.year列等于2007的数据,如果用其他子集方法一致,这里就不进行一一列举了。

书中最后计算了谈判与否两个子集的平均值 标准差等。我们这里也试着计算一下。

df[df.negotiated == True].iloc[::, 1].describe()
df[df.negotiated == False].iloc[::, 1].describe()

得到的结果与数中不一致,这里我又打开numbers表格计算了一遍,答案与pandas结论相符,可能使用的原始数据与作者不一致所致(原书276页)

我们得到的谈判的标准差在3左右,未谈判的在0.965左右。谈判平均增幅8%,未谈判5%,在25%的一栏中谈判加薪的就已经超过了未加薪的,因此谈判还是很有必要的(结论与书中一致)。

 

这是阅读中第二次发现书中的问题(第一次为贝叶斯公式那章),书中也可能存在其他问题,而我没有发现。请各位读书的过程中仔细一些,以免将一些错误当作正确的知识学习了。

内容概要:本文档详细介绍了基于Google Earth Engine (GEE) 构建的阿比让绿地分析仪表盘的设计与实现。首先,定义了研究区域的几何图形并将其可视化。接着,通过云掩膜函数和裁剪操作预处理Sentinel-2遥感影像,筛选高质量的数据用于后续分析。然后,计算中值图像并提取NDVI(归一化差异植被指数),进而识别绿地及其面积。此外,还实现了多个高级分析功能,如多年变化趋势分析、人口-绿地交叉分析、城市热岛效应分析、生物多样性评估、交通可达性分析、城市扩张分析以及自动生成优化建议等。最后,提供了数据导、移动端适配和报告生成功能,确保系统的实用性和便捷性。 适合人群:具备一定地理信息系统(GIS)和遥感基础知识的专业人士,如城市规划师、环境科学家、生态学家等。 使用场景及目标:①评估城市绿地分布及其变化趋势;②分析绿地与人口的关系,为城市规划提供依据;③研究城市热岛效应及生物多样性,支持环境保护决策;④评估交通可达性,优化城市交通网络;⑤监测城市扩张情况,辅助土地利用管理。 其他说明:该系统不仅提供了丰富的可视化工具,还集成了多种空间分析方法,能够帮助用户深入理解城市绿地的空间特征及其对环境和社会的影响。同时,系统支持移动端适配,方便随时随地进行分析。用户可以根据实际需求选择不同的分析模块,生成定制化的报告,为城市管理提供科学依据。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值