25、数据可视化与机器学习基础

数据可视化与机器学习基础

1. 数据可视化相关发现

在数据可视化的探索中,有一个令人惊讶的发现:80 岁的女性在分段时间方面似乎表现优于其他人。不过,这可能是因为该年龄段的跑步者数量较少,我们是基于少量数据来估计分布的。以下代码可以验证该年龄段的跑步者数量:

In[38]: (data.age > 80).sum()
Out[38]: 7

接着,我们关注那些后半程速度更快的男性跑步者。这些跑步者是哪些人呢?分段时间比例与快速完成比赛是否相关?我们可以很容易地通过绘图来探究这个问题。使用 regplot 函数,它会自动对数据进行线性回归拟合:

In[37]: g = sns.lmplot('final_sec', 'split_frac', col='gender', data=data,
                       markers=".", scatter_kws=dict(color='c'))
        g.map(plt.axhline, y=0.1, color="k", ls=":");

从绘制的图表中可以看出,那些分段时间快的人通常是精英跑步者,他们能在约 15000 秒(约 4 小时)内完成比赛。而速度较慢的人后半程速度变快的可能性要小得多。

2. 数据可视化资源

2.1 Matplotlib 资源

Matplotlib 是一个强大的 Pyth

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值