4、数据中的命名趋势与IPython使用技巧

数据中的命名趋势与IPython使用技巧

一、命名趋势分析

在数据分析中,我们可以利用数据集来探究各种有趣的命名趋势。这里我们使用前1000名的数据集进行相关研究。

  1. 按性别拆分数据
    首先,我们可以很容易地将前1000名的名字拆分为男孩和女孩两部分:
    python boys = top1000[top1000.sex == 'M'] girls = top1000[top1000.sex == 'F']
  2. 绘制简单时间序列图
    像每年叫John或Mary的人数这样的简单时间序列可以绘制出来,但需要进行一些数据处理才能更有用。我们可以创建一个按年份和名字统计总出生人数的透视表:
    python total_births = top1000.pivot_table('births', rows='year', cols='name', aggfunc=sum)
    然后,我们可以使用DataFrame的plot方法绘制几个名字的时间序列图:
    python subset = total_births[['John', 'Harry', 'Mary', 'Marilyn']] subset.plot(subplots=True, figsize=(12, 10), grid=False, title="Number of births per year")
    从图中可能会得出这些名字在美国人群中不再受欢迎的结论,但实际情况可能更复杂。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值