- 博客(5)
- 收藏
- 关注
原创 《利用Python进行数据分析》初阶例题分析-4:2012年联邦选举委员会数据库
从"fec"数据帧中选择出"cand_nm"列值为"Obama, Barack"或"Romney, Mitt"的行,并将结果赋值给变量"fec_mrbo"。n是我们想要获取的前n个最大值的数量。这段代码首先使用groupby()函数对fec_mrbo数据集按cand_nm和contbr_st进行分组,然后使用grouped[“contb_receipt_amt”].sum().unstack(level=0)计算每个分组中contb_receipt_amt的总和,并将结果转换为数据框的形式。
2023-07-12 21:24:40
119
1
原创 《利用Python进行数据分析》初阶例题分析-3:美国农业部视频数据库
索引出key为"description", “group”, “id”, "manufacturer"的数据并保存为dataframe的形式,展示前五行数据和信息。这种形式的数据不适合分析,所以需要做一些工作将数据转换成更好的形式。接下来将nutrients对应的值转化为dataframe的形式,最后展示前七行数据。使用 .loc[] 方法选择 “Amino Acids” 索引的行,并获取 “food” 列的值。将db中的键为nutrients的数据逐个添加到nutrients这个列表中。
2023-07-12 21:15:15
208
1
原创 《利用Python进行数据分析》初阶例题分析-2:美国1880-2010年的婴儿名字
将出生的人按年份与性别做成透视表,使用pivot_table()函数创建了一个数据透视表total_births,其中聚合了"births"列,以"year"作为行索引,以"sex"作为列索引,并使用sum函数进行聚合。定义了一个名为add_prop的函数,用于在groupby操作中添加一个名为"prop"的新列,该列计算每个组内的出生人数占总出生人数的比例。2010年出生的男孩按取名概率降序排列,并计算累计和,0.5出现在第116个名字,而1900年仅仅出现在24个名字,大众名字确实在减少。
2023-07-12 21:04:02
485
1
原创 《利用Python进行数据分析》初阶例题分析-1:MoviesLens 1M数据集
GroupLens实验室提供了一些从MoviesLens用户那里收集的20世纪90年代末到21世纪初的电影评分数据的集合。
2023-07-12 20:46:35
387
1
原创 五分钟快速掌握windows深度学习环境配置:Anaconda、PyCharm、Pytorch、jupyter notebook
新手五分钟掌握windows深度学习环境配置:Anaconda、PyCharm、Pytorch、jupyter notebook
2023-07-04 08:41:03
962
12
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人