Pandas DataFrame 操作全解析
1. 数据计算与验证
在数据处理过程中,我们常常需要对数据进行计算和验证。例如,我们可以计算演员总脸书点赞数在演员与导演总脸书点赞数中所占的百分比。以下是具体的操作步骤:
# 计算演员总脸书点赞数在演员与导演总脸书点赞数中所占的百分比
movie['pct_actor_cast_like'] = (movie['actor_total_facebook_likes'] / movie['cast_total_facebook_likes'])
# 验证计算结果是否在 0 到 1 之间
print((movie['pct_actor_cast_like'].min(), movie['pct_actor_cast_like'].max()))
# 设置索引为电影标题,并输出该列的前几个值
print(movie.set_index('movie_title')['pct_actor_cast_like'].head())
这段代码首先计算了演员总脸书点赞数在演员与导演总脸书点赞数中所占的百分比,并将结果存储在新列 pct_actor_cast_like 中。然后,验证了该列的最小值和最大值是否在 0 到 1 之间。最后,将索引设置为电影标题,并输出该列的前几个值。
2. 插入新列
除了在 DataFrame 的末尾添加新列,我们还可以使用 insert 方法将新列插入到指定位置。以下是具体的操作步骤:
超级会员免费看
订阅专栏 解锁全文
1607

被折叠的 条评论
为什么被折叠?



