rating_by_title=data.groupby('title').size()
[/code]
按评论数降序排列
```code
rating_by_title.sort_values(ascending=False)[:10]
[/code]
```code
title
Pulp Fiction (1994) 67310
Forrest Gump (1994) 66172
Shawshank Redemption, The (1994) 63366
Silence of the Lambs, The (1991) 63299
Jurassic Park (1993) 59715
Star Wars: Episode IV - A New Hope (1977) 54502
Braveheart (1995) 53769
Terminator 2: Judgment Day (1991) 52244
Matrix, The (1999) 51334
Schindler's List (1993) 50054
dtype: int64
[/code]
```code
#筛选一万以上的评论
active_title=rating_by_title.index[rating_by_title>=10000]
#得出这部分影片的平均分
mean_ratings=data.pivot('rating','title',aggfunc='mean')
mean_ratings=mean_ratings.ix[active_title]
#按分数从多到少排序
mean_ratings.sort_values(by=['rating'],ascending=False)
#评论数与评分差距较大的电影
rating_std_by_title=data.groupby('title')['rating'].std()
rating_std_by_title.sort_values(ascending=False)
[/code]

本文通过数据分析展示了不同电影的评论数量及评分情况,包括评论数量最多的前十部电影及其平均评分,并探讨了评分标准差较大的电影。
9636

被折叠的 条评论
为什么被折叠?



