import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
movie1 = movie = pd.read_csv("./IMDB-Movie-Data.csv")
np.any(pd.isnull(movie1)) #判断里面是否有一个缺失值,有就还回True
np.all(pd.notnull(movie1)) #判断里面是否有一个缺失值,有就还回False
np.any(pd.isnull(data)) #判断里面是否有一个缺失值,有就还回True
movie1["Revenue (Millions)"].head(10)
movie1["Revenue (Millions)"].fillna(value=movie1["Revenue (Millions)"].mean()).head(10)
for i in movie1.columns:
if np.any(pd.isnull(movie1[i])) == True:
movie1[i].fillna(value=movie[i].mean(),inplace=True)
np.any(pd.isnull(movie1)) #判断里面是否有一个缺失值,有就还回True
movietemp = movie1.replace(to_replace="?",value=np.nan)#如果有?这个问号,可以这样来替换
movietemp = movietemp.dropna()#如果有缺失值,可以

该博客展示了如何使用Pandas处理电影数据中的缺失值,包括填充平均值和删除含有缺失值的行。同时,它探讨了如何获取电影的平均评分、导演数量,并展示了电影评分和时长的分布情况。最后,通过处理电影分类数据,实现了统计各类型电影的分布。
最低0.47元/天 解锁文章
2070

被折叠的 条评论
为什么被折叠?



