1、简介
最近在学习数据分析,这也是python比较热门的一个方向,结合爬虫能分析许多东西,数据是在kaggle上找到的,上面很多实用性很强的数据,每个数据也有国外大佬做的分析实例,可以借鉴
kaggle
本文的分析有两部分:一、运动员的年龄分布。二、运动员能力与薪资的分布关系
!!!本文所有代码都是在python交互模式jupyter下完成的,只是不会用优快云写入=.=!!!
2、需要用到的库
import pandas as pd
import matplotlib.pyplot as plt
#为了让图片显示在交互模式界面
%matplotlib inline
3、代码正文
#读取csv文件
df = pd.read_csv('data.csv')
df.head()

读取文件后用head()方法可以查看csv文件的前5行,包括索引、标头等信息
#判断数据中是否有缺失值
df.isnull().any()

#将缺失值填充
new_df = df.fillna(0)
#再次判断是否有缺失值,以及每一列值的类型
new_df.info()

本文使用Python对FIFA球员数据进行分析,探讨球员年龄分布及能力与薪资的关联。首先检查数据,处理缺失值,接着分析球员年龄分布,通过饼图展示各年龄段占比。然后,通过散点图揭示球员能力值与薪资的分布关系,对数据进行预处理,包括去除欧元符号、'K'标志和零值。整个分析过程在Jupyter Notebook环境下进行。
最低0.47元/天 解锁文章
2628

被折叠的 条评论
为什么被折叠?



