大家好,在使用Pandas分析数据时,会使用Pandas函数来过滤和转换列,连接多个数据帧中的数据等操作。但是,生成图表将数据在数据帧中可视化,通常比仅仅查看数字更有帮助。
Pandas具有几个绘图函数,可以使用它们快速轻松地实现数据可视化,文中将介绍这些函数。
一、创建Pandas数据帧
首先创建一个用于分析的示例数据帧,将数据帧命名为df_employees
,其中包含员工记录。我们将使用Faker和NumPy的随机模块来填充数据帧,生成200条记录。
注意:如果开发环境中没有安装Faker,请使用pip安装:pip install Faker
。
运行以下代码片段来创建df_employees
,并向其中填充记录:
import pandas as pd
from faker import Faker
import numpy as np
# 实例化Faker对象
fake = Faker()
Faker.seed(27)
# 为员工创建一个数据帧
num_employees = 200
departments = ['Engineering', 'Finance', 'HR', 'Marketing', 'Sales', 'IT']
years_with_company = np.random.randint(1, 10, size=num_employees)
salary = 40000 + 2000 * years_with_company * np.random.randn()
employee_data = {
'EmployeeID': np.arange(1, num_employees + 1),
'FirstName': [fake.first_name() for _ in range(num_employees)],
'LastName': [fake.last_name() for _ in range(num_employees)],
'Age': np.random.randint(22, 60, size=num_employees),
'