目录:导入数据源、数据基本操作、描述性统计、缺失值处理、筛选、替换、排序、关联、聚合、数据透视表
备注:X和Y代表地理位置,month代表月份,day代表星期几,FFMC代表细小可燃物湿度码,DMC代表粗腐殖质湿度码,DC代表干旱码,ISI代表初始蔓延指数,temp代表温度,RH代表相对湿度,wind代表风速,rain代表降雨量,area代表地区。
一、导入数据源
#导入相关库
import pandas as pd
import numpy as np
import os
from pandas import DataFrame,Series
import re
df =pd.read_csv(r'E:\work\daima\python\forestfires.csv') #打开文件
导入数据的方式有很多种,我们这里只介绍其中一种。
二、数据基本处理
1)查看列名和数据类型
print(df.columns) #查看列名
print(df.dtypes) #查看各列数据类型
2)查看指定行列数据
print(df.head(20)) #查看前20行数据
df=df.loc[:,'FFMC':'rain'] #选择FFMC到rain列所有数据
3)删除行或列
df=df.drop(['wind', 'rain', 'area'],axis=1) #删除wind,rain和ar

本文介绍了使用Python进行Excel数据分析的十个关键步骤,包括数据源导入、基本操作、描述性统计、缺失值处理、筛选、替换、排序、关联、聚合以及数据透视表的创建。详细讲解了如何进行列名查看、删除重复项、填充缺失值、条件筛选、排序以及多表关联等操作,是Python数据处理的实用指南。
最低0.47元/天 解锁文章
184

被折叠的 条评论
为什么被折叠?



