pandas常用数据分析语法(一):数据导入
1.概述
导入
import pandas as pd
import numpy as np
data_file = 'Arrest_Data_from_2010_to_2019.csv'
df = pd.read_csv(data_file)
df.head()
数据大小
len(df_2018)
列的描述
df['Arrest Date'].describe()
2.去掉空值
#计算Dataframe中空值的个数
df_2018['Charge Group Description'].isnull().sum()
df_4=df_4.dropna(subset = ['Charge Group Description']);
3.建立矩阵
#复制
df_4 = df_2018.copy()
#新建
tempRatio = pd.DataFrame(columns=['Charge Group Code', 'Area ID', 'Ratio'])
#拼接
dfRatio = pd.concat([dfRatio,tempRatio], ignore_index=True)
series
yearData['year']= op.index
yearData['counts']= op.values
这篇博客介绍了Pandas库在数据导入、数据大小检查、处理空值以及创建矩阵等方面的基础操作。首先,通过`pd.read_csv()`函数导入CSV数据,并展示数据前几行。接着,利用`describe()`方法获取列的统计描述,使用`isnull().sum()`计算空值数量,并用`dropna()`去除空值。此外,展示了如何复制数据框、创建新的DataFrame以及拼接矩阵。最后,提到了将时间序列数据转化为Series的过程。
839

被折叠的 条评论
为什么被折叠?



