Python pandas 是一款强大的数据分析工具,它可以帮助你在数据处理和分析方面更加高效和便捷。本文将介绍 pandas 的基本使用方法和常用操作。
一、导入 pandas
首先,你需要导入 pandas 库。在终端或命令行中输入以下命令即可:
python代码
import pandas as pd |
二、读取数据
pandas 可以方便地读取各种类型的数据,包括 CSV、Excel、SQL 数据库等。下面是一些常见的读取数据的方法:
-
读取 CSV 文件
python代码
df = pd.read_csv('file.csv') |
-
读取 Excel 文件
python代码
df = pd.read_excel('file.xlsx') |
-
读取 SQL 数据库
python代码
import sqlite3 | |
conn = sqlite3.connect('database.db') | |
df = pd.read_sql_query('SELECT * FROM table_name', conn) |
三、数据清洗
在数据处理过程中,经常需要进行数据清洗,以去除无效或错误的数据。pandas 提供了一系列方法,可以帮助你进行数据清洗。
-
去除空值
python代码
df = df.dropna() |
-
去除重复值
python代码
df = df.drop_duplicates() |
-
转换数据类型
python代码
df['column_name'] = df['column_name'].astype('new_type') |
四、数据分析和统计
pandas 提供了许多方法和属性,可以帮助你进行数据分析和统计。下面是一些常用的方法和属性:
-
基本统计信息
print(df.describe()) # 输出平均值、标准差、最小值、最大值等统计信息 |
本文介绍了Pythonpandas库的基础使用,包括导入、数据读取(CSV/Excel/SQL)、数据清洗(去空值、去重复值、转换类型)以及数据分析和统计功能。

被折叠的 条评论
为什么被折叠?



