1.读取数据
pd.read_csv(filename)
#读取 CSV 文件
pd.read_excel(filename)
#读取 Excel 文件
pd.read_sql(query, connection_object)
#从 SQL 数据库读取数据
pd.read_json(json_string)
#从 JSON 字符串中读取数据
pd.read_html(url)
#从 HTML 页面中读取数据
2.查看数据
# 显示前五行数据
df.head()
# 显示后五行数据
df.tail()
# 显示数据信息
df.info()
# 显示基本统计信息
df.describe()
# 显示数据的行数和列数
df.shape
import pandas as pd
data = [
{"name": "Google", "likes": 25, "url": "https://www.google.com"},
{"name": "Baidu", "likes": 30, "url": "https://www.baidu.com"},
{"name": "Taobao", "likes": 35, "url": "https://www.taobao.com"}
]
df = pd.DataFrame(data)
# 显示前两行数据
print(df.head(2))
# 显示前最后一行数据
print(df.tail(1))
3.数据清洗
# 删除包含缺失值的行或列
df.dropna()
# 将缺失值替换为指定的值
df.fillna(0)
# 将指定值替换为新值
df.replace('old_value', 'new_value')
# 检查是否有重复的数据
df.duplicated()
# 删除重复的数据
df.drop_duplicates()