使用 Pandas 库(数据框架)
1. 创建 DataFrame
要创建具有自定义列和数据的 DataFrame:
import pandas as pd
data = {
'元素': ['地球', '水', '火', '空气'],
'符号': ['🜃', '🜄', '🜂', '🜁']
}
df = pd.DataFrame(data)
2. 从 CSV 文件读取数据
要从 CSV 文件中读取数据,并将其转换为 DataFrame:
df = pd.read_csv('elements.csv')
3. 检查前几行数据
要获取 DataFrame 的前几行:
print(df.head())
4. 选择列
要从 DataFrame 中选择特定的列:
symbols = df['符号']
5. 过滤行
要在 DataFrame 中筛选行,选择满足条件的行:
火元素 = df[df['元素'] == '火']
6. 创建新列
要在 DataFrame 中创建基于数据派生的新列:
df['长度'] = df['元素'].apply(len)
7. 分组和聚合数据
要将数据分组并通过聚合提取新数据:
元素分组 = df.groupby('元素').agg({'长度': 'mean'})
8. 合并 DataFrame
要将两个 DataFrame 编织在一起,通过共享键将它们连接起来:
df2 = pd.DataFrame({'元素': ['地球', '火'], '品质': ['固体', '等离子体']})
合并后的_df = pd.merge(df, df2, on='元素')
9. 处理缺失数据
要清理 DataFrame,在数据缺失的地方填充空白:
df.fillna(value='未知', inplace=True)
10. 透视和重塑数据
要转换 DataFrame 的形状,通过透视操作揭示隐藏的模式和结构:
透视后的_df = df.pivot(index='元素', columns='符号', values='长度')
使用 Numpy 库(数组)
1. 创建 NumPy 数组
要创建一个数组:
import numpy as np
array = np.array([1, 2, 3, 4, 5])
2. 0 或 1 数组
要创建由零填充的数组:
zeros = np.zeros((3, 3)) # 一个 3x3 的零数组
ones = np.ones((2, 4)) # 一个 2x4 的 1 数组
3. 创建数字范围
要创建一个数字序列:
range_array = np.arange(10, 50, 5) # 从 10 到 50,步长为 5
4. 创建线性间隔数组
要创建一系列值,介于两个边界之间均匀间隔:
线性间隔 = np.linspace(0, 1, 5) # 从 0 到 1,共 5 个值
5. 重塑数组
要改变数组的形状,改变其维度:
重塑后的 = np.arange(9).reshape(3, 3) # 将一个 1D 数组重塑为 3x3 的 2D 数组
6. 基本数组操作
要对数组执行元素操作:
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])
和 = a + b # 逐元素加法
差 = b - a # 逐元素减法
积 = a * b # 逐元素乘法
7. 矩阵乘法
基本的点乘运算:
结果 = np.dot(a.reshape(1, 3), b.reshape(3, 1)) # a 和 b 的点积
8. 访问数组元素
使用有用的语法访问数组元素:
元素 = a[2] # 检索数组 'a' 的第三个元素
行 = 重塑后的[1, :] # 检索 '重塑后的' 的第二行
9. 布尔索引
通过条件筛选数组元素:
筛选后的 = a[a > 2] # 大于 2 的 'a' 的元素
10. 聚合和统计
对 np 数组进行统计操作:
均值 = np.mean(a)
最大值 = np.max(a)
总和 = np.sum(a)
615

被折叠的 条评论
为什么被折叠?



