Python实用代码片段(六)

最新推荐文章于 2025-12-18 08:31:44 发布

原创最新推荐文章于 2025-12-18 08:31:44 发布 · 473 阅读

8 ·

CC 4.0 BY-SA版权

文章标签：

#python #开发语言

Python 专栏收录该内容

58 篇文章

订阅专栏

使用 Pandas 库（数据框架）

1. 创建 DataFrame

要创建具有自定义列和数据的 DataFrame：

import pandas as pd  
data = {  
    '元素': ['地球', '水', '火', '空气'],  
    '符号': ['🜃', '🜄', '🜂', '🜁']  
}  
df = pd.DataFrame(data)

2. 从 CSV 文件读取数据

要从 CSV 文件中读取数据，并将其转换为 DataFrame：

df = pd.read_csv('elements.csv')

3. 检查前几行数据

要获取 DataFrame 的前几行：

print(df.head())

4. 选择列

要从 DataFrame 中选择特定的列：

symbols = df['符号']

5. 过滤行

要在 DataFrame 中筛选行，选择满足条件的行：

火元素 = df[df['元素'] == '火']

6. 创建新列

要在 DataFrame 中创建基于数据派生的新列：

df['长度'] = df['元素'].apply(len)

7. 分组和聚合数据

要将数据分组并通过聚合提取新数据：

元素分组 = df.groupby('元素').agg({'长度': 'mean'})

8. 合并 DataFrame

要将两个 DataFrame 编织在一起，通过共享键将它们连接起来：

df2 = pd.DataFrame({'元素': ['地球', '火'], '品质': ['固体', '等离子体']})  
合并后的_df = pd.merge(df, df2, on='元素')

9. 处理缺失数据

要清理 DataFrame，在数据缺失的地方填充空白：

df.fillna(value='未知', inplace=True)

10. 透视和重塑数据

要转换 DataFrame 的形状，通过透视操作揭示隐藏的模式和结构：

透视后的_df = df.pivot(index='元素', columns='符号', values='长度')

使用 Numpy 库（数组）

1. 创建 NumPy 数组

要创建一个数组：

import numpy as np  
array = np.array([1, 2, 3, 4, 5])

2. 0 或 1 数组

要创建由零填充的数组：

zeros = np.zeros((3, 3))  # 一个 3x3 的零数组  
ones = np.ones((2, 4))  # 一个 2x4 的 1 数组

3. 创建数字范围

要创建一个数字序列：

range_array = np.arange(10, 50, 5)  # 从 10 到 50，步长为 5

4. 创建线性间隔数组

要创建一系列值，介于两个边界之间均匀间隔：

线性间隔 = np.linspace(0, 1, 5)  # 从 0 到 1，共 5 个值

5. 重塑数组

要改变数组的形状，改变其维度：

重塑后的 = np.arange(9).reshape(3, 3)  # 将一个 1D 数组重塑为 3x3 的 2D 数组

6. 基本数组操作

要对数组执行元素操作：

a = np.array([1, 2, 3])  
b = np.array([4, 5, 6])  
和 = a + b  # 逐元素加法  
差 = b - a  # 逐元素减法  
积 = a * b  # 逐元素乘法

7. 矩阵乘法

基本的点乘运算：

结果 = np.dot(a.reshape(1, 3), b.reshape(3, 1))  # a 和 b 的点积

8. 访问数组元素

使用有用的语法访问数组元素：

元素 = a[2]  # 检索数组 'a' 的第三个元素  
行 = 重塑后的[1, :]  # 检索 '重塑后的' 的第二行

9. 布尔索引

通过条件筛选数组元素：

筛选后的 = a[a > 2]  # 大于 2 的 'a' 的元素

10. 聚合和统计

对 np 数组进行统计操作：

均值 = np.mean(a)  
最大值 = np.max(a)  
总和 = np.sum(a)