pandas处理DataFrame的方法汇总09_pivot转dataframe-优快云博客

本文链接：https://blog.youkuaiyun.com/qq_44133607/article/details/139381169

pivot_table()的详细语法与实际案例

将电子表格数据创建为 DataFrame。

pivot_table() 是 Pandas 库中的 DataFrame 方法，用于创建透视表。透视表是一种数据汇总工具，允许通过多种聚合函数来总结和组织数据。

语法

pandas.pivot_table(data, values=None, index=None, columns=None, 
                    aggfunc='mean', fill_value=None, margins=False, 
                    dropna=True, margins_name='All', observed=False, sort=True)

参数

data：DataFrame，用于创建透视表的数据。
values (str or list of str, optional)：需要聚合的列。
index (str or list of str, optional)：用于分组的列。
columns (str or list of str, optional)：用于列的分组键。
aggfunc (function, list of functions, dict, default 'mean')：用于聚合的函数或函数列表，例如 'mean'、'sum'、'count' 等。
fill_value (scalar, optional)：用于填充缺失值的值。
margins (bool, default False)：添加行/列汇总。
dropna (bool, default True)：不要包含所有 NaN 的列。
margins_name (str, default 'All')：汇总行/列的名称。
observed (bool, default False)：对于分类数据，仅显示出现的类别组合。
sort (bool, default True)：是否对结果 DataFrame 进行排序。

返回值

返回一个重塑后的 DataFrame。

实例代码

import pandas as pd

# 创建一个 DataFrame
data = {
    'date': ['2023-01-01', '2023-01-01', '2023-01-02', '2023-01-02'],
    'city': ['New York', 'Los Angeles', 'New York', 'Los Angeles'],
    'temperature': [32, 75, 28, 78],
    'humidity': [80, 50, 82, 48]
}
df = pd.DataFrame(data)

print("原始数据集：")
print(df)

# 使用 pivot_table 方法创建透视表，按日期和城市分组，计算平均温度
pivot_table_temp = pd.pivot_table(df, values='temperature', index='date', columns='city', aggfunc='mean')
print("\n透视表（平均温度）：")
print(pivot_table_temp)

# 使用 pivot_table 方法创建透视表，按日期和城市分组，计算温度和湿度的平均值
pivot_table_both = pd.pivot_table(df, values=['temperature', 'humidity'], index='date', columns='city', aggfunc='mean')
print("\n透视表（平均温度和湿度）：")
print(pivot_table_both)

# 使用 pivot_table 方法创建透视表，按城市分组，计算温度的总和，并填充缺失值
pivot_table_sum = pd.pivot_table(df, values='temperature', index='city', aggfunc='sum', fill_value=0)
print("\n透视表（温度总和，填充缺失值）：")
print(pivot_table_sum)

# 使用 pivot_table 方法创建透视表，按日期分组，计算温度的计数
pivot_table_count = pd.pivot_table(df, values='temperature', index='date', aggfunc='count', margins=True)
print("\n透视表（温度计数，包含汇总）：")
print(pivot_table_count)

输出结果

原始数据集：
         date         city  temperature  humidity
0  2023-01-01     New York           32        80
1  2023-01-01  Los Angeles           75        50
2  2023-01-02     New York           28        82
3  2023-01-02  Los Angeles           78        48

透视表（平均温度）：
city        Los Angeles  New York
date                             
2023-01-01           75        32
2023-01-02           78        28

透视表（平均温度和湿度）：
           temperature           humidity          
city        Los Angeles New York Los Angeles New York
date                                                  
2023-01-01         75.0     32.0        50.0     80.0
2023-01-02         78.0     28.0        48.0     82.0

透视表（温度总和，填充缺失值）：
              temperature
city                     
Los Angeles          153
New York              60

透视表（温度计数，包含汇总）：
           temperature
date                  
2023-01-01           2
2023-01-02           2
All                  4

总结

使用与应用场景

数据汇总：通过透视表汇总数据，可以轻松计算各类统计值（如平均值、总和、计数等）。
数据分析：利用透视表按不同维度对数据进行分组和聚合，便于深入分析数据。
数据展示：通过透视表生成的结构化数据，更容易进行数据展示和报告。

pivot_table() 方法在数据分析和处理过程中非常有用，可以通过灵活的参数设置，对数据进行各种形式的汇总和聚合。通过指定索引、列和值，可以创建复杂的透视表，适应各种数据分析需求。

pop()的详细语法与实际案例

从 DataFrame 中删除元素。

pop() 是 Pandas 库中的 DataFrame 对象的方法，用于从 DataFrame 中删除指定的列，并返回该列作为一个 Series。这个方法修改原始 DataFrame，并返回被删除的列。

语法

DataFrame.pop(item)

参数

item (str)：要从 DataFrame 中删除并返回的列名。

返回值

返回一个 Series，包含被删除的列的数据。

实例代码

import pandas as pd

# 创建一个 DataFrame
data = {
    'A': [1, 2, 3, 4, 5],
    'B': [5, 4, 3, 2, 1],
    'C': [10, 20, 30, 40, 50]
}
df = pd.DataFrame(data)

print("原始数据集：")
print(df)

# 使用 pop 方法删除并返回列 'B'
popped_column = df.pop('B')
print("\n被删除的列 'B'：")
print(popped_column)

print("\n删除列 'B' 后的数据集：")
print(df)

输出结果

原始数据集：
   A  B   C
0  1  5  10
1  2  4  20
2  3  3  30
3  4  2  40
4  5  1  50

被删除的列 'B'：
0    5
1    4
2    3
3    2
4    1
Name: B, dtype: int64

删除列 'B' 后的数据集：
   A   C
0  1  10
1  2  20
2  3  30
3  4  40
4  5  50

总结

使用与应用场景

列的移除：pop() 方法用于从 DataFrame 中移除指定列，并返回该列的数据作为 Series。适用于需要从 DataFrame 中删除列并对其进行单独操作的情况。
数据处理：在数据预处理中，可以使用 pop() 方法移除不需要的列，同时保留这些列的数据进行进一步处理。
提高代码简洁性：pop() 方法将删除列和返回列的数据合并为一步操作，使代码更加简洁。

pop() 方法在数据处理和分析过程中非常有用，可以方便地从 DataFrame 中删除指定列，并对删除的列进行进一步操作。通过直接修改原始 DataFrame，并返回被删除的列数据，简化了操作步骤。

pow()的详细语法与实际案例

将一个 DataFrame 的值加上另一个 DataFrame 的值。

pow() 是 Pandas 库中的 DataFrame 和 Series 对象的方法，用于执行逐元素的指数运算。pow() 方法返回一个与输入对象形状相同的对象，包含每个元素的指数运算结果。

语法

DataFrame.pow(other, axis='columns', level=None, fill_value=None)
Series.pow(other, level=None, fill_value=None, axis=0)

参数

other (scalar, sequence, Series, or DataFrame)：要与每个元素进行指数运算的值。
axis (int or str, default 'columns')：用于对齐的轴。对于 DataFrame，可以是 0 或 'index' 或 1 或 'columns'。
level (int or str, default None)：如果轴是 MultiIndex，则沿指定级别进行广播。
fill_value (scalar, default None)：在算术运算期间用于替换对齐的两个对象中的任何缺失值。

返回值

返回一个与输入对象形状相同的对象，包含指数运算结果。

实例代码

import pandas as pd

# 创建一个 DataFrame
data = {
    'A': [1, 2, 3, 4],
    'B': [5, 6, 7, 8]
}
df = pd.DataFrame(data)

print("原始数据集：")
print(df)

# 对 DataFrame 的每个元素进行指数运算，指数为 2
pow_df = df.pow(2)
print("\n对 DataFrame 的每个元素进行指数运算（指数为 2）的结果：")
print(pow_df)

# 创建一个 Series
series = pd.Series([1, 2, 3, 4])

print("\n原始 Series 数据：")
print(series)

# 对 Series 的每个元素进行指数运算，指数为 3
pow_series = series.pow(3)
print("\n对 Series 的每个元素进行指数运算（指数为 3）的结果：")
print(pow_series)

输出结果

原始数据集：
   A  B
0  1  5
1  2  6
2  3  7
3  4  8

对 DataFrame 的每个元素进行指数运算（指数为 2）的结果：
    A    B
0   1   25
1   4   36
2   9   49
3  16   64

原始 Series 数据：
0    1
1    2
2    3
3    4
dtype: int64

对 Series 的每个元素进行指数运算（指数为 3）的结果：
0     1
1     8
2    27
3    64
dtype: int64

总结

使用与应用场景

数学运算：对 DataFrame 或 Series 中的每个元素进行逐元素的指数运算，适用于各种数学和科学计算。
数据转换：在数据处理中，使用指数运算可以实现数据的特定转换，例如对数变换或标准化处理。
缺失值处理：通过 fill_value 参数，可以在运算过程中处理缺失值，确保计算的顺利进行。

pow() 方法在数据分析和处理过程中非常有用，可以方便地对数据集中的每个元素进行指数运算。通过指定指数值和缺失值处理方式，可以灵活地应用于各种数据集。

prod()的详细语法与实际案例

返回指定轴上所有值的乘积。

prod() 是 Pandas 库中的 DataFrame 和 Series 对象的方法，用于计算沿指定轴的元素乘积。它可以按列或按行计算，并且可以选择忽略 NaN 值。

语法

DataFrame.prod(axis=None, skipna=True, level=None, 
                numeric_only=None, min_count=0, **kwargs)
Series.prod(axis=0, skipna=True, level=None, 
                numeric_only=None, min_count=0, **kwargs)

参数

axis (int, default None)：指定沿哪个轴计算乘积。0 或 'index' 表示按列计算，1 或 'columns' 表示按行计算。
skipna (bool, default True)：是否忽略 NaN 值。如果设为 True，则忽略 NaN 值。
level (int or level name, default None)：如果轴是 MultiIndex，则按级别计算。
numeric_only (bool, default None)：如果为 True，则只包含数字数据类型。如果为 None，将尝试包括所有数据类型。
min_count (int, default 0)：要求的最小观测数。如果小于这个数，将返回 NaN。
kwargs：其他关键词参数。

返回值

返回一个标量值或包含乘积的 Series 或 DataFrame。

实例代码

import pandas as pd
import numpy as np

# 创建一个 DataFrame
data = {
    'A': [1, 2, 3, 4],
    'B': [5, 6, 7, 8],
    'C': [10, np.nan, 30, 40]
}
df = pd.DataFrame(data)

print("原始数据集：")
print(df)

# 计算每列的乘积
prod_per_column = df.prod()
print("\n每列的乘积：")
print(prod_per_column)

# 计算每行的乘积
prod_per_row = df.prod(axis=1)
print("\n每行的乘积：")
print(prod_per_row)

# 创建一个 Series
series = pd.Series([1, 2, 3, 4, 5])

print("\n原始 Series 数据：")
print(series)

# 计算 Series 的乘积
series_prod = series.prod()
print("\nSeries 的乘积：")
print(series_prod)

输出结果

原始数据集：
     A    B     C
0  1.0  5.0  10.0
1  2.0  6.0   NaN
2  3.0  7.0  30.0
3  4.0  8.0  40.0

每列的乘积：
A      24.0
B    1680.0
C    12000.0
dtype: float64

每行的乘积：
0      50.0
1      12.0
2     630.0
3    1280.0
dtype: float64

原始 Series 数据：
0    1
1    2
2    3
3    4
4    5
dtype: int64

Series 的乘积：
120

总结

使用与应用场景

数据计算：对 DataFrame 或 Series 中的元素进行乘积运算，适用于各种数学和统计计算。
数据聚合：在数据处理中，计算各列或各行的乘积，以进行聚合操作。
缺失值处理：通过 skipna 参数，可以选择忽略 NaN 值，确保计算的顺利进行。
分层计算：通过 level 参数，可以在 MultiIndex 情况下进行分层计算。

prod() 方法在数据分析和处理过程中非常有用，可以方便地对数据集中的元素进行乘积运算。通过指定轴和缺失值处理方式，可以灵活地应用于各种数据集。

product()的详细语法与实际案例

返回指定轴上的值的乘积。

product() 是 Pandas 库中的 DataFrame 和 Series 对象的方法，用于计算沿指定轴的元素乘积。它可以按列或按行计算，并且可以选择忽略 NaN 值。

语法

DataFrame.prod(axis=None, skipna=True, level=None, numeric_only=None, 
                    min_count=0, **kwargs)
Series.prod(axis=0, skipna=True, level=None, numeric_only=None, 
                    min_count=0, **kwargs)

参数

axis (int, default None)：指定沿哪个轴计算乘积。0 或 'index' 表示按列计算，1 或 'columns' 表示按行计算。
skipna (bool, default True)：是否忽略 NaN 值。如果设为 True，则忽略 NaN 值。
level (int or level name, default None)：如果轴是 MultiIndex，则按级别计算。
numeric_only (bool, default None)：如果为 True，则只包含数字数据类型。如果为 None，将尝试包括所有数据类型。
min_count (int, default 0)：要求的最小观测数。如果小于这个数，将返回 NaN。
kwargs：其他关键词参数。

返回值

返回一个标量值或包含乘积的 Series 或 DataFrame。

实例代码

import pandas as pd
import numpy as np

# 创建一个 DataFrame
data = {
    'A': [1, 2, 3, 4],
    'B': [5, 6, 7, 8],
    'C': [10, np.nan, 30, 40]
}
df = pd.DataFrame(data)

print("原始数据集：")
print(df)

# 计算每列的乘积
prod_per_column = df.prod()
print("\n每列的乘积：")
print(prod_per_column)

# 计算每行的乘积
prod_per_row = df.prod(axis=1)
print("\n每行的乘积：")
print(prod_per_row)

# 创建一个 Series
series = pd.Series([1, 2, 3, 4, 5])

print("\n原始 Series 数据：")
print(series)

# 计算 Series 的乘积
series_prod = series.prod()
print("\nSeries 的乘积：")
print(series_prod)

输出结果

原始数据集：
     A    B     C
0  1.0  5.0  10.0
1  2.0  6.0   NaN
2  3.0  7.0  30.0
3  4.0  8.0  40.0

每列的乘积：
A      24.0
B    1680.0
C    12000.0
dtype: float64

每行的乘积：
0      50.0
1      12.0
2     630.0
3    1280.0
dtype: float64

原始 Series 数据：
0    1
1    2
2    3
3    4
4    5
dtype: int64

Series 的乘积：
120

总结

使用与应用场景

数据计算：对 DataFrame 或 Series 中的元素进行乘积运算，适用于各种数学和统计计算。
数据聚合：在数据处理中，计算各列或各行的乘积，以进行聚合操作。
缺失值处理：通过 skipna 参数，可以选择忽略 NaN 值，确保计算的顺利进行。
分层计算：通过 level 参数，可以在 MultiIndex 情况下进行分层计算。

quantile()的详细语法与实际案例

返回指定轴的指定分位数处的值。

quantile() 是 Pandas 库中的 DataFrame 和 Series 对象的方法，用于计算数据的分位数。分位数是将数据排序后按百分比划分的点。

语法

DataFrame.quantile(q=0.5, axis=0, numeric_only=True, interpolation='linear')
Series.quantile(q=0.5, axis=0, numeric_only=True, interpolation='linear')

参数

q (float or array-like, default 0.5)：要计算的分位数。范围在 [0, 1] 之间。例如，0.5 表示中位数，0.25 表示第 25 个百分位数。
axis (int or str, default 0)：指定沿哪个轴计算分位数。0 或 'index' 表示按列计算，1 或 'columns' 表示按行计算。
numeric_only (bool, default True)：如果为 True，则只包括数字列。
interpolation (str, default 'linear')：指定插值方式，用于计算两个数据点之间的分位数。选项包括 'linear'、'lower'、'higher'、'midpoint' 和 'nearest'。

返回值

返回一个标量值或包含分位数的 Series 或 DataFrame。

实例代码

import pandas as pd
import numpy as np

# 创建一个 DataFrame
data = {
    'A': [1, 2, 3, 4, 5],
    'B': [5, 6, 7, 8, 9],
    'C': [10, 20, 30, 40, 50]
}
df = pd.DataFrame(data)

print("原始数据集：")
print(df)

# 计算每列的中位数
median_per_column = df.quantile(q=0.5)
print("\n每列的中位数：")
print(median_per_column)

# 计算每列的第 25 个百分位数
q25_per_column = df.quantile(q=0.25)
print("\n每列的第 25 个百分位数：")
print(q25_per_column)

# 计算每列的第 75 个百分位数
q75_per_column = df.quantile(q=0.75)
print("\n每列的第 75 个百分位数：")
print(q75_per_column)

# 计算多个百分位数
multiple_quantiles = df.quantile(q=[0.25, 0.5, 0.75])
print("\n多个百分位数：")
print(multiple_quantiles)

# 创建一个 Series
series = pd.Series([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])

print("\n原始 Series 数据：")
print(series)

# 计算 Series 的中位数
median_series = series.quantile(q=0.5)
print("\nSeries 的中位数：")
print(median_series)

# 计算 Series 的第 25 个百分位数
q25_series = series.quantile(q=0.25)
print("\nSeries 的第 25 个百分位数：")
print(q25_series)

# 计算 Series 的第 75 个百分位数
q75_series = series.quantile(q=0.75)
print("\nSeries 的第 75 个百分位数：")
print(q75_series)

输出结果

原始数据集：
   A  B   C
0  1  5  10
1  2  6  20
2  3  7  30
3  4  8  40
4  5  9  50

每列的中位数：
A     3.0
B     7.0
C    30.0
Name: 0.5, dtype: float64

每列的第 25 个百分位数：
A     2.0
B     6.0
C    20.0
Name: 0.25, dtype: float64

每列的第 75 个百分位数：
A     4.0
B     8.0
C    40.0
Name: 0.75, dtype: float64

多个百分位数：
        A    B     C
0.25  2.0  6.0  20.0
0.50  3.0  7.0  30.0
0.75  4.0  8.0  40.0

原始 Series 数据：
0     1
1     2
2     3
3     4
4     5
5     6
6     7
7     8
8     9
9    10
dtype: int64

Series 的中位数：
5.5

Series 的第 25 个百分位数：
3.25

Series 的第 75 个百分位数：
7.75

总结

使用与应用场景

数据分析：通过计算数据集的分位数，可以了解数据的分布情况，识别数据的集中趋势和离散程度。
统计分析：在统计分析中，分位数是常用的统计指标，可以用于描述数据的分布特征。
数据预处理：在数据预处理中，可以使用分位数进行数据筛选、数据分箱等操作。

quantile() 方法在数据分析和统计处理中非常有用，可以方便地计算数据集的分位数。通过指定分位数和插值方法，可以灵活地应用于各种数据集。

query()的详细语法与实际案例

查询 DataFrame。

query() 是 Pandas 库中的 DataFrame 对象的方法，用于使用一个查询字符串来筛选数据。查询字符串中可以包含列名和表达式，以便灵活地进行数据过滤和选择。

语法

DataFrame.query(expr, inplace=False, **kwargs)

参数

expr (str)：表示查询条件的表达式。可以使用 DataFrame 列的名称。
inplace (bool, default False)：是否在原地修改 DataFrame。如果设为 True，则对原 DataFrame 进行修改，并返回 None。
kwargs：其他关键词参数。

返回值

返回一个新的 DataFrame，其中包含满足查询条件的行。

实例代码

import pandas as pd

# 创建一个 DataFrame
data = {
    'A': [1, 2, 3, 4, 5],
    'B': [5, 6, 7, 8, 9],
    'C': [10, 20, 30, 40, 50]
}
df = pd.DataFrame(data)

print("原始数据集：")
print(df)

# 使用 query 方法筛选列 A 大于 2 的行
query_result = df.query('A > 2')
print("\n筛选列 A 大于 2 的行：")
print(query_result)

# 使用 query 方法筛选列 A 大于 2 且列 B 小于 9 的行
query_result_2 = df.query('A > 2 and B < 9')
print("\n筛选列 A 大于 2 且列 B 小于 9 的行：")
print(query_result_2)

# 使用 query 方法筛选列 C 等于 30 或 50 的行
query_result_3 = df.query('C == 30 or C == 50')
print("\n筛选列 C 等于 30 或 50 的行：")
print(query_result_3)

# 使用 query 方法结合局部变量进行筛选
threshold = 7
query_result_4 = df.query('B > @threshold')
print("\n筛选列 B 大于局部变量 threshold 的行：")
print(query_result_4)

输出结果

原始数据集：
   A  B   C
0  1  5  10
1  2  6  20
2  3  7  30
3  4  8  40
4  5  9  50

筛选列 A 大于 2 的行：
   A  B   C
2  3  7  30
3  4  8  40
4  5  9  50

筛选列 A 大于 2 且列 B 小于 9 的行：
   A  B   C
2  3  7  30
3  4  8  40

筛选列 C 等于 30 或 50 的行：
   A  B   C
2  3  7  30
4  5  9  50

筛选列 B 大于局部变量 threshold 的行：
   A  B   C
3  4  8  40
4  5  9  50

总结

使用与应用场景

数据过滤：通过使用查询字符串，可以灵活地根据条件筛选数据，非常适用于复杂的筛选条件。
简洁语法：query() 方法提供了一种简洁的语法来代替复杂的布尔索引，使代码更易读。
变量引用：可以在查询字符串中使用 @ 引用局部变量，进一步提高灵活性。

query() 方法在数据分析和处理过程中非常有用，可以方便地对数据集进行筛选和过滤。通过灵活的查询字符串，可以实现复杂的数据选择和条件过滤。

radd()的详细语法与实际案例

反向将一个 DataFrame 的值与另一个 DataFrame 的值相加。

radd() 是 Pandas 库中的 DataFrame 和 Series 对象的方法，用于执行逐元素的加法运算，其中反向操作数在左边。换句话说，radd() 是右加法，用于在元素级别上执行 other + DataFrame/Series 运算。

语法

DataFrame.radd(other, axis='columns', level=None, fill_value=None)
Series.radd(other, level=None, fill_value=None, axis=0)

参数

other (scalar, sequence, Series, or DataFrame)：用于执行加法运算的对象。
axis (int or str, default 'columns')：用于对齐的轴。对于 DataFrame，可以是 0 或 'index' 或 1 或 'columns'。
level (int or str, default None)：如果轴是 MultiIndex，则沿指定级别进行广播。
fill_value (scalar, default None)：在算术运算期间用于替换对齐的两个对象中的任何缺失值。

返回值

返回一个与输入对象形状相同的对象，包含加法运算的结果。

实例代码

import pandas as pd
import numpy as np

# 创建一个 DataFrame
data = {
    'A': [1, 2, 3, 4],
    'B': [5, 6, 7, 8]
}
df = pd.DataFrame(data)

print("原始数据集：")
print(df)

# 创建一个标量值
scalar = 10

# 使用 radd 方法进行右加法运算
radd_result_scalar = df.radd(scalar)
print("\n将标量值 10 加到 DataFrame 的每个元素：")
print(radd_result_scalar)

# 创建一个与 DataFrame 形状相同的对象
other_df = pd.DataFrame({
    'A': [10, 20, 30, 40],
    'B': [50, 60, 70, 80]
})

# 使用 radd 方法进行右加法运算
radd_result_df = df.radd(other_df)
print("\n将另一个 DataFrame 加到原 DataFrame 的每个元素：")
print(radd_result_df)

# 创建一个 Series
series = pd.Series([1, 2, 3, 4])

print("\n原始 Series 数据：")
print(series)

# 使用 radd 方法进行右加法运算
radd_result_series = series.radd(scalar)
print("\n将标量值 10 加到 Series 的每个元素：")
print(radd_result_series)

# 创建一个与 Series 形状相同的对象
other_series = pd.Series([10, 20, 30, 40])

# 使用 radd 方法进行右加法运算
radd_result_series_other = series.radd(other_series)
print("\n将另一个 Series 加到原 Series 的每个元素：")
print(radd_result_series_other)

输出结果

原始数据集：
   A  B
0  1  5
1  2  6
2  3  7
3  4  8

将标量值 10 加到 DataFrame 的每个元素：
    A   B
0  11  15
1  12  16
2  13  17
3  14  18

将另一个 DataFrame 加到原 DataFrame 的每个元素：
    A   B
0  11  55
1  22  66
2  33  77
3  44  88

原始 Series 数据：
0    1
1    2
2    3
3    4
dtype: int64

将标量值 10 加到 Series 的每个元素：
0    11
1    12
2    13
3    14
dtype: int64

将另一个 Series 加到原 Series 的每个元素：
0    11
1    22
2    33
3    44
dtype: int64

总结

使用与应用场景

数学运算：对 DataFrame 或 Series 中的每个元素进行逐元素的加法运算，适用于各种数学和科学计算。
数据转换：在数据处理中，使用加法运算可以实现数据的特定转换或标准化处理。
缺失值处理：通过 fill_value 参数，可以在运算过程中处理缺失值，确保计算的顺利进行。

radd() 方法在数据分析和处理过程中非常有用，可以方便地对数据集中的每个元素进行右加法运算。通过指定加法运算的对象和缺失值处理方式，可以灵活地应用于各种数据集。

rdiv()的详细语法与实际案例

反向将一个 DataFrame 的值与另一个 DataFrame 的值相除。

rdiv() 是 Pandas 库中的 DataFrame 和 Series 对象的方法，用于执行逐元素的除法运算，其中反向操作数在左边。换句话说，rdiv() 是右除法，用于在元素级别上执行 other / DataFrame/Series 运算。

语法

DataFrame.rdiv(other, axis='columns', level=None, fill_value=None)
Series.rdiv(other, level=None, fill_value=None, axis=0)

参数

other (scalar, sequence, Series, or DataFrame)：用于执行除法运算的对象。
axis (int or str, default 'columns')：用于对齐的轴。对于 DataFrame，可以是 0 或 'index' 或 1 或 'columns'。
level (int or str, default None)：如果轴是 MultiIndex，则沿指定级别进行广播。
fill_value (scalar, default None)：在算术运算期间用于替换对齐的两个对象中的任何缺失值。

返回值

返回一个与输入对象形状相同的对象，包含除法运算的结果。

实例代码

import pandas as pd
import numpy as np

# 创建一个 DataFrame
data = {
    'A': [1, 2, 3, 4],
    'B': [5, 6, 7, 8]
}
df = pd.DataFrame(data)

print("原始数据集：")
print(df)

# 创建一个标量值
scalar = 10

# 使用 rdiv 方法进行右除法运算
rdiv_result_scalar = df.rdiv(scalar)
print("\n将标量值 10 作为分子，对 DataFrame 的每个元素进行右除法运算的结果：")
print(rdiv_result_scalar)

# 创建一个与 DataFrame 形状相同的对象
other_df = pd.DataFrame({
    'A': [10, 20, 30, 40],
    'B': [50, 60, 70, 80]
})

# 使用 rdiv 方法进行右除法运算
rdiv_result_df = df.rdiv(other_df)
print("\n将另一个 DataFrame 作为分子，对原 DataFrame 的每个元素进行右除法运算的结果：")
print(rdiv_result_df)

# 创建一个 Series
series = pd.Series([1, 2, 3, 4])

print("\n原始 Series 数据：")
print(series)

# 使用 rdiv 方法进行右除法运算
rdiv_result_series = series.rdiv(scalar)
print("\n将标量值 10 作为分子，对 Series 的每个元素进行右除法运算的结果：")
print(rdiv_result_series)

# 创建一个与 Series 形状相同的对象
other_series = pd.Series([10, 20, 30, 40])

# 使用 rdiv 方法进行右除法运算
rdiv_result_series_other = series.rdiv(other_series)
print("\n将另一个 Series 作为分子，对原 Series 的每个元素进行右除法运算的结果：")
print(rdiv_result_series_other)

输出结果

原始数据集：
   A  B
0  1  5
1  2  6
2  3  7
3  4  8

将标量值 10 作为分子，对 DataFrame 的每个元素进行右除法运算的结果：
      A         B
0  10.0  2.000000
1   5.0  1.666667
2   3.333333  1.428571
3   2.5  1.25

将另一个 DataFrame 作为分子，对原 DataFrame 的每个元素进行右除法运算的结果：
      A         B
0  10.0  10.000000
1  10.0  10.000000
2  10.0  10.000000
3  10.0  10.000000

原始 Series 数据：
0    1
1    2
2    3
3    4
dtype: int64

将标量值 10 作为分子，对 Series 的每个元素进行右除法运算的结果：
0    10.000000
1     5.000000
2     3.333333
3     2.500000
dtype: float64

将另一个 Series 作为分子，对原 Series 的每个元素进行右除法运算的结果：
0    10.000000
1    10.000000
2    10.000000
3    10.000000
dtype: float64

总结

使用与应用场景

数学运算：对 DataFrame 或 Series 中的每个元素进行逐元素的除法运算，适用于各种数学和科学计算。
数据转换：在数据处理中，使用除法运算可以实现数据的特定转换或标准化处理。
缺失值处理：通过 fill_value 参数，可以在运算过程中处理缺失值，确保计算的顺利进行。

rdiv() 方法在数据分析和处理过程中非常有用，可以方便地对数据集中的每个元素进行右除法运算。通过指定除法运算的对象和缺失值处理方式，可以灵活地应用于各种数据集。

reindex()的详细语法与实际案例

reindex() 是 Pandas 库中的 DataFrame 和 Series 对象的方法，用于根据新的索引重新排列数据。该方法可以用于行和列的重新索引，并且可以选择填充缺失值。

语法

DataFrame.reindex(labels=None, index=None, columns=None, axis=None, 
                    method=None, copy=True, level=None, fill_value=nan, 
                    limit=None, tolerance=None)
Series.reindex(index=None, method=None, level=None, copy=True, 
                    fill_value=nan, limit=None, tolerance=None)

参数

labels (array-like, optional)：新的索引标签。等同于 index 参数。
index (array-like, optional)：用于行的新的索引标签。
columns (array-like, optional)：用于列的新的索引标签，仅适用于 DataFrame。
axis (int or str, optional)：要重新索引的轴。0 或 'index' 表示行，1 或 'columns' 表示列。
method (str, optional)：填充方法。可以是 'pad' (或 'ffill')、'backfill' (或 'bfill')、'nearest' 等。
copy (bool, default True)：返回新对象时，是否始终复制数据。
level (int or level name, optional)：在 MultiIndex 情况下使用。
fill_value (scalar, default NaN)：在重新索引期间用于填充缺失值的值。
limit (int, optional)：前向或后向填充时的最大数量。
tolerance (optional)：表示在插值过程中每个索引的最大距离。

返回值

返回一个重新索引后的 DataFrame 或 Series。

实例代码

import pandas as pd
import numpy as np

# 创建一个 DataFrame
data = {
    'A': [1, 2, 3],
    'B': [4, 5, 6]
}
df = pd.DataFrame(data, index=['a', 'b', 'c'])

print("原始数据集：")
print(df)

# 使用 reindex 方法重新索引行
new_index = ['a', 'b', 'c', 'd']
reindexed_df = df.reindex(new_index)
print("\n重新索引后的 DataFrame（按行重新索引）：")
print(reindexed_df)

# 使用 reindex 方法重新索引列
new_columns = ['A', 'B', 'C']
reindexed_df_columns = df.reindex(columns=new_columns)
print("\n重新索引后的 DataFrame（按列重新索引）：")
print(reindexed_df_columns)

# 使用 reindex 方法重新索引行和列，并填充缺失值
reindexed_df_fill = df.reindex(index=new_index, columns=new_columns, fill_value=0)
print("\n重新索引后的 DataFrame（按行和列重新索引，并填充缺失值）：")
print(reindexed_df_fill)

# 创建一个 Series
series = pd.Series([1, 2, 3], index=['a', 'b', 'c'])

print("\n原始 Series 数据：")
print(series)

# 使用 reindex 方法重新索引 Series
new_series_index = ['a', 'b', 'c', 'd']
reindexed_series = series.reindex(new_series_index)
print("\n重新索引后的 Series：")
print(reindexed_series)

输出结果

原始数据集：
   A  B
a  1  4
b  2  5
c  3  6

重新索引后的 DataFrame（按行重新索引）：
     A    B
a  1.0  4.0
b  2.0  5.0
c  3.0  6.0
d  NaN  NaN

重新索引后的 DataFrame（按列重新索引）：
   A  B   C
a  1  4 NaN
b  2  5 NaN
c  3  6 NaN

重新索引后的 DataFrame（按行和列重新索引，并填充缺失值）：
     A  B  C
a  1.0  4  0
b  2.0  5  0
c  3.0  6  0
d  0.0  0  0

原始 Series 数据：
a    1
b    2
c    3
dtype: int64

重新索引后的 Series：
a    1.0
b    2.0
c    3.0
d    NaN
dtype: float64

总结

使用与应用场景

数据对齐：通过重新索引，可以将数据对齐到新的索引标签，适用于合并不同数据源或准备数据分析。
数据填充：在重新索引过程中，可以选择填充缺失值，确保数据的完整性。
数据变换：通过重新索引，可以实现数据的重塑和变换，以适应不同的分析需求。

reindex() 方法在数据分析和处理过程中非常有用，可以方便地根据新的索引重新排列数据，通过指定行或列的新的索引标签，以及缺失值的填充方式，可以灵活地应用于各种数据集。

reindex_like()的详细语法与实际案例

reindex_like() 是 Pandas 库中的 DataFrame 和 Series 对象的方法，用于根据另一个对象的索引（行索引和/或列索引）重新排列数据。该方法返回一个与另一个对象具有相同索引的对象。

语法

DataFrame.reindex_like(other, method=None, copy=True, limit=None, tolerance=None)
Series.reindex_like(other, method=None, copy=True, limit=None, tolerance=None)

参数

other (DataFrame or Series)：用于对齐索引的对象。
method (str, optional)：填充方法。可以是 'pad' (或 'ffill')、'backfill' (或 'bfill')、'nearest' 等。
copy (bool, default True)：返回新对象时，是否始终复制数据。
limit (int, optional)：前向或后向填充时的最大数量。
tolerance (optional)：表示在插值过程中每个索引的最大距离。

返回值

返回一个重新索引后的 DataFrame 或 Series，索引与 other 相同。

实例代码

import pandas as pd
import numpy as np

# 创建第一个 DataFrame
data1 = {
    'A': [1, 2, 3],
    'B': [4, 5, 6]
}
df1 = pd.DataFrame(data1, index=['a', 'b', 'c'])

print("第一个 DataFrame：")
print(df1)

# 创建第二个 DataFrame
data2 = {
    'C': [10, 20, 30],
    'D': [40, 50, 60]
}
df2 = pd.DataFrame(data2, index=['a', 'b', 'd'])

print("\n第二个 DataFrame：")
print(df2)

# 使用 reindex_like 方法根据第二个 DataFrame 的索引重新排列第一个 DataFrame
reindexed_df = df1.reindex_like(df2)
print("\n根据第二个 DataFrame 的索引重新排列第一个 DataFrame：")
print(reindexed_df)

# 创建一个 Series
series1 = pd.Series([1, 2, 3], index=['a', 'b', 'c'])

print("\n原始 Series 数据：")
print(series1)

# 创建另一个 Series
series2 = pd.Series([10, 20, 30], index=['a', 'b', 'd'])

print("\n另一个 Series 数据：")
print(series2)

# 使用 reindex_like 方法根据第二个 Series 的索引重新排列第一个 Series
reindexed_series = series1.reindex_like(series2)
print("\n根据第二个 Series 的索引重新排列第一个 Series：")
print(reindexed_series)

输出结果

第一个 DataFrame：
   A  B
a  1  4
b  2  5
c  3  6

第二个 DataFrame：
    C   D
a  10  40
b  20  50
d  30  60

根据第二个 DataFrame 的索引重新排列第一个 DataFrame：
     A    B
a  1.0  4.0
b  2.0  5.0
d  NaN  NaN

原始 Series 数据：
a    1
b    2
c    3
dtype: int64

另一个 Series 数据：
a    10
b    20
d    30
dtype: int64

根据第二个 Series 的索引重新排列第一个 Series：
a    1.0
b    2.0
d    NaN
dtype: float64

总结

使用与应用场景

数据对齐：通过 reindex_like() 方法，可以轻松地将一个对象的索引（行和列）对齐到另一个对象的索引。这在合并不同数据源或准备数据分析时非常有用。
数据填充：在重新索引过程中，可以选择填充缺失值，确保数据的完整性。
数据变换：通过重新索引，可以实现数据的重塑和变换，以适应不同的分析需求。

reindex_like() 方法在数据分析和处理过程中非常有用，可以方便地根据另一个对象的索引重新排列数据。通过指定填充方法和限制条件，可以灵活地应用于各种数据集。

rename()的详细语法与实际案例

更改轴的标签。

rename() 是 Pandas 库中的 DataFrame 和 Series 对象的方法，用于重命名行索引或列名。该方法允许灵活地重命名数据集中的行和列。

语法

DataFrame.rename(mapper=None, index=None, columns=None, axis=None, 
                    copy=True, inplace=False, level=None, errors='ignore')
Series.rename(index=None, axis=None, copy=True, inplace=False, 
                    level=None, errors='ignore')

参数

mapper (dict-like or function)：用于重命名行索引或列名的字典或函数。
index (dict-like or function, optional)：用于重命名行索引的字典或函数。
columns (dict-like or function, optional)：用于重命名列名的字典或函数。
axis (int or str, optional)：用于指定要重命名的是行还是列。0 或 'index' 表示行，1 或 'columns' 表示列。
copy (bool, default True)：是否复制数据。如果为 False，则会尝试进行视图操作。
inplace (bool, default False)：是否在原地修改对象。如果为 True，则会对原 DataFrame/Series 进行修改，并返回 None。
level (int or level name, optional)：如果轴是 MultiIndex，则在指定级别进行重命名。
errors (str, default 'ignore')：如果为 'raise'，则在找不到元素时引发 KeyError。

返回值

返回一个新的 DataFrame 或 Series，其中行索引或列名已被重命名。

实例代码

import pandas as pd

# 创建一个 DataFrame
data = {
    'A': [1, 2, 3],
    'B': [4, 5, 6]
}
df = pd.DataFrame(data, index=['a', 'b', 'c'])

print("原始数据集：")
print(df)

# 使用 rename 方法重命名列名
renamed_df_columns = df.rename(columns={'A': 'Alpha', 'B': 'Beta'})
print("\n重命名列名后的 DataFrame：")
print(renamed_df_columns)

# 使用 rename 方法重命名行索引
renamed_df_index = df.rename(index={'a': 'first', 'b': 'second', 'c': 'third'})
print("\n重命名行索引后的 DataFrame：")
print(renamed_df_index)

# 同时重命名行索引和列名
renamed_df_both = df.rename(index={'a': 'first', 'b': 'second', 'c': 'third'}, columns={'A': 'Alpha', 'B': 'Beta'})
print("\n同时重命名行索引和列名后的 DataFrame：")
print(renamed_df_both)

# 创建一个 Series
series = pd.Series([1, 2, 3], index=['a', 'b', 'c'])

print("\n原始 Series 数据：")
print(series)

# 使用 rename 方法重命名 Series 的索引
renamed_series = series.rename(index={'a': 'first', 'b': 'second', 'c': 'third'})
print("\n重命名索引后的 Series：")
print(renamed_series)

输出结果

原始数据集：
   A  B
a  1  4
b  2  5
c  3  6

重命名列名后的 DataFrame：
   Alpha  Beta
a      1     4
b      2     5
c      3     6

重命名行索引后的 DataFrame：
       A  B
first  1  4
second 2  5
third  3  6

同时重命名行索引和列名后的 DataFrame：
        Alpha  Beta
first       1     4
second      2     5
third       3     6

原始 Series 数据：
a    1
b    2
c    3
dtype: int64

重命名索引后的 Series：
first     1
second    2
third     3
dtype: int64

总结

使用与应用场景

重命名列名：通过 rename() 方法，可以轻松地重命名 DataFrame 的列名，使其更加易读或符合特定需求。
重命名行索引：可以灵活地重命名 DataFrame 或 Series 的行索引，便于数据的管理和操作。
批量重命名：通过字典或函数，可以对多行或多列进行批量重命名，提高效率。

rename() 方法在数据分析和处理过程中非常有用，可以方便地重命名 DataFrame 和 Series 的行索引或列名，增强数据的可读性和可操作性。通过指定要重命名的行或列，以及对应的新名称，可以灵活地应用于各种数据集。

rename_axis()的详细语法与实际案例

更改轴的名称。

rename_axis() 是 Pandas 库中的 DataFrame 和 Series 对象的方法，用于设置或重命名轴的名称。它可以用于行索引和列索引的命名或重命名。

语法

DataFrame.rename_axis(mapper=None, axis=0, index=None, columns=None, 
                        inplace=False, copy=True)
Series.rename_axis(mapper=None, axis=0, index=None, inplace=False, copy=True)

参数

mapper (scalar, list-like, dict-like, or function, optional)：用于重命名的对象。可以是标量值、列表、字典或函数。
axis (int or str, default 0)：指定要重命名的是行索引还是列索引。0 或 'index' 表示行索引，1 或 'columns' 表示列索引。
index (scalar, list-like, dict-like, or function, optional)：用于重命名行索引的对象。
columns (scalar, list-like, dict-like, or function, optional)：用于重命名列索引的对象。
inplace (bool, default False)：是否在原地修改对象。如果为 True，则会对原 DataFrame/Series 进行修改，并返回 None。
copy (bool, default True)：是否复制数据。

返回值

返回一个新的 DataFrame 或 Series，其中轴名称已被重命名。如果 inplace=True，则返回 None。

实例代码

import pandas as pd

# 创建一个 DataFrame
data = {
    'A': [1, 2, 3],
    'B': [4, 5, 6]
}
df = pd.DataFrame(data, index=['a', 'b', 'c'])

print("原始数据集：")
print(df)

# 使用 rename_axis 方法为行索引设置名称
renamed_axis_df = df.rename_axis("Row Index")
print("\n为行索引设置名称后的 DataFrame：")
print(renamed_axis_df)

# 使用 rename_axis 方法为列索引设置名称
renamed_axis_df_columns = df.rename_axis("Column Index", axis=1)
print("\n为列索引设置名称后的 DataFrame：")
print(renamed_axis_df_columns)

# 同时为行索引和列索引设置名称
renamed_axis_df_both = df.rename_axis("Row Index").rename_axis("Column Index", axis=1)
print("\n同时为行索引和列索引设置名称后的 DataFrame：")
print(renamed_axis_df_both)

# 创建一个 Series
series = pd.Series([1, 2, 3], index=['a', 'b', 'c'])

print("\n原始 Series 数据：")
print(series)

# 使用 rename_axis 方法为 Series 的索引设置名称
renamed_axis_series = series.rename_axis("Series Index")
print("\n为 Series 的索引设置名称后的 Series：")
print(renamed_axis_series)

输出结果

原始数据集：
   A  B
a  1  4
b  2  5
c  3  6

为行索引设置名称后的 DataFrame：
            A  B
Row Index      
a           1  4
b           2  5
c           3  6

为列索引设置名称后的 DataFrame：
   A  B
a  1  4
b  2  5
c  3  6

同时为行索引和列索引设置名称后的 DataFrame：
Column Index  A  B
Row Index         
a             1  4
b             2  5
c             3  6

原始 Series 数据：
a    1
b    2
c    3
dtype: int64

为 Series 的索引设置名称后的 Series：
Series Index
a    1
b    2
c    3
dtype: int64

总结

使用与应用场景

命名索引：通过 rename_axis() 方法，可以为 DataFrame 或 Series 的行索引和列索引设置或重命名轴名称，增强数据的可读性和可操作性。
多级索引：在处理多级索引（MultiIndex）时，可以使用 rename_axis() 方法为不同级别的索引设置名称。
数据展示：在数据展示和报告生成时，通过设置索引名称，可以使输出更加专业和易读。

rename_axis() 方法在数据分析和处理过程中非常有用，可以方便地为 DataFrame 和 Series 的行索引和列索引设置或重命名轴名称，通过灵活的参数设置，可以应用于各种数据集。

reorder_levels()的详细语法与实际案例

重新排列索引级别。

reorder_levels() 是 Pandas 库中的 DataFrame 和 Series 对象的方法，用于重新排列 MultiIndex 的级别顺序。它允许灵活地重新排列索引的层级，使数据更符合分析需求。

语法

DataFrame.reorder_levels(order, axis=0)
Series.reorder_levels(order)

参数

order (list of int or str)：新的级别顺序。可以是级别的整数位置或名称。
axis (int or str, default 0)：要重新排列的轴。0 或 'index' 表示行索引，1 或 'columns' 表示列索引。

返回值

返回一个重新排列级别顺序后的 DataFrame 或 Series。

实例代码

import pandas as pd

# 创建一个具有 MultiIndex 的 DataFrame
arrays = [
    ['bar', 'bar', 'baz', 'baz', 'foo', 'foo', 'qux', 'qux'],
    ['one', 'two', 'one', 'two', 'one', 'two', 'one', 'two']
]
index = pd.MultiIndex.from_arrays(arrays, names=['first', 'second'])
data = {
    'A': [1, 2, 3, 4, 5, 6, 7, 8],
    'B': [5, 4, 3, 2, 1, 0, -1, -2]
}
df = pd.DataFrame(data, index=index)

print("原始数据集：")
print(df)

# 重新排列 MultiIndex 的级别顺序
reordered_df = df.reorder_levels(['second', 'first'])
print("\n重新排列级别顺序后的 DataFrame：")
print(reordered_df)

# 创建一个具有 MultiIndex 的 Series
series = pd.Series([1, 2, 3, 4, 5, 6, 7, 8], index=index)

print("\n原始 Series 数据：")
print(series)

# 重新排列 MultiIndex 的级别顺序
reordered_series = series.reorder_levels(['second', 'first'])
print("\n重新排列级别顺序后的 Series：")
print(reordered_series)

输出结果

原始数据集：
               A  B
first second       
bar   one      1  5
      two      2  4
baz   one      3  3
      two      4  2
foo   one      5  1
      two      6  0
qux   one      7 -1
      two      8 -2

重新排列级别顺序后的 DataFrame：
               A  B
second first       
one    bar    1  5
       baz    3  3
       foo    5  1
       qux    7 -1
two    bar    2  4
       baz    4  2
       foo    6  0
       qux    8 -2

原始 Series 数据：
first  second
bar    one       1
       two       2
baz    one       3
       two       4
foo    one       5
       two       6
qux    one       7
       two       8
dtype: int64

重新排列级别顺序后的 Series：
second  first
one     bar      1
        baz      3
        foo      5
        qux      7
two     bar      2
        baz      4
        foo      6
        qux      8
dtype: int64

总结

使用与应用场景

重新排列级别：通过 reorder_levels() 方法，可以灵活地重新排列 MultiIndex 的级别顺序，以便更符合数据分析的需求。
数据转换：在处理复杂的数据结构时，可以使用该方法进行数据的转换和重塑。
提升可读性：重新排列索引级别可以提高数据的可读性和可操作性，便于进一步的数据处理和分析。

reorder_levels() 方法在数据分析和处理过程中非常有用，特别是当处理具有多级索引的数据时。通过重新排列级别顺序，可以更好地组织和分析数据。

replace()的详细语法与实际案例及案例输出结果

替换指定的值。

replace() 是 Pandas 库中的 DataFrame 和 Series 对象的方法，用于将DataFrame或Series中的指定值替换为新的值。该方法允许替换单个值、多个值或使用正则表达式进行替换。

语法

DataFrame.replace(to_replace=None, value=None, inplace=False, limit=None, 
                        regex=False, method='pad')
Series.replace(to_replace=None, value=None, inplace=False, limit=None, 
                        regex=False, method='pad')

参数

to_replace (str, regex, list, dict, Series, int, float, or None)：要替换的值。可以是单个值、列表、字典或正则表达式。
value (scalar, dict, list, or None)：替换后的值。如果 to_replace 是字典，value 可以是None。
inplace (bool, default False)：是否在原地修改对象。如果为 True，则会对原 DataFrame/Series 进行修改，并返回 None。
limit (int, default None)：最多替换的数量。
regex (bool, default False)：是否使用正则表达式进行替换。
method (str, default 'pad')：填充方法。可以是 'pad' (或 'ffill')、'backfill' (或 'bfill')，仅在 to_replace 和 value 都是列表时使用。

返回值

返回一个新的 DataFrame 或 Series，其中指定的值已被替换。如果 inplace=True，则返回 None。

实例代码

import pandas as pd
import numpy as np

# 创建一个 DataFrame
data = {
    'A': [1, 2, 3, 4, 5],
    'B': [5, 4, 3, 2, 1],
    'C': ['foo', 'bar', 'foo', 'bar', 'foo']
}
df = pd.DataFrame(data)

print("原始数据集：")
print(df)

# 使用 replace 方法将列 A 中的值 1 替换为 10
replaced_df_single = df.replace({'A': 1}, 10)
print("\n将列 A 中的值 1 替换为 10：")
print(replaced_df_single)

# 使用 replace 方法将列 A 中的值 1 替换为 10，将列 B 中的值 5 替换为 50
replaced_df_multiple = df.replace({'A': 1, 'B': 5}, {'A': 10, 'B': 50})
print("\n将列 A 中的值 1 替换为 10，将列 B 中的值 5 替换为 50：")
print(replaced_df_multiple)

# 使用 replace 方法将列 C 中的 'foo' 替换为 'baz'
replaced_df_str = df.replace({'C': 'foo'}, 'baz')
print("\n将列 C 中的 'foo' 替换为 'baz'：")
print(replaced_df_str)

# 使用 replace 方法将列 C 中的 'foo' 和 'bar' 替换为 'baz' 和 'qux'
replaced_df_list = df.replace({'C': ['foo', 'bar']}, ['baz', 'qux'])
print("\n将列 C 中的 'foo' 和 'bar' 替换为 'baz' 和 'qux'：")
print(replaced_df_list)

# 创建一个 Series
series = pd.Series([1, 2, 3, 4, 5])

print("\n原始 Series 数据：")
print(series)

# 使用 replace 方法将 Series 中的值 3 替换为 30
replaced_series = series.replace(3, 30)
print("\n将 Series 中的值 3 替换为 30：")
print(replaced_series)

输出结果

原始数据集：
   A  B    C
0  1  5  foo
1  2  4  bar
2  3  3  foo
3  4  2  bar
4  5  1  foo

将列 A 中的值 1 替换为 10：
    A  B    C
0  10  5  foo
1   2  4  bar
2   3  3  foo
3   4  2  bar
4   5  1  foo

将列 A 中的值 1 替换为 10，将列 B 中的值 5 替换为 50：
    A   B    C
0  10  50  foo
1   2   4  bar
2   3   3  foo
3   4   2  bar
4   5   1  foo

将列 C 中的 'foo' 替换为 'baz'：
   A  B    C
0  1  5  baz
1  2  4  bar
2  3  3  baz
3  4  2  bar
4  5  1  baz

将列 C 中的 'foo' 和 'bar' 替换为 'baz' 和 'qux'：
   A  B    C
0  1  5  baz
1  2  4  qux
2  3  3  baz
3  4  2  qux
4  5  1  baz

原始 Series 数据：
0    1
1    2
2    3
3    4
4    5
dtype: int64

将 Series 中的值 3 替换为 30：
0     1
1     2
2    30
3     4
4     5
dtype: int64