功能分析
本代码的主要功能是从指定的 Excel 文件中读取数据,并统计指定列中唯一值的数量。用户可以灵活地设置要统计的列名,以适应不同的数据集。
主要步骤:
- 读取 Excel 文件并加载到 DataFrame 中。
- 提取指定列的值,去除重复项。
- 计算并输出该列中唯一值的数量。
使用说明
- 确保安装了
pandas
库。如果尚未安装,可以使用以下命令进行安装:pip install pandas
源代码
import pandas as pd
# 读取 Excel 文件
file_path = 'path/to/your/excel/file.xlsx' # 更换为你的 Excel 文件路径
df = pd.read_excel(file_path, header=2)
# 假设要统计的列为 'column_name'
column_name = 'your_column_name' # 更换为你要统计的列名
# 获取该列的值并去除重复值,然后计算长度
unique_count = len(df[column_name].unique())
print(f"在 '{column_name}' 列中非重复的数量为:{unique_count}")