用 Python 处理 Excel 数据:统计非重复值的实用技巧

功能分析

本代码的主要功能是从指定的 Excel 文件中读取数据,并统计指定列中唯一值的数量。用户可以灵活地设置要统计的列名,以适应不同的数据集。

主要步骤:

  1. 读取 Excel 文件并加载到 DataFrame 中。
  2. 提取指定列的值,去除重复项。
  3. 计算并输出该列中唯一值的数量。

使用说明

  1. 确保安装了 pandas 库。如果尚未安装,可以使用以下命令进行安装:
    pip install pandas
    

源代码

import pandas as pd

# 读取 Excel 文件
file_path = 'path/to/your/excel/file.xlsx'  # 更换为你的 Excel 文件路径
df = pd.read_excel(file_path, header=2)

# 假设要统计的列为 'column_name'
column_name = 'your_column_name'  # 更换为你要统计的列名

# 获取该列的值并去除重复值,然后计算长度
unique_count = len(df[column_name].unique())

print(f"在 '{column_name}' 列中非重复的数量为:{unique_count}")
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

芝麻柚

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值