还在用Excel的vlookup?Python几行代码就能搞定!

本文介绍如何使用Python的Pandas库实现Excel中的VLOOKUP功能,通过几行代码即可完成数据表的纵向查找并合并,同时支持指定输出顺序。
部署运行你感兴趣的模型镜像

还在用Excel的vlookup?Python几行代码就能搞定,还可以指定输出顺序。

VLOOKUP函数是Excel中的一个纵向查找函数,功能是按列查找,最终返回该列所需查询序列所对应的值。

 然而这样的功能在Excel有点复杂,很多人往往记不住怎么做,本文使用Python的Pandas几行代码就能搞定,还可以按指定的列进行输出。

背景:

  1. 有两个excel,他们有相同的一个列; 

  2. 按照这个列合并成一个大的excel,即vlookup功能,要求:

  • 只需要第二个excel的少量的列,比如从40个列中挑选2个列  

  • 新增的来自第二个excel的列需要放到第一个excel指定的列后面; 

  • 将结果输出到一个新的excel;

  • 输入表格1-学生成绩表:

    输入表格2-学生信息表:

    输出表格:按学号列实现了vlookup,并且在指定列后面输出:

    步骤1:读取两个数据表

    import pandas as pd
    
    # 学生成绩表
    df_grade = pd.read_excel("./course_datas/c23_excel_vlookup/学生成绩表.xlsx") 
    df_grade.head()
    
    
    # 学生信息表
    df_sinfo = pd.read_excel("./course_datas/c23_excel_vlookup/学生信息表.xlsx") 
    df_sinfo.head()
    
    
    

    目标:怎样将第二个“学生信息表”的姓名、性别两列,添加到第一个表“学生成绩表”,并且放在第一个表的“学号”列后面?

    步骤2:实现两个表的关联

    即excel的vloopup功能

    # 只筛选第二个表的少量的列
    df_sinfo = df_sinfo[["学号", "姓名", "性别"]]
    df_sinfo.head()
    
    
    
    df_merge = pd.merge(left=df_grade, right=df_sinfo, left_on="学号", right_on="学号")
    df_merge.head()
    
    
    

    步骤3:调整列的顺序

    df_merge.columns
    
    问题:怎样将'姓名', '性别'两列,放到'学号'的后面?

    接下来需要用Python的语法实现列表的处理

    # 将columns变成python的列表形式
    new_columns = df_merge.columns.to_list()
    new_columns
    
    
    
    # 按逆序insert,会将"姓名","性别"放到"学号"的后面
    for name in ["姓名", "性别"][::-1]:
        new_columns.remove(name)
        new_columns.insert(new_columns.index("学号")+1, name)
    
    new_columns
    
    
    
    df_merge = df_merge.reindex(columns=new_columns)
    df_merge.head()
    
    
    

    步骤4:输出最终的Excel文件

    df_merge.to_excel("./course_datas/c23_excel_vlookup/合并后的数据表.xlsx", index=False)
    请看视频讲解:本实战视频是Pandas系列中的一集,系列全部请在爱奇艺查看:
    
    喜欢本文的朋友,请帮忙点赞哦^_^
    

您可能感兴趣的与本文相关的镜像

Python3.11

Python3.11

Conda
Python

Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本

### 使用 Python 实现 ExcelVLOOKUP 功能 为了在 Python 中模拟 Excel 的 `VLOOKUP` 函数,可以利用 `pandas` 和 `openpyxl` 库来读取和处理 Excel 文件。下面是一个完整的例子说明如何实现这一功能。 #### 导入库并加载数据 首先安装所需的库(如果尚未安装),可以通过命令行运行如下指令: ```bash pip install pandas openpyxl ``` 接着,在脚本中导入这些库,并指定要查找的目标文件以及用于比较的数据源文件路径[^3]。 ```python import pandas as pd # 定义两个Excel文件的位置 source_file = 'path_to_source_file.xlsx' target_file = 'path_to_target_file.xlsx' # 加载工作簿中的特定表格到DataFrame对象里 df_source = pd.read_excel(source_file, sheet_name='Sheet1') df_target = pd.read_excel(target_file, sheet_name='Sheet2') ``` #### 执行 VLOOKUP 类似的操作 通过合并两个 DataFrame 来模仿 `VLOOKUP` 行为。这里假设想要基于某一列的关键字进行匹配,并将相应的值附加给目标 DataFrame[^4]。 ```python # 假设我们要根据'KeyColumn'这列来进行查找 merged_df = df_target.merge(df_source[['KeyColumn', 'ValueColumn']], on='KeyColumn', how='left') # 将结果保存回原位置或其他地方 output_path = target_file.replace('.xlsx', '_with_vlookup.xlsx') merged_df.to_excel(output_path, index=False) ``` 此代码片段展示了怎样使用 `merge()` 方法执行左连接(`how='left'`),从而仅保留来自目标 DataFrame (`df_target`) 的记录;对于找不到对应项的情况,则会在新添加的列中填充 NaN 或者其他默认值[^1]。 上述方法不仅能够有效地替代 Excel 内置的 `VLOOKUP` ,而且当面对大量数据集时表现更佳,因为 Python 脚本能更好地应对复杂逻辑和大规模运算需求[^2]。
评论 16
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值