Pandas中两个dataframe的交集和差集

更多、更及时内容欢迎留意微信公众号小窗幽记机器学习

创建测试数据:

import pandas as pd
import numpy as np
 
#Create a DataFrame
df1 = {
    'Subject':['semester1','semester2','semester3','semester4','semester1',
               'semester2','semester3'],
   'Score':[62,47,55,74,31,77,85]}
 
df2 = {
    'Subject':['semester1','semester2','semester3','semester4'],
   'Score':[90,47,85,74]}
 
 
df1 = pd.DataFrame(df1,columns=['Subject','Score'])
df2 = pd.DataFrame(df2,columns=['Subject','Score'])
 
print(df1)
print(df2)

运行结果:
在这里插入图片描述

求两个dataframe的交集

intersected_df = pd.merge(df1, df2, how='inner')
print(intersected_df)

在这里插入图片描述
也可以指定求交集的列:

intersected_df = pd.merge(df1, df2, on=['Subject'], how='inner')
print(intersected_df)

在这里插入图片描述

求差集

df2-df1:

set_diff_df = pd.concat([df2, df1, df1]).drop_duplicates(keep=False)
print(set_diff_df)

在这里插入图片描述

df1-df2:

set_diff_df = pd.concat([df1, df2, df2]).drop_duplicates(keep=False)
print(set_diff_df)

在这里插入图片描述
另一种求差集的方法是:
以df1-df2为例:

df1 = df1.append(df2)
df1 = df1.append(df2)
set_diff_df = df1.drop_duplicates(subset=['Subject', 'Score'],keep=False)
print(set_diff_df)

得到的df1-df2结果是一样的:
在这里插入图片描述

【更多、更及时内容欢迎留意微信公众号小窗幽记机器学习

回答: 要两个DataFrame差集,可以使用Pandas的merge()函数。首先,使用merge()函数将两个DataFrame按照指定的列进行合并,然后使用drop_duplicates()函数去除重复的行,最后使用isin()函数找到不在另一个DataFrame中的行。具体代码如下: ```python diff_df = pd.merge(df1, df2, how='outer', indicator=True).query('_merge == "left_only"').drop_duplicates() ``` 这段代码将df1df2按照默认的列进行合并,并添加了一个名为"_merge"的列,表示每行的合并情况。然后使用query()函数找到"_merge"列中值为"left_only"的行,即df1中不在df2中的行。最后使用drop_duplicates()函数去除重复的行,得到两个DataFrame差集。 #### 引用[.reference_title] - *1* *3* [【PythonDataFrame差集/交集/并集解](https://blog.youkuaiyun.com/fengdu78/article/details/125827394)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down1,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [Pandas两个dataframe差集 详解](https://blog.youkuaiyun.com/guoyc439/article/details/124165334)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值