盘点一道使用pandas.merge()和pandas.join()函数实战应用题目-优快云博客

本文通过一个实际问题，展示了如何使用Python的pandas库，结合merge()和join()函数来统计数据集中来自不同国家的教师数量。作者首先介绍了问题背景，然后详细解释了两种解决方案，分别使用merge()和join()方法。这两种方法都能够有效地完成任务，满足了粉丝的需求。

点击上方“Python爬虫与数据挖掘”，进行关注

回复“书籍”即可获赠Python从入门到进阶共10本电子书

今

日

鸡

汤

寂寂花时闭院门，美人相并立琼轩。

大家好，我是我是Python进阶者。

一、前言

前几天Python铂金有个叫【Lee】的粉丝问了一个数据分析的问题，这里拿出来给大家分享下。

现在的问题是：如何实现这里面老师所对应的国家呢？想要利用Python作数据分析，想了解来自美国的老师有多少个，怎么实现？针对这个demo，一开始我想的也比较简单，只需要统计其中国家的数量即可。

但是问题来了，如下图所示：

那么再用我的那个想法，就有点那个了！下面一起来看看Python是如何处理的吧。

二、实现过程

这里【🌑（这是月亮的背面）】大佬给出了两个解决方法，第一个是merge()方法，另外一个是join()方法。

方法一：merge()函数

代码如下：

可以看到顺利的满足了粉丝的要求

import pandas as pd
data1 = {"学校": ['哈佛', 'MIT', '清华', '早稻田'], "国家":['美国', '美国', '中国', '日本']}
data2 = {"学校": ['哈佛', 'MIT', 'MIT', '清华', '清华', '早稻田'],
    "老师": ['John', 'Mike', 'Jason', '李明', '韩磊', '武田康福']}

data1 = pd.DataFrame(data1)
data2 = pd.DataFrame(data2)

print(data1)
print(data2)

data2.merge(data1, how='left').value_counts('国家')
print(data2.merge(data1, how='left').value_counts('国家'))
print(data2.merge(data1, how='left'))

不过这还不够，粉丝后来又提需求了，如下所示：