点击上方“Python爬虫与数据挖掘”,进行关注
回复“书籍”即可获赠Python从入门到进阶共10本电子书
今
日
鸡
汤
寂寂花时闭院门,美人相并立琼轩。
大家好,我是我是Python进阶者。
一、前言
前几天Python铂金有个叫【Lee】的粉丝问了一个数据分析的问题,这里拿出来给大家分享下。
现在的问题是:如何实现这里面老师所对应的国家呢?想要利用Python作数据分析,想了解来自美国的老师有多少个,怎么实现?针对这个demo,一开始我想的也比较简单,只需要统计其中国家的数量即可。
但是问题来了,如下图所示:
那么再用我的那个想法,就有点那个了!下面一起来看看Python是如何处理的吧。
二、实现过程
这里【🌑(这是月亮的背面)】大佬给出了两个解决方法,第一个是merge()方法,另外一个是join()方法。
方法一:merge()函数
代码如下:
可以看到顺利的满足了粉丝的要求
import pandas as pd
data1 = {"学校": ['哈佛', 'MIT', '清华', '早稻田'], "国家":['美国', '美国', '中国', '日本']}
data2 = {"学校": ['哈佛', 'MIT', 'MIT', '清华', '清华', '早稻田'],
"老师": ['John', 'Mike', 'Jason', '李明', '韩磊', '武田康福']}
data1 = pd.DataFrame(data1)
data2 = pd.DataFrame(data2)
print(data1)
print(data2)
data2.merge(data1, how='left').value_counts('国家')
print(data2.merge(data1, how='left').value_counts('国家'))
print(data2.merge(data1, how='left'))
不过这还不够,粉丝后来又提需求了,如下所示:
不慌,直接将value_counts()函数去掉即可,如下:
如此,完美的满足了粉丝的需求:
方法二:join()
代码如下:
join原来是用index做key连接的,这样也是可以满足粉丝的需求的。
总结
大家好,我是Python进阶者。这篇文章基于粉丝提问,在实际工作中运用Python工具实现了数据批量分组的问题,在实现过程中,巧妙的运用了pandas.merge()函数和pandas.join()函数,顺利的帮助粉丝解决了问题,加深了对该函数的认识。
最后感谢粉丝【Lee】提问,感谢【🌑(这是月亮的背面)】大佬给予的思路和代码支持,感谢粉丝【aVen】、【冫马讠成】、【水方人子】等人参与探讨和学习。
文中针对该问题,给出了两个方法,小编相信肯定还有其他的方法,欢迎大家积极尝试。
小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。
小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。

------------------- End -------------------
往期精彩文章推荐:

欢迎大家点赞,留言,转发,转载,感谢大家的相伴与支持
想加入Python学习群请在后台回复【入群】
万水千山总是情,点个【在看】行不行
/今日留言主题/
随便说一两句吧~~
本文通过一个实际问题,展示了如何使用Python的pandas库,结合merge()和join()函数来统计数据集中来自不同国家的教师数量。作者首先介绍了问题背景,然后详细解释了两种解决方案,分别使用merge()和join()方法。这两种方法都能够有效地完成任务,满足了粉丝的需求。

被折叠的 条评论
为什么被折叠?



