Python数据分析之merge使用

本文介绍如何使用Python的Pandas库中的DataFrame对象来实现不同表之间的连接操作。通过构造用户和订单两个数据集,并演示了如何使用merge函数来进行连接,同时说明了默认情况下采用的是inner连接方式。

在现实生活中,都会存在不同的表,但表之间有相互关系,我们需要进行整理,进行连接,这种过程类似于数据库的连接。
我们先构造用户和订单的dataframe:

import pandas as pd
import numpy as np
import datetime
customers = {
    'CustomerID':[10,11],
    'Name':['xiaomin','zhansan'],
    'Address':['csuft','changsha']
}
customers = pd.DataFrame(customers)
customers
3629157-ff4798f60c791b48.jpg
orders = {
    'CustomerID':[10,11,10],
    'OrderDate':[
        datetime.date(2016,12,1),
        datetime.date(2016,12,1),
        datetime.date(2016,12,2)
    ]
}
orders = pd.DataFrame(orders)
orders
3629157-1baa3a06b1926b4f.jpg

通过merge进行连接:

customers.merge(orders)
3629157-8ee3fd52c28eb468.jpg

默认情况下使用inner连接。其他方法类似,在这里不在讲解。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值