python:pandas合并csv文件(图书数据集成)

本文介绍如何使用Python的pandas库进行CSV文件的数据集成,通过主键连接两张表——读者信息表和读者借阅记录表,实现数据的整体分析,并展示了具体的代码实现过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

数据集成:将不同表的数据通过主键进行连接起来,方便对数据进行整体的分析。

两张表:ReaderInformation.csv,ReaderRentRecode.csv

ReaderInformation.csv:
这里写图片描述

ReaderRentRecode.csv:
这里写图片描述

pandas读取csv文件,并进行csv文件合并处理:

# -*- coding:utf-8 -*-

import csv as csv
import numpy as np

# -------------
# csv读取表格数据
# -------------
'''
csv_file_object = csv.reader(codecs.open('ReaderRentRecode.csv', 'rb'))
header = csv_file_object.next()
print header
print type(header)
print header[1]

data = []
for row in csv_file_object:
    data.append(row)
data = np.array(data)

print data[0::, 0]
'''
# -------------
# pandas读取表格数据
# -------------
import pandas as pd

df = pd.read_csv('ReaderRentRecode.csv')  # 读者借阅信息表
'''
print df.head()
print '----------------'
print df[['读者证号', '读者姓名', '书名', '中图法分类号']]  # 选取其中的四列
print '------------------------------------------------------------------'
print
'''
dd = pd.read_csv('ReaderInformation.csv')
'''
print dd.head()
print '----------------'
print dd[['读者证号', '读者性别', '读者单位', '读者类别']]
print '------------------------------------------------------------------'
print
'''
data = pd.merge(df, dd, on=['读者证号', '读者姓名'], how='left')  # pandas csv表左连接
data = data[['读者证号', '读者姓名', '读者性别', '书名', '中图法分类号', '读者单位', '读者类别']]
print data
print '------------------------------------------------------------------'
print

# -------------
# pandas写入表格数据
# -------------
data.to_csv(r'data.csv', encoding='gbk')

合并后的csv文件:data.csv
这里写图片描述

通过使用pandas的函数merge来进行两个表的左连接,最后得到相应的data.csv文件。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值