12、SQL数据处理与文件格式解析

SQL数据处理与文件格式解析

1. SQL关系连接

SQL数据库在同时处理多个数据表时非常有用,因为它可以容纳多个关系。而CSV文件通常每个文件只包含一个数据表,如果进行使用20个数据表的数据分析,可能需要跟踪20个CSV文件的名称、位置和版本。将所有数据表存储在一个SQLite数据库的单个文件中会更简单。

为了了解名称类别的受欢迎程度,我们将 nyt 关系与 baby 关系连接起来,从 baby 中获取名称计数。

1.1 内连接(Inner Joins)

为了更清晰地展示表连接时的情况,我们创建了 baby_small nyt_small 这两个较小版本的表。

import pandas as pd
import sqlalchemy
db = sqlalchemy.create_engine('sqlite:///babynames.db')

# 查询baby_small表
query1 = ''' 
SELECT *
FROM baby_small;
'''
baby_small = pd.read_sql(query1, db)
print(baby_small)

# 查询nyt_small表
query2 = ''' 
SELECT *
FROM nyt_small;
'''
nyt_small = pd.read_sql(query2, db)
print(nyt_small)

# 内连接
query3 =
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值