SQL数据处理与文件格式解析
1. SQL关系连接
SQL数据库在同时处理多个数据表时非常有用,因为它可以容纳多个关系。而CSV文件通常每个文件只包含一个数据表,如果进行使用20个数据表的数据分析,可能需要跟踪20个CSV文件的名称、位置和版本。将所有数据表存储在一个SQLite数据库的单个文件中会更简单。
为了了解名称类别的受欢迎程度,我们将 nyt 关系与 baby 关系连接起来,从 baby 中获取名称计数。
1.1 内连接(Inner Joins)
为了更清晰地展示表连接时的情况,我们创建了 baby_small 和 nyt_small 这两个较小版本的表。
import pandas as pd
import sqlalchemy
db = sqlalchemy.create_engine('sqlite:///babynames.db')
# 查询baby_small表
query1 = '''
SELECT *
FROM baby_small;
'''
baby_small = pd.read_sql(query1, db)
print(baby_small)
# 查询nyt_small表
query2 = '''
SELECT *
FROM nyt_small;
'''
nyt_small = pd.read_sql(query2, db)
print(nyt_small)
# 内连接
query3 =
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



