Python中数据的加载与存储

本文介绍了Python在处理文本和二进制数据方面的强大能力,包括CSV和JSON文本格式的读写,pickle序列化存储,以及如何使用数据库进行高效数据管理。

读写文本格式的数据

因为其简单的文件交互语法、直观的数据结构,以及诸如元组打包解包之类的便利功能,Python在文本和文件处理方面已经成为一门招人喜欢的程序语言。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
Python内置CSV模块读文件

import csv

f = open('test.csv')
reader = csv.reader(f)
for line in reader:
	print(line)

在这里插入图片描述
JSON数据
在这里插入图片描述

import json

# 将json字符串转换成Python形式
result = json.loads(obj)

# 将Python对象转换成json格式
json_obj = json.dumps(result)

二进制数据格式

实现数据的二进制格式存储最简单的办法之一是使用Python内置的pickle序列化。为了使用方便,pandas对象都有一个用于将数据以pickle形式保存到磁盘上的save方法。

import pandas as pd

frame = pd.read_csv('test.csv')

# 数据保存
frame.save('frame_pickle')
# 数据读取
frame = pd.load('frame_pickle')

使用数据库

在许多应用中,数据很少取自文本文件,因为用这种方式存储大量数据很低效。基于SQL的关系型数据库使用非常广泛,此外有一些非SQL型数据库也变得非常流行。数据库的选择通常取决于性能、数据完整性以及应用程序的伸缩性需求。

import pandas.io.sql as sql

sql.read_frame('select * from test', con)
import pymongo

con = pymongo.Connection('localhost', port=27017)
tweets = con.db.tweets
# 保存数据
tweets.save(data)
# 查找数据
cursor = tweets.find({'from_user': 'zhangsan'})
tweet_fields = ['create_at','from_user','id','text']
result = DataFrame(list(cursor), columns=tweet_fields) 
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值