基于python的大数据分析-pandas数据读取(代码实战)

我们常见的数据存储格式无非就是csv、excel、txt以及数据库等形式。
数据读取
在pandas中可以使用一些函数完成数据的读取。比如read_csv、read_excel、read_table、read_sql等,这些分别是啥意思呢。。。。自己看后缀就能明白啦~
下面我们就通过撸代码来了解它们
txt文件
格式:read_table(文件路径与文件名, names=[列名1,列名2,.....], sep="",......)
其中names为列名,默认为文件中的第一行作为列名
sep为分隔符,默认为空
from pandas import read_table
#txt
df=read_table(r'D:python_workspaceanacondarz.txt')
#查看前五行数据
df.head(5)
#查看后两行数据
#df.tail(2)
rz.txt的内容如下
csv文件
格式:read_csv(文件路径与文件名, names=[列名1,列名2,.....], sep="",......)
解释同上,不在废话
#csv
from pandas import read_csv
df=read_csv(r'D:python_workspaceanacondarz.csv')
df
rz.csv的内容如下
excel文件
格式:read_excel(文件路径与文件名, sheetname=sheet的名称, header=0)
sheetname可以指定读取几个sheet,sheet数目从0开始。如果sheetname=[0,2]则代表读取第一个和第三个sheet
header为0表示以文件第一行作为表头显示;为1则把文件第一行丢弃不作为表头显示。
#exel
from pandas import read_excel
df=read_excel(r'D:python_workspaceanacondarz.xls', sheetname='Sheet3')
df
mysql
首先安装pymysql,通过pip命令即可安装
格式:read_sql(要查询的sql语句, 数据库的链接对象)
import pandas as pd
import pymysql
#具体的数据库链接信息自行替换
conn=pymysql.connect(host='xxxx',database='xxx',user='root',
password='',port=3306,charset='utf8')
sql='select * from a'
r=pd.read_sql(sql,conn)
#关闭数据库链接
conn.close()
print(r.head(5))


来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/69942496/viewspace-2655342/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/69942496/viewspace-2655342/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值