用python如何读取数据源

本文详细介绍了如何使用Python的pandas库读取Excel、CSV和TXT文件,包括指定sheet、行列索引、选择列及文件编码。还展示了数据预处理的一些基本操作,如查看数据、获取形状、信息及描述性统计。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、首先要先安装一个插件,打开终端,输入“pip install xlrd”,如果已经安装了,则会有说明如下:Requirement already satisfied: xlrd in +路径
2、把文件拖到终端可以得到文件所在路径
3、读取excel数据

import pandas as pd
df = pd.read_excel(r"--路径--")
print(df,"\n")

#指定某个sheet
df = pd.read_excel(r"--路径--", sheet_name = "Sheet1")
print(df,"\n")

#指定sheet的顺序,从0开始
df = pd.read_excel(r"--路径--", sheet_name=0)
print(df,"\n")

#指定某列作为行索引
df = pd.read_excel(r"--路径--",index_col = 0)
print(df,"\n")

#指定某行作为列索引
df = pd.read_excel(r"--路径--",header=0)
print(df,"\n")

#指定导入列,传入需要保存的列数列表
df = pd.read_excel(r"--路径--",usecols  = [0,3])/*只导入第1列和第4列*/
print(df,"\n")

4、导入.csv文件,用read_csv()

#csv的间隔符如果不是逗号,则需要指明间隔符
df = pd.read_csv(r"--路径--",sep=" ")/*间隔符是空格*/
print(df,"\n")

#指明读取行数,用nrows
df = pd.read_csv(r"--路径--", sep = " ", nrows = 2)/*只读前两行*/
print(df,"\n")

#如果另存的是 CSV(逗号分离)则需要指定编码格式为gbk
df = pd.read_csv(r"--路径--",endcoding = "gbk")
print(df,"\n")

5、导入.txt文件。read_table()是导入利用分隔符分开文件的通用函数不仅可以导入.txt文件,还可以导入.csv文件

df = pd.read_table(r"--路径--",sep = " ")
print(df,"\n")

#用head()控制显示前几行,默认是五行
print("显示前三行数据:")
print(df.head(3),"\n")

#用shape获取数据表的大小
print("数据表的大小:")
print(df.shape,"\n")

#用info获取数据类型
print("数据类型:")
print(df,info(),"\n")

#获取数据分布
print("数据分布:")
print(df.describe(),"\n")
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值