【数据分析上手实践】读取数据

部署运行你感兴趣的模型镜像

2022/3/15

1.导入两个库

Numpy计算

Pandas 开源用于数据分析的工具

Import numpy as np

Import pandas as pd

import os  #用于os.getcwd()查找文件路径

2.使用相对/绝对路径导入数据

相对:

pd.read_csv #csv文件读入并转化为数据框形式

#return dataframe or textparser

df=pd.read_csv('C:\\Users\\71403\\Desktop\\titanic\\train.csv')  #df 选取

#这里一直报错

#AttributeError:函数名写错

#SyntaxError:语法错误-打成中文字符

#osError:文件路径的格式出错

#permission denied:右键属性开启权限/xx计算机名/user

#filednotfound:cvs文件和代码放一个文件夹

df.shape  #显示(行,列)

df.head()  #显示dataframe数据框的头部

df.tail(3)  #尾部数据

#df.index 显示索引

#df.columns 显示列名

3.pd.read_table(path) #以行为单位存储,没有分割

pd.read_csv  #用逗号进行分割

#如何让read_table &read_csv表的形式一致?

Pd.read_table(path,sep=’,’)  #限定分割符以逗号分割

4.逐块读取数据

df=Pd.read_csv(‘train.csv’,chunksize=1000) #以每一千行为一块

df.head()

这里类型已经变了,故报错

Type(df)

Df.get_chunk()

5.将表头改为中文

方法一:表头替换

#先取消分块

Df=pd.read_csv(‘train.csv’)

Df.column=(‘’,’’,’’,…)

Df

#方法二 读取文件时直接重新命名/多加表头

Df=pd.read_csv(‘train.csv’,name=[‘’,’’,’’,…])

Df

6.展示头部及尾部数据

Df.tail()

Df.tail(15).shape  #显示行列

Df.head(10)  #显示前九行数据

7.显示空值数据

Df.isnull()

8.df.to_csv(‘train_chinese.csv’)

 

您可能感兴趣的与本文相关的镜像

Python3.8

Python3.8

Conda
Python

Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值