【数据分析上手实践】读取数据

最新推荐文章于 2025-03-13 16:33:42 发布

原创最新推荐文章于 2025-03-13 16:33:42 发布 · 1.7k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#python #数据分析 #数据挖掘

部署运行你感兴趣的模型镜像

2022/3/15

1.导入两个库

Numpy计算

Pandas 开源用于数据分析的工具

Import numpy as np

Import pandas as pd

import os #用于os.getcwd()查找文件路径

2.使用相对/绝对路径导入数据

相对：

pd.read_csv #将csv文件读入并转化为数据框形式

#return dataframe or textparser

df=pd.read_csv('C:\\Users\\71403\\Desktop\\titanic\\train.csv') #df 选取

#这里一直报错

#AttributeError：函数名写错

#SyntaxError：语法错误-打成中文字符

#osError：文件路径的格式出错

#permission denied：右键属性开启权限/xx计算机名/user

#filednotfound：cvs文件和代码放一个文件夹

df.shape #显示（行，列）

df.head() #显示dataframe数据框的头部

df.tail(3) #尾部数据

#df.index 显示索引

#df.columns 显示列名

3.pd.read_table(path) #以行为单位存储，没有分割

pd.read_csv #用逗号进行分割

#如何让read_table &read_csv表的形式一致？

Pd.read_table(path,sep=’,’) #限定分割符以逗号分割

4.逐块读取数据

df=Pd.read_csv(‘train.csv’,chunksize=1000) #以每一千行为一块

df.head()

这里类型已经变了，故报错

Type(df)

Df.get_chunk()

5.将表头改为中文

方法一：表头替换

#先取消分块

Df=pd.read_csv(‘train.csv’)

Df.column=(‘’,’’,’’,…)

Df

#方法二读取文件时直接重新命名/多加表头

Df=pd.read_csv(‘train.csv’,name=[‘’,’’,’’,…])

Df

6.展示头部及尾部数据

Df.tail()

Df.tail(15).shape #显示行列

Df.head(10) #显示前九行数据

7.显示空值数据

Df.isnull()

8.df.to_csv(‘train_chinese.csv’)

您可能感兴趣的与本文相关的镜像

Python3.8

Python3.8

Conda

Python

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。