pandas 基础

这篇博客介绍了pandas的基础知识,包括其两大核心数据结构DataFrame和Series,以及如何利用它们进行数据加载、选择、清洗、分块加载、行选择、统计和合并等操作。通过实例展示了pandas在数据处理中的实用功能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

pandas有两个主要的数据结构DataFrame和Series。DataFrame是一个类似数据库表的二维结构,Series是一个一维结构。对于pandas的一个简单直观的认识就是pandas基于这两个数据结构,提供了相关的数据操作和绘图函数。用这些函数可以实现从文件加载数据、选择数据、数据清洗、添加、插入、删除、分组和转换等操作。

1. 加载数据

import pandas as pd
filename = 'data/datasets-uci-iris.csv'
iris = pd.read_csv(filename, sep=',', decimal='.', header=None,
                   names=['sepal_length', 'sepal_width',
                          'petal_length', 'petal_width','target'])

iris.head()
Out[10]: 
   sepal_length  sepal_width  petal_length  petal_width       target
0           5.1          3.5           1.4          0.2  Iris-setosa
1           4.9          3.0           1.4          0.2  Iris-setosa
2           4.7          3.2           1.3          0.2  Iris-setosa
3           4.6          3.1           1.5          0.2  Iris-setosa
4           5.0          3.6           1.4          0.2  Iris-setosa

iris.columns
Out[13]: 
Index([u'sepal_length', u'sepal_width', u'petal_length', u'petal_width',
       u'target'],
      dtype='object')

2.选择数据列

类似sql中的select field01, fiedl02 from t1

Y = iris['target']
Y.head()
Out[20]: 
0    Iris-setosa
1    Iris-setosa
2    Iris-setosa
3    Iris-setosa
4    Iris-setosa
Name: target, dtype: object

X = iris[['sepal_length', 'sepal_width']]
X.head()
Out[21]: 
   sepal_length  sepal_width
0           5.1          3.5
1           4.9          3.0
2           4.7          3.2
3           4.6          3.1
4           5.0          3.6

 选择列后再选择行

import os
filename = 'data/datasets-uci-iris.csv'
filename = os.getcwd() + "/essentials/" + filename
iris = pd.read_csv(filename, sep=',', decimal='.', header=None,
                   names=['sepal_length', 'sepal_width',
                          'petal_length', 'petal_width','target'])
iris['target'][10]
Out[9]: 
'Iris-setosa'
iris['target'][10:12]
Out[10]: 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值