pandas学习笔记

最新推荐文章于 2024-10-24 19:44:34 发布

原创最新推荐文章于 2024-10-24 19:44:34 发布 · 200 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#pandas #python #数据

python 专栏收录该内容

7 篇文章

订阅专栏

pandas的数据结构

1.Series
类似numpy中的一维数组,表示为索引（从0开始）和值。
创建：

import pandas as pd,numpy as np
s1 = pd.Series(np.arange(10))
s2 = pd.Series([12,2,5])
s3 = pd.Series({'a':10,'b':44})

含有的属性：

s1.values
s1.index
s1.dtype

方法：

s3.drop('b')#丢弃某项

2.DataFrame
创建：

d1 = pd.DataFrame(np.array(np.arange(12)).reshape(3,4))#通过数组创建
d2 = pd.DataFrame({'a':[1,2],'b':[1,4]})#通过字典创建
d3 = pd.DataFrame({'a':{'o':3,'p':4,'q':5},'b':{'o':5,'p':1,'q':6},'c':{'o':8,'p':1,'q':2})#与上面的区别是行索引
d4 = d3[['a','c']]#利用数据框创建新的，注意与d3['a']的区别

属性：

d3.T#转置

丢弃某项：

d3.drop(['o','q'])#丢弃行
d3.drop('a',axis=1)#丢弃列
d3.drop('o',inplace=True)#原数据直接被替换

索引

自定义索引：

s4 = pd.Series(np.arange(3))
s4.index = ['a','b','c']

重新索引：

s4.reindex(['a','c','b'])

数据获取方法：

s4[2]
s4['a']
s4[:2]
s4['a':]

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

truffle528

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【Python数据分析--pandas学习笔记】Python数据分析库pandas详细学习笔记（内容详细，适合小白入门），数据分析学习笔记

m0_67844671的博客

06-02

1517

【Python数据分析--pandas学习笔记】Python数据分析库pandas详细学习笔记（内容详细，适合小白入门），数据分析学习笔记

python数据合并、重塑、移除

truffle528的博客

11-17

1334

目录合并数据集轴向合并数据重塑移除重复行参考合并数据集 pd.merge(left, right, how, on, left_on, right_on, sort) left 左表 right 右表 how 连接方式 on 连接的列名，默认是两个表的同名列 left_on...

2 条评论您还未登录，请先登录后发表或查看评论

1 条评论

梦想橡皮擦 2018.11.16
很好，很强大，谢谢博主
- truffle528回复梦想橡皮擦 2018.11.17
  [reply]hihell[/reply] 哈哈，以后会继续更新常用的函数~

Anaconda使用IDLE

Jerry不认识Tom的博客

04-20

1万+

python自带的IDLE使用起来非常方便，尤其是在编写调试小段代码的时候，但是安装了Anaconda的同志可能会发现，无法像直接安装python解释器时那样方便地使用idle，本文介绍一点魔改技巧，让你安装Anaconda之后也能方便地使用IDLE。一、修改py文件打开方式首先，win+R输入regedit打开注册表编辑器。然后定位到“计算机\HKEY_CLASSES_ROOT\.py”，没有的...

Pandas学习笔记

2301_80061493的博客

07-22

1950

学习目的：通过真实的数据，以实战的方式了解数据分析的流程和熟悉数据分析python的基本操作。

Pandas 学习笔记

WZZ的博客

02-22

422

Pandas 学习笔记

pandas入门学习笔记

YL010325的博客

07-22

1187

pandas主要是Python语言的一个扩展程序库,提供了高效、灵活、易用的数据结构，专门用于数据操作和分析。Pandas的主要功能包括：数据清洗：处理缺失数据、重复数据、异常值等。数据选择和过滤：通过标签或位置选择数据子集。数据操作：合并、连接、重塑和透视数据。数据分组和聚合：按照某些标准分组数据，并进行聚合计算。时间序列分析：支持时间索引和时间序列数据的处理。数据输入和输出：读取和写入多种数据格式，如CSV文件、Excel表格、数据库等。

个人pandas学习笔记

chicali的博客

07-22

1387

Pandas 是基于 NumPy 的一个数据分析库，提供了快速、灵活和表达力强的数据结构，旨在使数据清洗和分析工作变得更加简单易行。

pandas 学习笔记

热门推荐

truffle528的博客

10-13

5万+

因为我的电脑中以前装有python，这次重新从网上安装python3后与之前残留的设置产生了冲突，打开cmd输入python出现错误： Fatal Python error: Py_Initialize: unable to load the file system codec ModuleNotFoundError: No module named 'encodings' 原因是以前的环境...

廖雪峰Python笔记[1] - 运算和数据结构

truffle528的博客

12-03

295

目录 1 输入输出 2 布尔运算 3 四则运算 4 list和tuple 5 dict和set 1 输入输出输出:逗号被空格代替，print也可以进行简单的计算,字符串前加r表示不转义，raw的意思。用''' '''写的字符串会省去写\n的烦恼。 print('逗号','被空格','代替') print(100 + 200) print(r'this\'r...

廖雪峰Python笔记[3] - 切片/迭代/生成器/列表生成式

truffle528的博客

12-05

268

目录 1. 数据切片 2. 迭代 3. 列表生成式和生成器 4. 迭代器 1. 数据切片数据切片是为了获取集合中的某些数据，可以看作更自由地从集合中拿到想要的数据，适用于list、tuple、str。 today = ['sea','boy','tree','beach'] # 数据切片 print(today[:3]) # 索引不包括3号，为0-2 pri...

廖雪峰Python笔记[2] - 函数

truffle528的博客

12-04

201

目录 1.函数定义 2.函数参数 3.递归函数 1.函数定义定义函数用def，函数可以有返回或者没有返回，也可以返回多个值，这时返回的实际是一个tuple，可以用多个变量接收一个tuple。在暂时不想写函数内容时可以用pass占位。 def guess(): guess = input("今天发生了一件事，你猜是好事还是坏事。(G/B):") i...

廖雪峰Python笔记[4] - 函数式编程

truffle528的博客

12-06

173

目录 1. 高阶函数 2. 闭包 3. 匿名函数 4. 装饰器 5. 偏函数 1. 高阶函数在Python中函数本身是一个变量，它可以接受传入的参数，可以用另一个变量指向这个函数，这时候的变量同样也就可以接受传入的参数。高阶函数就是指一种特殊的函数，它接受函数本身作为参数传入。 print(abs) print(abs(-2)) temp = abs pr...