基于python的大数据分析实战学习笔记-pandas(数据分析包)

本文介绍了pandas作为数据分析包的基础概念,包括Series、DataFrame和Panel三种主要数据结构。重点讲解了Series的使用,通过实例代码演示其功能,并鼓励读者通过实践感受编程的乐趣。

pandas是啥?可能大家看过各种各样的解释,其实归结一句话ta就是一个数据分析包。。。

pandas中常见的数据结构有三种,Series(一维数组,也叫序列),DataFrame(二维表格,类似excel多行多列),Panel(三维数组)

那什么是数据结构呢?就是相互之间存在的一种或多种特定关系的数据类型的集合。

好了,概念就是这么简单,相信有python基础的朋友应该很容易理解,如果你没有。。。。恩。。。就没有吧

今天我们先来介绍下Series的用法,直接撸代码,里面有注释

from pandas import Series

#定义一个序列
"""
一个序列可以存放不同的数据类型,索引index也是可以忽略的,可以通过下标访问(从0开始)

运行可能会报错:
ImportError: C extension: No module named 'pandas._libs.tslib' not built. If you want to import pandas from the source directory, you may need to run 'python setup.py build_ext --inplace --force' to build the C extensions first.
解决方法:
先
pip3 uninstall pandas
在
pip3 install --user pandas
"""
x=Series(['a',True,1],index=['first','second','thrid'])

print('通过下标取值',x[1])
print('通过索引取值',x['second'])

#x[3] 不能越界访问会报错

#x.append(666)#不能追加单个元素

n=Series([666],index=['fourth'])#可以追加一个序列
print('新增序列之后',x.append(n))


if 1 in x.values:
    print('good')
    
#切片
print('切片:',x[1:3])

#定位获取,常用于随机抽样
print(x[[0,2,1]])

#删除
#x
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小强测试

不要打赏我

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值