文章目录
- Study:day06—Numpy科学计算与Pandas数据分析
2 数据分析三剑客-Pandas
Study:day06—Numpy科学计算与Pandas数据分析
- Numpy科学计算
- 什么是Numpy?
- 为什么要使用Numpy
- Numpy中的数据类型
- 数组的创建
- Numpy数组的索引和切片聚合
- Numpy的数组操作
- Numpy的IO操作
- Pandas数据分析
- Pandas的数据结构
- Pandas的IO操作
- 数据增删改查
- Pandas的SAC操作
- A部分的ATF操作
- C部分合并,补充操作
- Pandas的时序处理
- Pandas数据清洗
- 缺失值/异常值/重复值
- 数据标准化
1.1 Numpy科学计算
import numpy as np
np.__version__
'1.26.4'
基于Numpy的算法要比纯python快10-100倍,甚至更快,使用的内存更小
import sys
print(sys.getsizeof(my_list2))
print(sys.getsizeof(my_arr2))
a = [0,1,2,3,4]
b = [9,8,7,6,5]
a = np.array(a)
b = np.array(b)
a**2+b**3
array([729, 513, 347, 225, 141])
1.1.1 数组对象ndarray




1.1.2 ndarray对象的属性
a = np.array([
[0,1,2,3,4],
[9,8,7,6,5]
])
print( a.shape ) # 查看数组对象的形状
print( a.ndim ) # 查看维度数量 或者族的数量
print( a.size ) # 查看对象元素的个数
print( a.dtype ) # 查看元素类型
(2, 5)
2
10
int32
b = np.array([
[0,1,2,3,4],
[9,8,7,6,5]
],dtype='int8') # 使用int8进行存储,可以占用更少的字节数量,更省空间
print( b.dtype )
print( b.itemsize )
int8
1
1.2数组对象的创建
使用np.array创建数组
np.array([1,2,3]) # 创建一位数组
np.array((4,5,6)) # 也可以使用元组
np.array([1,2,3],ndmin=2) # 这是一个二维的数组
np.array([
[1,2],[3,4]
])
np.array([
[[1,2,3],
[3,4,3]],
[[1,2,1],
[3,4,4]],
[[1,2,1],
[3,4,4]],
[[1,2,1],
[3,4,4]],
]) # 三维数组,先描述第三个维度,其次才是1,2维度
array([[[1, 2, 3],
[3, 4, 3]],
[[1, 2, 1],
[3, 4, 4]],
[[1, 2, 1],
[3, 4, 4]],
[[1, 2, 1],
[3, 4, 4]]])