06.Python数据处理


05.Python与数据处理库:NumPy、Pandas、Matplotlib

1. NumPy基础

NumPy简介

NumPy(Numerical Python)是一个用于科学计算的Python库,它提供了一个强大的多维数组对象 ndarray,以及用于处理这些数组的各种函数。NumPy是Python数据分析和科学计算的基础库之一,许多高级数据分析库(如Pandas、Scikit-learn)都依赖于NumPy来处理数值数据。其主要功能包括:

  • 多维数组:提供高效的多维数组对象(ndarray),支持数组的切片、索引和广播等操作。
  • 数学函数:包含大量的数学函数用于数组运算,如线性代数、统计、傅里叶变换等。
  • 数组操作:支持数组的重塑、合并、拆分等操作。
  • 性能优化:NumPy底层使用C语言编写,运算效率高,特别适合大规模数据处理。
#安装命令
!pip install numpy
Requirement already satisfied: numpy in /opt/conda/lib/python3.11/site-packages (1.26.2)

NumPy数组(ndarray)

  • 创建NumPy数组:使用array()函数
  • 示例代码:
import numpy as np
arr = np.array([1, 2, 3, 4, 5])
print(arr)
[1 2 3 4 5]

NumPy数组的索引与切片

  • 一维与多维数组的索引
  • 示例代码:
arr = np.array([1, 2, 3, 4, 5])
print(arr[2])  # 输出3
print(arr[1:4])  # 输出[2 3 4]
3
[2 3 4]

NumPy数组的常见操作

  • 数组的加法、乘法等基本操作
  • 示例代码:
arr1 = np.array([1, 2, 3])
arr2 = np.array([4, 5, 6])
print(arr1 + arr2)  # 输出[5 7 9]
[5 7 9]

2. Pandas基础

Pandas简介

Pandas是一个提供高效数据结构和数据分析工具的Python库。它主要基于两个数据结构:Series 和 DataFrame,分别用于处理一维和二维数据。Pandas在数据清洗、预处理、分析和可视化方面广泛应用。其主要功能包括:

  • DataFrame:类似于Excel表格的数据结构,支持列名、行索引和丰富的数据操作功能。
  • Series:一维标签化数组,类似于Python的列表或字典。
  • 数据操作:包括数据选择、过滤、分组、合并、连接、聚合、缺失值处理等。
  • 文件处理:
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值