《利用python进行数据分析》笔记一

本文介绍Numpy库的基础使用方法,包括数组创建、数据类型转换、数组运算、索引选取等核心功能,以及数学统计和文件读写操作。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、 Numpy

import numpy as np

test_data=np.array(data,dtype=np.int32)
np.asarray(data) 将数据转化为ndarray
np.arange() 创建序号
np.ones()创建元素均为1的ndarray
np.ones_like(data)创建与data同维度的元素均为1的ndarray
np.zeros() np.zeros_like()
np.empty() np.empty_like() 类似上,但empty创建的ndarray中元素为未定义的垃圾数
np.eye/identity() 创建n维方阵,对角线元素为1,其余元素为0(eye默认浮点型,identity默认整型)
test_data.astype(datatype) 改变数据类型,并创建新ndarray

创建数组
数据类型1
数据类型2
一元函数1
一元函数2
二元函数

在复杂计算中,浮点数可能累计近似错误,在比较大小时,只能比较一位小数

不同大小的数组间的运算叫做广播(broadcasting)
矢量化使得不用循环即可对数组中元素进行批量运算

当给一个切片赋一个标量值时,该赋值会广播到切片中的每个元素,同时改变源数组对应位置的元素值

若欲操作切片而不影响源数组中的值,需要用test_data[n:m].copy()复制出一个新的变量
切片方法:整数索引,冒号
花式索引(利用整数数组进行索引)会产生新ndarray

通过布尔型索引得到切片,将总是为切片创建副本
布尔型的“或”、“且”、“非”符号为“|”、“&”、“!=”/“-”(条件要用圆括号括起来)

二维数组转置:.T对象
高维数组转置:.transpose((轴编号))
转置返回源数据的视图

通用函数(ufunc)是一种对ndarray执行元素级运算的函数

np.sqrt(data)
np.exp(data)
np.maximum(data1,data2)
np.add(data1,data2)

np.where(con,data1,data2) 根据条件取值

数学和统计方法

可以用对象方法和numpy函数方法

求平均数:
arr.mean()
np.mean(arr)
*涉及到高维数组需要确定轴时:
arr.mean(axis=data)

np.sort计算分位数:
np.sort(arr)
arr[int(0.3*length(arr))]

返回arr的30%下分位数

统计方法1
统计方法2

集合运算

找出一维数组中的唯一(distinct)值并排序返回:
np.unique(data)
sorted(set(data))

集合运算

用于数组的文件输入与输出
np.save(‘filename’,data):产生.npy文件
np.savez(‘filename’,a=data1,b=data2):产生.npz文件(类似字典)
np.savetxt(‘filename’,data,delimiter=’,’)
data1=np.load(‘filename.npz’)
data2=np.load(‘filename.npy’)
data3=np.loadtxt(‘filename.txt’,delimiter=’,’)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值