2017.02.16:利用Python进行数据分析01

本文介绍Numpy库的特性,包括快速多维数组处理、标准数学函数应用及线性代数等功能,并探讨了IPython提供的交互式Python Shell及其模块深度重载功能。此外,还介绍了使用Numpy进行数据清理、描述统计等高级数据分析技巧。

1.IPython:一种交互式的pythonshell。IPython提供了一个特殊的dreload函数,解决模块的“深度”(递归)重加载。

2.Numpy:NumericalPython

2.1.ndarray:具有矢量算数运算和复杂广播能力的快速且节省空间的多维数组。

2.2.用于对整组数据进行快速运算的标准数学函数(无需编写循环)。

2.3.用于读写的磁盘数据的工具以及用于操作内存映射文件的工具。

2.4.线性代数、随机数生成及傅里叶变换功能。

3.对于数据分析:

3.1.数据清理:集合构造和过滤,转换等快速的矢量化数组运算。

3.2.常用的数组算法运算,唯一化、集合运算

3.3.高效的描述统计和数据聚合/摘要运算。

3.4.用于异构数据集的合并/连接运算的数据对齐和关系型数据运算。

3.5.将田间逻辑表述为数组表达式,代替if-elif-else。

3.6.数据的分组运算。

4.ndarray:通用的同构数据多维容器,每个数组都只有一个shape,dtype。

4.1.dtype是一个特殊对象,它含有ndarray,将一块内存解释为待定数据类型所需的信息。

5.花式索引和切片不一样,将数据复制到新数组中。

6.Numpy数组使得将多种数据处理任务表述为简洁地数组表达式。一般来说,矢量量化数组运算要比等价的纯python方式快上一两个数量级。

现在我有8个.nc文件关于陕西2000-2023年逐日降水量,地址如下:"E:\shuju\processed\SHAANXI_CHM_PRE_V2_daily_2023.nc" "E:\shuju\processed\SHAANXI_CHM_PRE_V2_daily_2000.nc" "E:\shuju\processed\SHAANXI_CHM_PRE_V2_daily_2001.nc" "E:\shuju\processed\SHAANXI_CHM_PRE_V2_daily_2002.nc" "E:\shuju\processed\SHAANXI_CHM_PRE_V2_daily_2003.nc" "E:\shuju\processed\SHAANXI_CHM_PRE_V2_daily_2004.nc" "E:\shuju\processed\SHAANXI_CHM_PRE_V2_daily_2005.nc" "E:\shuju\processed\SHAANXI_CHM_PRE_V2_daily_2006.nc" "E:\shuju\processed\SHAANXI_CHM_PRE_V2_daily_2007.nc" "E:\shuju\processed\SHAANXI_CHM_PRE_V2_daily_2008.nc" "E:\shuju\processed\SHAANXI_CHM_PRE_V2_daily_2009.nc" "E:\shuju\processed\SHAANXI_CHM_PRE_V2_daily_2010.nc" "E:\shuju\processed\SHAANXI_CHM_PRE_V2_daily_2011.nc" "E:\shuju\processed\SHAANXI_CHM_PRE_V2_daily_2012.nc" "E:\shuju\processed\SHAANXI_CHM_PRE_V2_daily_2013.nc" "E:\shuju\processed\SHAANXI_CHM_PRE_V2_daily_2014.nc" "E:\shuju\processed\SHAANXI_CHM_PRE_V2_daily_2015.nc" "E:\shuju\processed\SHAANXI_CHM_PRE_V2_daily_2016.nc" "E:\shuju\processed\SHAANXI_CHM_PRE_V2_daily_2017.nc" "E:\shuju\processed\SHAANXI_CHM_PRE_V2_daily_2018.nc" "E:\shuju\processed\SHAANXI_CHM_PRE_V2_daily_2019.nc" "E:\shuju\processed\SHAANXI_CHM_PRE_V2_daily_2020.nc" "E:\shuju\processed\SHAANXI_CHM_PRE_V2_daily_2021.nc" "E:\shuju\processed\SHAANXI_CHM_PRE_V2_daily_2022.nc"需要你给我一个脚本画出陕西2000-2023年陕西极端降水量变化趋势空间分布图,如具体要求如下:1.只需要陕西省数据,陕西省shp地址如下:"E:\shuju\China site\9ce02-main\陕西省行政区划\陕西省.shp",2.定义极端降水阈值进行序列排序时,是将2000-2023年所有日降水量按升序排列,取序列第95个百分位的日降水量作为该网格极端降水阈值,3.利用1961—2013年78个台站汛期极端降水量的时间序列,计算每个网格线性变化趋势,利用趋势系数绘制全省趋势变化分布图,变量列表: ['time', 'lat', 'lon', 'spatial_ref', 'prec']变量详细信息: 变量名: time 维度: ('time',) 数据类型: int64 单位: days since 2000-01-04 00:00:00 ------------------ 变量名: lat 维度: ('lat',) 数据类型: float32 单位: degrees_north ------------------ 变量名: lon 维度: ('lon',) 数据类型: float32 单位: degrees_east ------------------ 变量名: spatial_ref 维度: () 数据类型: int32 ------------------ 变量名: prec 维度: ('time', 'lat', 'lon') 数据类型: float64 单位: mm/day
最新发布
05-20
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值