
数据分析笔记
数据分析笔记
sweetheart7-7
学习笔记
展开
-
np.meshgrid()函数
X, Y = np.meshgrid(x, y)代表的是将x中每一个数据和y中每一个数据组合生成很多点,然后将这些点的x坐标放入到X中,y坐标放入Y中,并且相应位置是对应的即如: x = [1, 2, 3, 4] y = [7, 8, 9] x和y中的每一个元素组合生成[[[1, 7], [2, 7], [3, 7], [4, 7]], [[1, 8], [2, 8], [3, 8], [4, 8]], [[1, 9], [2, 9], [3, 9], [4, 9]]] 然.原创 2021-01-17 18:33:37 · 24157 阅读 · 1 评论 -
pandas模块的使用(三)
为DataFrame添加一列数据:In [16]: x = pd.DataFrame(np.arange(12).reshape(3,4),columns=list("QWER"))In [17]: xOut[17]: Q W E R0 0 1 2 31 4 5 6 72 8 9 10 11In [18]: x["O"]= pd.DataFrame(np.arange(3).reshape(3,1))In [19]: xOut[19]原创 2020-10-05 19:15:57 · 456 阅读 · 2 评论 -
pandas模块的使用(二)
数据合并之join:join:默认情况下他是把行索引相同的数据合并到一起In [6]: t1 = pd.DataFrame(np.zeros((2,5)),index=["A","B"],columns=list("VWXYZ"))In [7]: t1Out[7]: V W X Y ZA 0.0 0.0 0.0 0.0 0.0B 0.0 0.0 0.0 0.0 0.0In [8]: t2 = pd.DataFrame(np.ones原创 2020-10-04 21:10:47 · 453 阅读 · 0 评论 -
数据分析之pandas模块的使用(一)
什么是Pandas?Pandas的名称来自于面板数据(panel data)和Python数据分析(data analysis).Pandas是一个强大的分析结构化数据的工具集,基于NumPy构建,提供了 高级数据结构 和 数据操作工具,它是使Python成为强大而高效的数据分析环境的重要因素之一.一个强大的分析和操作大型结构化数据集所需的工具集基础是NumPy,提供了高性能矩阵的运算提供了大量能够快速便捷地处理数据的函数和方法应用于数据挖掘,数据分析提供数据清洗功原创 2020-10-04 15:18:28 · 519 阅读 · 0 评论 -
numpy模块的使用(二)
ndarry缺失值填充均值:import numpy as npdef fill_ndarry(t1): for i in range(t1.shape[1]): temp_col = t1[:,i] # 当前的一列 nan_num = np.count_nonzero(temp_col!=temp_col) if nan_num!=0: # 不为0说明这一列中有nan # 当前一列不为nan的array原创 2020-10-03 18:51:23 · 514 阅读 · 0 评论 -
数据分析之numpy模块的基本使用
Numpy (Numerical Python):1. Numpy:提供了一个在Python中做科学计算的基础库,重在数值计算,主要用于多维数组(矩阵)处理的库.用来存储和处理大型矩阵,比Python自身的嵌套列表结构要高效的多.本身是由C语言开发,是个很基础的扩展,Python其余的科学计算扩展大部分都是以此为基础.2. 高性能科学计算和数据分析的基础包3. ndarray,多维数组(矩阵),具有矢量运算能力,快速、节省空间4. 矩阵运算,无需循环,可完成类似Matlab中的矢量运算原创 2020-10-03 13:25:31 · 598 阅读 · 2 评论 -
matplotlib的使用(二)
绘制散点图:假设通过爬虫你获取到了北京2019年3,10月份每天白天的最高气温(分别位于列表a,b),那么此时如何寻找出气温和随时间(天)变化的某种规律?y_3 = [14,16,14,17,17,10,13,14,11,12,16,11,16,16,14,19,20,21,24,19,12,14,12,20,22,18,21,10,13,10,15]y_10 = [30,29,29,15,19,19,24,20,22,22,18,18,13,16,17,15,14,18,20,22,19,20,2原创 2020-10-02 21:04:11 · 529 阅读 · 0 评论 -
数据分析之matplotlib画图工具的使用(一)
matplotlib:最流行的Python底层绘图库,主要做数据可视化图表,名字取材于MATLAB,模仿MATLAB构建安装:pip3 install matplotlib或者: pip3 install matplotlib -i https://pypi.tuna.tsinghua.edu.cn/simple基本使用:#-*-coding:utf-8-*-from matplotlib import pyplot as plt # 导入pyplot# 数据在x轴的位置,是一个可迭代原创 2020-10-02 12:39:27 · 698 阅读 · 0 评论