
数据分析
一个回和
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
使用Numpy模块创建数组对象
目录一、Numpy模块的简介二、使用Numpy模块创建数组对象1.array(1)创建一维数组(2)创建二维数组2.arange3.linspace 创建一个均匀数组4.logspace 创建等比数列5.zeros 创建全为0的多维数组6.ones 创建全为1的多维数组7.eye 创建单位矩阵E8.diag 创建指定元素组成的对角数组...原创 2019-06-13 20:34:06 · 1927 阅读 · 0 评论 -
使用pandas模块实现数据的标准化
目录1.3σ原则2.离差标准化3.标准差标准化4.小数定标标准化3σ 原则 (u-3*σ ,u+3*σ ) 离差标准化 (x-min)/(max-min) 标准差标准化 (x-u)/σ 小数定标标准化 x/10**k k=np.ceil(log10(max(|x|))) 1.3σ原则u 均值σ 标准差...原创 2019-06-21 11:21:48 · 7584 阅读 · 0 评论 -
数据可视化--matplotlib模块绘图的基本流程
使用matplotlib模块进行绘图流程导入模块import matplotlib.pyplot as plt1.创建画布plt.figure()2.进行绘图准备数据,进行绘图,进行图形添加修饰#准备数据x=[1,2,3,4,5]y=[10,4,6,2,8]#进行绘图 #plot():绘制折线图plt.plot(x,y)3.图形展示#图形...原创 2019-06-17 09:49:59 · 4345 阅读 · 1 评论 -
数组排序
目录1.sort()(1)对一维数组进行排序(2)对二维数组进行排序2.argsort()3.lexsort()1.sort()(1)对一维数组进行排序import numpy as np#创建数组arr=np.arange(16,0,-1)print('arr:',arr)#进行排序,默认为升序arr.sort()print('arr:',arr)...原创 2019-06-17 11:19:46 · 838 阅读 · 0 评论 -
使用matplotlib模块绘制正弦,余弦图形
目录1.绘制画布2.进行绘制(1)准备数据(2)进行绘制(3)进行图形添加与修饰3.图形展示导入模块import matplotlib.pyplot as pltimport numpy as np1.绘制画布plt.figure()2.进行绘制(1)准备数据#准备x,y数据#默认不支持负号,想要使用负号,要设置RC参数#设置RC参数...原创 2019-06-17 11:45:36 · 3040 阅读 · 0 评论 -
绘制气温变化图
目录1.创建画布2.进行绘制(1)数据准备(2)进行绘制(3)图形添加修饰3.图形展示.创建画布import matplotlib.pyplot as plotimport numpy as npplt.figure(figsize=(20,8),dpi=80)#设置RC参数# 默认不支持中文 想要使用中文,要设置RC参数plt.rcParams['f...原创 2019-06-17 14:55:11 · 5567 阅读 · 0 评论 -
散点图的绘制
目录1.创建画布2.绘制图形(1)准备数据(2)进行绘制(3)图形添加修饰3.图形展示1.创建画布创建画布,返回画布对象给画布对象增加子图参数1,2:表示增加的子图为几行几列参数3:表示第几个图从当前这个增加子图的代码开始到下一个增加子图的代码的内容,都是这个子图的修饰内容import matplotlib.pyplot as pltimpo...原创 2019-06-17 20:04:55 · 5186 阅读 · 1 评论 -
柱状图
一、柱状图条状结构用于比较各个类别之间的数量 ---用于少量数据的比较需要类别数目,各个类别的数量二、绘制柱状图1.创建画布import matplotlib.pyplot as pltimport numpy as np# 默认不支持中文 想要使用中文,要设置RC参数plt.rcParams['font.sans-serif'] = 'SimHei' # 设置...原创 2019-06-17 20:37:46 · 643 阅读 · 0 评论 -
饼图的绘制
1.创建画布import matplot.pyplot as pltimport numpy as np#设置RC参数# 默认不支持中文 想要使用中文,要设置RC参数plt.rcParams['font.sans-serif'] = 'SimHei' # 设置RC参数字体,让其支持中文# 默认不支持负号,想要支持负号,要设置RC参数plt.rcParams['axes.uni...原创 2019-06-17 21:09:22 · 528 阅读 · 0 评论 -
数组的去重与重复
目录1.去重 unique()2.重复(1)对整个数组进行重复 tile()(2)对数组的行和列进行重复 repeat()1.去重 unique()import numpy as np# 创建一个数组arr = np.array(["小花", "小明", "小王", "小芳", "小可爱", "小花", "小明", "小可爱"])print('arr:...原创 2019-06-17 22:01:51 · 235 阅读 · 0 评论 -
数组的常用指标统计
常用指标:和 sum() 平均值 mean() 最大值 max() 最小值 min() 方差 var() 标准差 std() 最大值下标 argmax() 最小值下标 magmin() 累计和 cumsum() 累计积 cumprod() import numpy as np# 创建数组...原创 2019-06-17 22:10:48 · 491 阅读 · 0 评论 -
箱线图
一、箱线图介绍二、箱线图绘制1.创建画布import matplotlib.pyplot as pltimport numpy as np#设置RC参数# 默认不支持中文 想要使用中文,要设置RC参数plt.rcParams['font.sans-serif'] = 'SimHei' # 设置RC参数字体,让其支持中文# 默认不支持负号,想要支持负号,要设置RC参数...原创 2019-06-18 10:54:12 · 1999 阅读 · 1 评论 -
读写文件
目录1.读写二进制的文件(1)单个数组(2)多个数组2.读写文本格式的数据(txt csv)(1)保存为文本文件:savetxt()(2)读取文本文件:loadtxt()(3)genformtxt() 面向的是结构化的数组和缺失数据1.读写二进制的文件import numpy as nparr1=np.arange(16).reshape(4,4)a...原创 2019-06-14 22:02:04 · 249 阅读 · 0 评论 -
ufunc()函数的广播机制
广播是指不同形状的数组之间执行算数运算的方式,需要遵循4个原则:1.让所有输入数组都向其中shape最长的数组看齐,shape中不足的部分都通过在前面加1补齐2.输入数组的shape是输入数组shape的各个轴上的最大值3.如果输入数组的某个轴和输出数组的对应轴的长度相同或者其长度为1时,这个数组能够用来计算,否则出错。4.当输入数组的某个轴的长度为1时,沿着此轴运算时都用此轴上的...原创 2019-06-14 21:52:11 · 1432 阅读 · 1 评论 -
矩阵的运算
目录1.矩阵与数相乘 每一项都要乘2.矩阵的加减运算 每一项都要乘3.矩阵相乘4.矩阵对应元素相乘 ---同型矩阵5.矩阵的转置 T6.矩阵的共轭转置 H7.矩阵的逆 I8.矩阵的试图 A1.矩阵与数相乘 每一项都要乘import numpy as npm1 = np.mat([[1, 2, 3], [2, 3, 4]])pr...原创 2019-06-14 21:27:01 · 1098 阅读 · 0 评论 -
数组的数据类型
1.数组的数据类型bool int32 int64 str float32 float64...................................2.设置数组的数据类型(1)设置数组的数据类型import numpy as nparr=np.array([[1,2,3,4],[2,3,4,5]],dtype=np.float64)...原创 2019-06-13 20:57:50 · 5549 阅读 · 0 评论 -
通过索引访问数组
1.一维数组的索引创建一个数组,不写开始的话,默认从0开始(1)取一个 下标(2)取多个 切片(左闭右开)import numpy as nparr=np.array(10)print('arr:',arr)#取5print(arr[5])print(arr[-5])#取5,6,7print(arr[5:8])#步长为负数print(arr[-5:-2])...原创 2019-06-13 21:15:37 · 1624 阅读 · 0 评论 -
使用Numpy模块实现数组的形状改变
目录1.直接改变 通过 shape 直接指定形状 ---- 元组2.通过reshape 更改 --- 返回一个新的数组3.将高纬度数组展平(1)通过ravel()展平(2)通过flatten()展平创建一个数组import numpy as nparr=np.arange(16)print('arr:',arr)print('arr形状:',arr.shape...原创 2019-06-14 11:02:23 · 1054 阅读 · 0 评论 -
pandas模块读取文件
目录1.读取文本文件 txt csv2.读取excel(0文件3.保存文件1.读取文本文件 txt csv(1)read_csv()参数1:文件路径——名称参数2:分隔符参数3:编码格式import pandas as pdmeal_info=pd.read_csv('./meal_order_info.csv',sep=',',encoding...原创 2019-06-19 09:12:09 · 561 阅读 · 0 评论 -
pandas模块的统计指标--实现众数和众数的频数
1.numpy统计函数max() 最大值 min() 最小值 ptp() 极差 mean() 平均值 var() 方差 std() 标准差 mode() 众数 (返回一个dataframe格式的数据) count() 非空数目 median() 中位数 cov() 协方差 2.pa...原创 2019-06-19 10:00:33 · 9438 阅读 · 0 评论 -
使用pandas删除整列为空值的列
方法一:import pandas as pd# 循环删除空列import pandas as pddetail = pd.read_excel('./meal_order_detail.xlsx', sep=',', encoding='gbk')print(detail)print(detail.shape)for i in detail.columns: if d...原创 2019-06-19 10:38:09 · 11643 阅读 · 2 评论 -
组合数组
目录1.横向拼接 hstack()2.纵向拼接 vstack()3.concatenate()1.横向拼接 hstack()import numpy as nparr1=np.arange(6).reshape(2,3)arr2=np.array([[1,2,3],[2,3,4]])print('arr1:',arr1)print('arr2:',arr2)#...原创 2019-06-14 13:49:18 · 381 阅读 · 0 评论 -
pandas实现数据的分组与聚合
目录1.分组 groupby()2.聚合(1)agg()(2)apply()(3)transform()1.分组 groupby()import pandas as pdimport numpy as np#加载数据detail=pd.read_excel('./meal_order_detail.xlsx')print(detail)#分组#...原创 2019-06-19 15:13:37 · 812 阅读 · 0 评论 -
数组拆分
目录1.横向拆分 hsplit()2.纵向拆分 vsplit()3.split()1.横向拆分 hsplit()import nmupy as nparr=np.arange(16).reshape(4,4)print('arr:',arr)#横向拆分 平分arr_new=np.hsplit(arr,2)print('arr_new:',arr_new)...原创 2019-06-14 19:32:44 · 2596 阅读 · 0 评论 -
创建矩阵
目录1.mat()2.matrix()3.组合矩阵 bmat()(1)直接把矩阵组合成新的矩阵(2)将数组组合成矩阵1.mat()copy的值默认是False 所以我们推荐使用mat()创建矩阵可以用字符串的形式创建,也可以用列表的形式创建import numpy as np# 字符串m1=np.mat('1 2 3;2 3 4;3 4 5')...原创 2019-06-14 19:51:22 · 1370 阅读 · 0 评论 -
数组的ufunc()函数--通用函数
目录1.四则运算(1)加法 ---对应元素相加(2)减法 ---对应元素相减(3)乘法 ---对应元素相乘(4)除法 ---对应元素相除(5)幂运算2.比较运算3.逻辑运算1.四则运算加减乘除幂创建数组import numpy as nparr1=np.arange(4).reshape(2,2)print('arr1:',ar...原创 2019-06-14 20:20:44 · 819 阅读 · 0 评论 -
直方图
目录一、直方图介绍二、直方图绘制1.创建画布2.进行绘制3.展示图形一、直方图介绍条状结构横坐标:数据的分组情况纵坐标:各个组的数量用于大量数据只需要大量数据,进行分组,自动计算落在各个区间的数目身高统计:<150 150-160 160-170 170-180 >180二、直方图绘制统计薪水人数最多的一个范围统计薪水落在各个区间的数...原创 2019-06-18 11:05:26 · 1349 阅读 · 1 评论