
数据分析
文章平均质量分 90
哥们你裤衩掉了
想成为一个DIY的野生架构师。
展开
-
《python数据分析组键篇》之numpy
前言 python中的list可以存放多种元素,造成了维护成本高,遍历速度慢,所以采用使用底层语言写的numpy,提高了速度。第一部分nadrryimport numpy as nplis = [[1,2],[1,3]]print type(lis)np_lis1 = np.array(lis)np_lis2 = np.array(lis,dtype=np.float)print type原创 2017-11-06 00:56:39 · 499 阅读 · 0 评论 -
数据分析组键安装教程
前期已经安装numpy,特只记录之后的软件安装。 需要安装的是pip 和 setuptools(之后可以easy_install安装)Matplotlib的安装 首先下载原创 2017-11-13 22:23:12 · 311 阅读 · 0 评论 -
《python数据分析组键篇》之scipy
前言 scipy 包含的功能有最优化,线性代数,积分,插值,拟合常微分等等,是数据分析中完成数学计算最重要的库之一。第一部分 scipy积分 quad 一元积分模块 quad(func, a, b, args=()) func函数; a:float 积分下限 ; b:积分上限; args 可选,tuple,func的参数 输出是 tuple(值,误差),数值积分是有误差的,所以提供了一原创 2017-11-13 22:26:15 · 548 阅读 · 0 评论 -
《pandas入门》之基本数据结构
pandas有两种数据结构,其中主要得是Series和DateFrame,本文主要讲解和记录这两种数据的结构和操作。原创 2017-11-19 00:39:11 · 600 阅读 · 0 评论 -
《python数据分析读书笔记》--- 数据探索(一)
前言当收集到初步的样本数据集后,需要对数据从数据质量分析和数据特征分析两个方面进行探索分析,其中,数据质量分析要求我们先检测数据的是否存在缺失值和异常值;而数据特征分析要求我们在数据挖掘建模前,通过频率分布分析,对比分析,帕斯托分析,周期性分析,相关性分析等分析方法,对采集的样本数据的特征规律进行分析,以了解数据的规律和趋势,为数据挖掘等后续环节提供支持。数据质量分析一般不符合要求,不能直接进行分析原创 2017-12-06 18:34:07 · 546 阅读 · 0 评论 -
《pandas入门》之read_excel()和to_excel()函数解析
前言数据分析时候,需要将数据进行加载和存储,本文主要介绍和excel的交互。read_excel()加载函数为read_excel(),其具体参数如下。read_excel(io, sheetname=0, header=0, skiprows=None, skip_footer=0, index_col=None,names=None, parse_cols=None, ...原创 2017-12-13 21:15:43 · 159410 阅读 · 5 评论