
Pandas
walking_visitor
想起什么写什么
展开
-
pandas学习笔记3---索引
pandas的索引负责管理其轴标签和其他元数据内容,无论构建Series还是DataFrame时所用到的任何数据结果的列标签都会被转成一个index索引对象index对象是不可修改的,因此用户不能对其进行修改,由Index方法创建的index与DataFrame.index以及Series.index具有相同的属性frame1.diff(axis='index')Out[234]: ...原创 2018-07-20 09:35:27 · 446 阅读 · 0 评论 -
pandas +sqlalchemy读写oracle数据库
pandas的DataFrame是常用的数据分析数据格式,Oracle数据库是常用的结构化数据存储方式,通常做数据分析牵涉到大量的数据时,我们必须通过借助一定的工具进行,而不能单单依靠excel,因此通过pandas进行数据分析,以Oracle作为存储数据的媒介便成为了我们最方便或者灵活的选择,同时DataFrame的数据格式样式和oracle的结构化表非常的相似,将DataFrame格式的数据直...原创 2018-11-13 10:35:13 · 16725 阅读 · 4 评论 -
pandas 箱型图(boxplot)详解
首先看一段例子:import pandas as pdfrom pandas import DataFrame,Seriesdf = DataFrame(np.random.randn(10, 2), columns=['Col1', 'Col2'])boxplot=df.boxplot() 通过boxplot方法,我们直接得到了箱型图。boxplot方法官方介绍如下...原创 2018-10-17 15:35:24 · 57332 阅读 · 3 评论 -
Python数据分析常用手册》一、NumPy和Pandas篇
二、常用库1.NumPy NumPy是高性能科学计算和数据分析的基础包。部分功能如下: ndarray, 具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组。 用于对整组数据进行快速运算的标准数学函数(无需编写循环)。 用于读写磁盘数据的工具以及用于操作内存映射文件的工具。 线性代数、随机数生成以及傅里叶变换功能。 用于集成C、C++、Fortran等语言编写...转载 2018-10-18 14:47:49 · 296 阅读 · 0 评论 -
pandas学习笔记6--基本功能之处理缺失数据
数据中不可避免会出现数据的缺失,pandas提供了几种简单的方式进行缺失值的处理。处理方法:dropna方法:默认原始对象不会被修改,dropna后会生成新的对象对Series会丢弃掉NA值。而对于DataFrame则会默认丢弃掉含有NaN的行,如果要丢弃含NaN的列,则指定axis=1若传入how='all',则会丢弃全是NaN的行,指定axis=1时,则丢弃列fr...原创 2018-09-27 09:20:27 · 354 阅读 · 0 评论 -
pandas学习笔记5---基本功能之计算与统计
OK,继续学习pandas的基本功能之计算与统计,pandas库的数据结构几乎与excel或数据库的结构完全一样,非常接近我们日常所用的数据形式。同时也是数据分析/挖掘计算的常用基础库,其计算功能的重要性自然不言而喻。本次我们针对pandas的主要数据结构Series/DataFrame的计算统计功能和方式进行学习,主要包括算术的数据对齐、错误值填充、DataFrame和Series运算、统计...原创 2018-09-21 17:10:28 · 660 阅读 · 0 评论 -
pandas学习笔记4---基本功能之索引、选取、丢弃
前边学习了pandas的基本数据结构Series和DataFrame,以及重要的index。本次在前期学习的基础上继续学习其基本的功能,比如重新索引(reindex)或者说索引取值、向前/后填充、。。。。重新索引重新索引的方法是reindex,有点像np.reshape。不同点在于np.reshape可改变数据结构本身,而reindex则是新产生一个数据结构,原始数据结构并未改变。Se...原创 2018-09-21 09:07:29 · 1015 阅读 · 0 评论 -
pandas学习笔记2---DataFrame
本次从DataFrame的基本定义、创建、索引、取值/赋值几个方面进行基本的入门介绍定义DataFrame是个表格型的数据结构,既包括行索引,也包括列索引,类似于numpy的二维数组,它可以被看做是n个Series的集合。创建DataFrame的创建形式有许多,可以通过二维数组、等长列表字典、字典组成的字典、由Series组成的字典等多种方式创建等。DataFrame在创建时可通过...原创 2018-07-19 16:06:07 · 771 阅读 · 0 评论 -
pandas相关系数-DataFrame.corr()参数详解
DataFrame.corr(method='pearson',min_periods=1)参数说明:method:可选值为{‘pearson’, ‘kendall’, ‘spearman’} pearson:Pearson相关系数来衡量两个数据集合是否在一条线上面,即针对线性数据的相关系数计算,针对非线性 ...原创 2018-12-20 17:51:36 · 98060 阅读 · 4 评论