
Pandas
文章平均质量分 82
Xyns
这个作者很懒,什么都没留下…
展开
-
Pandas入门(6)
层次化索引 层次化索引是pandas的一项重要功能,它使你能在一个轴上拥有多个(两个以上)索引级别。抽象点说,它使你以低维度形式处理高纬度数据。 层次化索引一般以带有MultiIndex索引的Series的格式化输出形式。索引之间的间隔 (空格)表示直接使用上面的标签。 层次化索引在数据重塑和基于分组的操作(如透视表生成)中扮演着重要的角色。对于一个DataFrame,每条轴都可...原创 2018-04-11 21:30:55 · 2125 阅读 · 0 评论 -
Pandas入门(5)
处理缺失数据 缺失数据在数据分析应用中比较常见。pandas对象上的所有描述统计都排除了缺失数据。 Pandas使用浮点值NAN(Not a Number)表示浮点和非浮点数组中的缺失数据。它只是一个便于检测的标记而已。Python内置的None值也会被当做NA处理。 由于Numpy的书籍类型中缺乏真正的NA数据类型或位模式,所以Pandas中的处理是简单而可靠的。处理...原创 2018-04-11 20:59:49 · 2121 阅读 · 0 评论 -
Pandas入门(4)
汇总和计算描述统计 学习Pandas就像是学习SQL,虽然他们并没有什么直接的关系,但无论先学习哪一种,都会对另一种产生有益的作用,Pandas对象拥有一组常用的数学和统计方法,正如sql语句中的分组与聚合函数。Pandas中的大部分都属于约简和汇总统计,用于从Series中提取单个值或者从DataFrame的行或列中提取一个Series。跟对应的NumPy数值方法相比,它们都是基于没有缺失...原创 2018-04-10 20:08:33 · 2226 阅读 · 0 评论 -
Pandas入门(3)
算式运算和数据对齐 pandas最重要的一个功能是,它可以对不同的对象进行算术运算。在将对象相加时,如果存在不同的索引对、则结果的索引就是该索引对的并集。 自动的数据对齐操作在不重叠的索引处引入了NA值。缺失值会在算术运算过程中传播。 对于DataFrame,对齐操作会同时发生在行和列上,两个DataFrame对象相加后就会返回一个新的DataFrame,其索引和列为原来那两个DataF...原创 2018-04-03 22:21:51 · 1972 阅读 · 0 评论 -
Pandas入门(2)
索引对象 pandas的索引对象负责管理轴标签和其他元数据。构建Series或DataFrame时,所用到的任何数组或其他序列的标签会被转换成一个Index。 Index对象是不可修改的(immutable),因此用户不能对其进行修改,不可修改性非常重要,因为这样才能使Index对象在多个数据结构之间安全共享 Index甚至可以被继承从而实现特别的周索引功能pandas库中内...原创 2018-04-03 21:22:31 · 2114 阅读 · 0 评论 -
Pandas入门(1)
Pandas的学习我会写成一个系列帮助新手入门,祝你好运Pandas是基于numpy构建的,让以Numpy为中心的应用变得更加简单。具备按轴自动或者显式数据对齐功能的数据结构。这可以防止许多由于数据未对齐以及来自不同数据源(索引方式不同)的数据而导致的常见错误集成时间序列功能既能处理时间序列数据也能处理非时间序列数据的数据结构数学运算和约简(比如某个轴求和)可以根据不同的元数据...原创 2018-04-03 20:18:59 · 1946 阅读 · 0 评论 -
numpy基础
numpy是一个开源的Python科学计算库,他是Python科学计算库的基础库,Pandas,Scikit-learn等都要用到Numpy库的一些功能。1. Numpy数组对象Numpy中的多维数组称为ndarray,是Numpy中最常见的数组对象。优势:numpy数组通常是由相同种类的元素组成,即数组中的数据项的类型一致。这样的好处是,由于知道数组元素的类型相同,所以能快速确定存储数据所需空间...原创 2018-04-02 22:12:49 · 1738 阅读 · 0 评论