python
文章平均质量分 81
ceerfuce
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
linux
#! /usr/bin/python3原创 2018-05-18 19:32:17 · 162 阅读 · 0 评论 -
3.10 数据透视表
3.10 数据透视表我们已经介绍过 GroupBy 抽象类是如何探索数据集内部的关联性的了。数据透视表(pivot table)是一种类似的操作方法,常见于 Excel 与类似的表格应用中。数据透视表将每一列数据作为输入,输出将数据不断细分成多个维度累计信息的二维数据表。人们有时容易弄混数据透视表与 GroupBy,但我觉得数据透视表更像是一种多维的 GroupBy 累计操作。也就是说,虽然你...原创 2018-08-24 11:58:08 · 942 阅读 · 1 评论 -
3.9 累计与分组
3.9 累计与分组在对较大的数据进行分析时,一项基本工作就是进行有效的数据积累,计算积累指标,如和、平均值、中值、最值等,其中每个指标都呈现了大数据集的特征。pd有累计功能。3.9.1 行星数据通过网上seaborn类提供的行星数据进行各种演示:import numpy as npimport pandas as pdclass display(object): "...原创 2018-08-20 19:33:47 · 534 阅读 · 0 评论 -
3.7 合并数据集:Concat与Append操作
3.7 合并数据集:Concat与Append操作经常需要将不同的数据源进行合并,pd中有函数提供方便。 import numpy as npimport pandas as pd简单起见,先定义一个能创建DF数据的函数: def make_df(cols, ind): """快速创建 DataFrame""" data = {c: [st...原创 2018-08-16 12:18:29 · 19875 阅读 · 0 评论 -
3.8 合并数据集:合并与连接
3.8 合并数据集:合并与连接pd的基本特性之一就是高性能的内存式数据连接join与合并merge操作。pd的主接口是merge函数。3.8.1 关系代数合并的理论基础是关系代数3.8.2 数据连接的类型merge实现三种数据连接类型:一对一,多对一,多对多。import pandas as pdimport numpy as npclass display(obj...原创 2018-08-18 18:33:34 · 530 阅读 · 0 评论 -
3.4 Pandas数值运算方法
3.4 Pandas数值运算方法通用函数:保留索引np的通用函数同样适用于pd import numpy as npimport pandas as pd mg = np.random.RandomState(42)ser = pd.Series(mg.randint(0, 10, 4))ser0 61 32 73 ...原创 2018-08-02 19:49:00 · 1061 阅读 · 0 评论 -
3.6 层级索引
3.6 层级索引当遇到多维数据,数据索引超过一两个键,可通过层级索引(也叫多级索引)配合多个有不同等级的一级索引一起使用。 import numpy as npimport pandas as pd3.6.1 多级索引Series如何用一维的Series对象表示二维数据笨办法用元组表示索引 index = [('California', 2000), ...原创 2018-08-11 19:12:52 · 2466 阅读 · 0 评论 -
3.3 数据取值与选择
3.3 数据取值与选择Series将Series看作字典 import pandas as pddata = pd.Series([0.25, 0.5, 0.75, 1], index=['a', 'b', 'c', 'd'])dataa 0.25b 0.50c 0.75d 1.00dtype: float64 # 键引...原创 2018-08-01 19:21:17 · 439 阅读 · 0 评论 -
2.9 - 3.2 pandas
2.9 结构化数据 import numpy as np# 使用符合数据结构的结构化数组data = np.zeros(4, dtype={'names': ('name', 'age', 'weight'), 'formats': ('U10', 'i4', 'f8')})data.dtypedtype([(...原创 2018-08-01 19:17:19 · 311 阅读 · 0 评论 -
3.5 处理缺失值
3.5 处理缺失值涉及的缺失值主要有三种形式: null NaN NA选择处理缺失值的方法用覆盖全局的掩码 用特定的标签值表示缺失值Pandas的缺失值采用标签值表示缺失值None:Python对象类型的缺失值是Python单体对象,在代码中表示缺失值,只能用于Object对象组成的数组中的对象,不能用作任何np或pd数组类型的缺失值。 import nump...原创 2018-08-04 20:14:03 · 2126 阅读 · 1 评论 -
2.8 排序
2.8 排序 import numpy as npx = np.array([2, 1, 4, 3, 5])np.sort(x) # x的排序结果array([1, 2, 3, 4, 5]) x.sort() # 排序后赋值给xxarray([1, 2, 3, 4, 5]) x = np.array([2, 1, 4, 3, 5])...原创 2018-07-26 19:39:18 · 317 阅读 · 0 评论 -
2.7 花哨的索引
2.7 花哨的索引 import numpy as nprand = np.random.RandomState(42)x = rand.randint(100, size=10)print(x)[51 92 14 71 60 20 82 86 74 74] [x[3], x[7], x[2]][71, 86, 14] ind = [3...原创 2018-07-26 19:36:34 · 619 阅读 · 0 评论 -
PyCharm设置Pyrcc5
基本按照 https://jingyan.baidu.com/article/5553fa8298b99c65a23934dd.html 的方法但是pyrcc5的地址在C:\Program Files\Python36-32\Scripts原创 2018-05-30 17:54:53 · 10212 阅读 · 0 评论 -
类Form
第一个坑,类Form。里面涉及到需要修改的,还是connet方法,原来的是这样:=========================================self.connect(dial, SIGNAL("valueChanged(int)"), spinbox.setValue)self.connect(spinbox, SIGNAL("valu...转载 2018-05-18 19:35:12 · 880 阅读 · 0 评论 -
3.11 向量化字符串操作
3.11 向量化字符串操作使用 Python 的一个优势就是字符串处理起来比较容易。在此基础上创建的 Pandas 同样提供了一系列向量化字符串操作(vectorized string operation),它们都是在处理(清洗)现实工作中的数据时不可或缺的功能。在这一节中,我们将介绍 Pandas 的字符串操作,学习如何用它们对一个从网络采集来的杂乱无章的数据集进行局部清理。3.11.1...原创 2018-09-03 19:28:02 · 1704 阅读 · 1 评论
分享