
pandas数据分析
布丁咩咩
这个作者很懒,什么都没留下…
展开
-
连接
关系型连接1. 连接的基本概念把两张相关的表按照某一个或某一组键连接起来是一种常见操作,例如学生期末考试各个科目的成绩表按照 姓名 和 班级 连接成总的成绩表,又例如对企业员工的各类信息表按照 员工ID号 进行连接汇总。由此可以看出,在关系型连接中, 键 是十分重要的,往往用 on 参数表示。另一个重要的要素是连接的形式。在 pandas 中的关系型连接函数 merge 和 join 中提供了 how 参数来代表连接形式,分为左连接 left 、右连接 right 、内连接 inner原创 2020-12-29 17:57:32 · 175 阅读 · 0 评论 -
第五章 变形
# 一 长宽表变换(长表变宽表、宽表变长表)## 1 pivot / pivot_table(透视表)类似excel中的数据透视表和tableau的建表,pivot /pivot_table主要由三部分组成:行、列、值。(值得一提的是,与excel数据透视表和tableau操作完全一致,可以一同巩固)### 1.1 pivot原表:pivot:其中行索引为学生姓名,列索引为科目,值为成绩。注意:利用pivot进行变形操作需要满足唯一性的要求,即由于在新表中的行..原创 2020-12-27 22:43:49 · 227 阅读 · 0 评论 -
第四章 分组
import numpy as npimport pandas as pd分组模式及其对象1. 分组的一般模式df.groupby(分组依据)[数据来源].使用操作2. 分组依据的本质① 单个维度、多个维度的分组,直接在groupby中传入相应列名构成的列表即可。df.groupby(['School','Gender'])['Height'].mean()② 通过一定的复杂逻辑来分组#先写出分组条件condition = df.Weight > df.Weight.mea原创 2020-12-25 16:46:05 · 346 阅读 · 0 评论 -
第三章 索引
一、索引器1. 表的列索引1)从DataFrame中取出相应的列,返回值为Series① df[‘column_name’]⇓⇑\Downarrow \quad \Uparrow⇓⇑② df.column_name列名中不包含空格2)取出多个列,返回值为一个DataFramedf[[‘column1’,‘column2’]]2. 序列的行索引1)以字符串为索引的Series① 取出单个索引的字母,返回一个Seriess[‘index’]② 取出多个索引的对应元素s[[‘index原创 2020-12-22 21:35:54 · 1640 阅读 · 0 评论 -
第二章 pandas基础
import numpy as npimport pandas as pd一、文件的读取和写入1. 文件读取pandas读取csv,excel,txt时句子差不多,只要替换相应的csv,excel,txt为所需要读取的文件的格式即可df_csv = pd.read_csv('data/my_csv.csv')df_txt = pd.read_table('data/my_table.txt')df_excel = pd.read_excel('data/my_excel.xlsx')其中原创 2020-12-19 20:37:47 · 220 阅读 · 1 评论