
python-梳理(极简版)
以numpy和pandas为主,数据处理中常用的语句整理
孔胖
不积跬步,无以至千里
展开
-
Python15-pandas整理07
横向拼接 纵向拼接横向拼接 merge pd.merge(df1, df2) pd.merge(df1,df2,left_on="编号",right_on="学号") ——当左右的连接键列名不同时 pd.merge(df1,df2,left_index=True,right_index="学号"...原创 2020-02-15 10:12:52 · 156 阅读 · 0 评论 -
Python14-pandas整理06
数据分组/数据透视表数据分组就是根据一个或多个键(可以是函数、数组或df列名)将数据分成若干组,然后对分组后的数据分别进行汇总计算。数据透视表与数据分组类似但又不同,数据分组是在一维(行)方向上不断拆分,而数据透视表是在行、列方向上同时拆分。左边是数据分组;右边是数据透视表数据分组 groupby() 分组键为列名 单列:df.groupby('客户...原创 2020-02-15 10:12:39 · 259 阅读 · 0 评论 -
Python13-pandas整理05
算法运算 加减乘除对应位置运算 比较运算 >/</!= 汇总运算 count非空值计数 df.count() 默认按每列进行计数 df.count(axis=1)指定按行进行计数 df['C1'].count() 对某一列进行计数 sum求和 ...原创 2020-02-15 10:12:25 · 1196 阅读 · 0 评论 -
Python12-pandas整理04
数值替换 数值排序 数值排名 数值删除 数值计数 唯一值获取 数值查找 区间划分 行列操作数值替换replace replace(A,B)表示将A替换成B。 df['年龄'].replace(240,33) df.replace(np.NaN,0)——对全表的缺失值进行替换,相当于fillna...原创 2020-02-15 10:11:46 · 132 阅读 · 0 评论 -
Python11-pandas整理03
pandas数据预处理——脏数据空值处理 重复值处理 异常值 数据类型转换——结构问题索引设置*****************************************************************************************************************空值处理 *...原创 2020-02-14 18:39:21 · 118 阅读 · 0 评论 -
Python10-pandas整理02
导入外部数据统一格式:read_x() —— x表示待导入文件的格式 导入.xlsx文件 pd.read_excel(r"C:\users\test.xlsx") pd.read_excel("C:/users/test.xlsx") sheet_name="sheet1"/0——指定那个sheet ind...原创 2020-02-14 18:35:22 · 171 阅读 · 0 评论 -
Python09-pandas整理01
数据结构series:是一种类似于一位数组的对象,由一组数据及一组与之相关的数据标签(即索引)组成。dataframe:由一组数据与一对索引(行索引和列索引)组成的表格型数据结构。创建series列表的方式:传入一个列表,通过index指定索引 s2=pd.Series([1,2,3,4], index=[‘a’,‘b’,‘c’,‘d’])字典的方式:以键值对的方...原创 2020-02-14 18:27:20 · 120 阅读 · 0 评论 -
Python08-numpy数组整理
numpy是针对多维数组(ndarray)的一个科学计算包。数组是相同数据类型的元素按一定顺序排列的组合。numpy中所需的数据结构为数组——使用array( )函数创建生成array中传入对象(列表、元组等)。arr=np.array([2,4,6,8]) arr=np.array((1,4,6))固定范围的数组 np.arrang(start, stop, ...原创 2020-02-14 18:08:04 · 494 阅读 · 0 评论 -
Python07-文件/模块
文件读写操作f = open('E:\\record.txt')打开方式:'r'——只读,'w'——写入,'a'——以写入模式打开,如果文件存在,则在末尾追加写入'b'——以二进制模式打开,'t'——以文本模式打开 关闭文件 f.close( ) 读入文件 f.read(size=-1...原创 2020-02-14 17:58:40 · 144 阅读 · 0 评论 -
Python06-生成式/两个牛逼的内置函数
生成式:用来简化for循环,选出/生成符合特定条件的列表、集合与字典,通常包含条件逻辑(if-else语句)列表生成式:list1 = ["A","B","C"]list2 = ["a","b","c"][m+n for m in list1 for n in list2]my_data=[[1,2,3],[4,5,6],[7,8,9]]rows_to_keep = [row for...原创 2020-02-14 17:45:59 · 103 阅读 · 0 评论 -
Python05-内嵌函数和闭包
内嵌函数:Python支持函数的嵌套,在函数里面定义的函数,无法在外部被调用。闭包:如果在一个内部函数里,对外部作用域(但不是全局作用域)的变量进行引用,那么函数就被认为是闭包。(在Python里,所有东西都是变量,可以将函数直接返回。)#eg1:def FunX(x): def FunY(y): return x*y return FunYi = F...原创 2020-02-14 17:36:19 · 129 阅读 · 0 评论 -
Python04-函数(普通函数、匿名函数)
函数是在一个程序中可以被重复使用的一段程序。======================================普通函数函数名(必需)参数:形参(形式参数,定义的时候)、实参(实际参数,调用的时候)语句块(必需)return变量可以直接执行print,没有返回值。也可以利用return对语句块的运行结果进行返回。def learn_python(location):...原创 2020-02-14 17:15:32 · 409 阅读 · 0 评论 -
Python03-循环语句&条件语句
for循环while循环if语句else语句elif语句======================================循环语句for循环——用来遍历任何序列的项目subject=['math','chinese','art','music']for i in subject: print('我目前正在学习:{}'.format(i))while...原创 2020-02-14 17:02:28 · 152 阅读 · 0 评论 -
Python02-数据结构
数据结构列表元组字典集合============================================列表列表是用来存储一组有序数据元素的数据结构,元素之间用逗号分隔。整数,浮点数,字符串,对象都可以往里丢。创建列表——[]列表的复制——*列表的合并——+/extend eg:int_list.extend(str_list)插入新元素末尾插入:a...原创 2020-02-14 16:51:01 · 114 阅读 · 0 评论 -
Python01-基本概念
变量 字符串变量命名规则: 1.变量名通常由字母,数字,下划线组成; 2.数字不能作为变量名开头; 3.不能以python中的关键字命名; 4.变量名要有意义; 5.变量名要区分大小写。字符串:认知中引号内的一切东西,也把字符串叫做文本。分以下三部分: 1.表达(转义、长字符串) 2.内置函数 ...原创 2020-02-13 23:30:44 · 148 阅读 · 0 评论