
Python
I_AM_KK
只看代码不说话
展开
-
pandas数据清洗 缺失值与空值处理
数据清洗之前,我们必须先明白自己想要干什么,达成怎么样的效果,然后采取对应的方法来实现这个需求。以下是对数据一些清洗方法介绍:1. 查看空值DataFrame.isna()DataFrame.isna()判断该表的空值情况DataFrame.isna().sum()汇总该表空值情况的个数DataFrame.isna().sum().sort_values(ascending=False)按空值个数降序显示2. 丢弃空值DataFrame.dropna(axis=0, how=‘any’,原创 2020-06-21 20:11:01 · 1799 阅读 · 3 评论 -
pandas删除符合条件的多行
假设删除w1中date列中数值大于200的行,并保存删除后的表为w2先写w2=w1.drop()补上行w2=w1.drop(w1[].index)添上条件w2=w1.drop(w1[w1.date>200].index)成功。原创 2020-06-19 18:40:53 · 4458 阅读 · 0 评论 -
使用pandas提取列值为固定长度的行
data.loc[data['key'].str.len()==2]data是表key是列名str.len是取长度2是长度原创 2020-06-18 19:59:23 · 1676 阅读 · 0 评论 -
pandas数据分析常用方法总结(数据集可以自己更改)
1.导入库#导入库import numpy as npimport pandas as pd2.查看数据#读取文件data = pd.read_csv('titanic_data.csv')data PassengerId Survived Pclass Name Sex Age SibSp Parch Ticket Fare原创 2020-06-17 18:48:02 · 1702 阅读 · 0 评论 -
Python3中list列表最常用的函数和方法
函数len()返回列表中的元素数量。max() 返回列表中的最大元素。最大元素的判断依据是列表中的对象类型。数字列表中的最大元素是最大的数字。字符串列表中的最大元素是按照字母顺序排序时排在最后一位的元素。因为 max() 函数的定义依据是大于比较运算符。如果列表包含不同的无法比较类型的元素,则 max() 的结果是 undefined。min()返回列表中的最小元素。它是 max(...原创 2019-11-26 11:11:48 · 864 阅读 · 0 评论 -
Python之for循环和range()函数
for 循环的组成1.以关键字 for 开始,表示这是一个 for 循环。2.i表示正在被遍历的是可迭代的对象。(相当于定位的手指)3.in表示在哪里遍历。(告诉别人在什么地方)4.这个是迭代的对象。(迭代这个词,可以理解为一推东西,你用手指一个个数过去)5.以英文冒号 : 结束。6.缩进代码块执行操作。(数到一样东西后做什么操作)举例is = ['a','b','c','d','...原创 2019-11-28 14:49:07 · 739 阅读 · 1 评论 -
四行代码带你认清Python变量作用域
直接上代码count = 0def add(): count += 10 add()会报错!原因是:Python 不允许函数修改不在函数作用域内的变量。全程就只有一个外部变量count。我们修改一下代码count = 0def add(count): return count += 10 count = add(count)这种是可以的,分的...原创 2019-11-28 22:42:07 · 141 阅读 · 1 评论