- 博客(6)
- 收藏
- 关注
原创 使用loc进行数据过滤
df.loc[(df[“height”]>=180) & (df[“weight”]>=80),“xinlie”]=“high” df.loc[(df[“height”]<=180) & (df[“height”]>=170) &(df[“weight”]<=80) & (df[“weight”]>=70),“xinlie”]=“msize” df.loc[~(((df[“height”]>=180) & (df[“weig.
2020-11-30 10:48:00
507
原创 loc与iloc
当用行号索引的时候, 尽量用 iloc 来进行索引; 而用标签索引的时候用 loc 1.loc意义:通过行标签索引行数据 例: loc[n]表示索引的是第n行(index 是整数) loc[‘d’]表示索引的是第’d’行(index 是字符) 2. .iloc :通过行号获取行数据,不能是字符 loc 可以通过行号和行标签进行索引,比如 df.loc[‘a’] , df.loc[1], 而iloc只能通过行号索引 , df.iloc[0] 是对的, 而df.iloc[‘a’] 是错误的 ...
2020-11-30 10:32:46
623
1
原创 missing value
pandas使用numpy.nan来代表缺失值,缺失值不会计算,通常处理的方式为:删除含有缺失值的行,补充缺失值 1、检测缺失值,返回布尔值 df.isnull(df[“height”]) 2、删除缺失值 df.dropna() 官方函数说明: DataFrame.dropna(axis=0, how=‘any’, thresh=None, subset=None, inplace=False) 3、补充缺失值 DataFrame.fillna(value=None, method=None, axis=
2020-11-30 10:05:07
453
原创 dataframe数据选取、添加、删除
1、选择列数据 df[‘列名1’,‘列名2’] 2、增加列,增加列每次只能增加一列 df[“新列名”]=1 df[“新列名” ] 3、 条件筛选 df[“height”]>150 | df[“weight”]<50 索引筛选数据 df[df[“height”]>150 | df[“weight”]<50] 5、删除列 del df[“列名”] axis=0,针对列 axis=1,针对行 ...
2020-11-30 09:33:48
412
原创 filter与Lambda函数
filter与Lambda函数 filter函数 filter函数是作用在序列元素上,返回布尔值,根据布尔值true或false进行元素的保留或删除 2.lambda函数 可以直接当做一个变量保存使用,也可直接使用 f=lambda(s:s *2) x=[1,2,3,4] map(f,x) x=[1,2,3,4,5,6,7,8,9,10] list(filter(lambdas:s%2==0,x)) ...
2020-11-29 17:03:36
845
原创 【1】数据读取和dataframe
数据读取 不要尝试读取excel文件,读取.csv格式或txt格式文件;注意编码问题,使用encoding参数; import pandas as pd pd.read_csv(‘D:/project/python_instruct/test_data1.csv’) import pandas as pd data1 = pd.read_csv(‘rating.csv’) data2 = pd.read_csv(‘rating.csv’,header=None) data3 = pd.read_csv(.
2020-11-29 16:46:00
323
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅