
数据分析
Yvesx
科研,琢磨琢磨python数据分析、linux运维、地理信息系统等常用的方法和功能
展开
-
Dataframe多条件索引
多条件索引错误的写法:info[(info["lon"]==-1) and (info["lat"]==-1)].shape报错:ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().应该这么写:info[(info["lon"]==-1) & (info["lat"]==-1)].shape并且注意info["lon"]==原创 2021-04-01 15:57:40 · 1745 阅读 · 0 评论 -
Matplotlib.pyplot基本画图
画图的方方面面基本设置plt.rcParams 是设置绘图的基本属性import matplotlib.pyplot as pltimport numpy as npimport pandas as pdplt.rcParams['font.sans-serif'] = ['SimHei'] # 解决中文乱码plt.rcParams['axes.unicode_minus'] = False # 解决负号非正常显示plt.rcParams['font.size'] = 10plt.r原创 2021-03-26 16:43:48 · 361 阅读 · 2 评论 -
pandas拼接和添加
拼接和添加Pandas拼接操作(concat,merge,join和append)的区别添加一行df1.append(df2, ignore_index=False, verify_integrity=False, sort=None)df2 可以是dataframe,series,dict,listignore_index指定true,忽略索引。否则series可能报错。行拼接(添加行)pd.concat(objs, axis=0, join='outer', ignore_index=F原创 2021-03-26 16:35:02 · 196 阅读 · 0 评论 -
Pandas逐行逐列逐元素的操作
逐行、逐列、逐元素的操作Pandas数据处理三板斧——map、apply、applymap详解分别对应map apply applymap 三种方法map:选中列,对列中的每个元素进行映射,映射函数只能有一个参数apply:可以实现map的功能,也可以跨列操作。映射函数可以有多个参数,实现更复杂的功能applymap:对df中的元素逐个操作。用途不如apply广,但特定情况下比较香例子数据import randomimport pandas as pdimport numpy as np原创 2021-03-26 10:58:58 · 2645 阅读 · 2 评论 -
数据可视化 - part
柱状图原创 2021-01-01 16:56:07 · 244 阅读 · 0 评论 -
数据预处理
分类变量字符串转数值y = rawdata.iloc[:,-1]y = pd.Categorical(y).codes哑变量y = rawdata.iloc[:,-1]y = pd.get_dummies(y)原创 2021-01-01 16:37:29 · 229 阅读 · 0 评论