
pandas
文章平均质量分 64
Cpsu
个人笔记
展开
-
Excel中Vlookup函数近似匹配和精确匹配
Vlookup函数的最后一个参数是用于选择近似匹配和精确匹配。精确匹配时False也就是0,近似匹配时True,也就是1,可省略。他们最主要的区别就是近似匹配用的是二分查找法,而精确匹配是逐行比较。所以当我们用近似匹配时,**选取匹配的(即第二个参数的数据)数据一定要升序排列,如果不能升序排列,那么就使用精确匹配。 **二分查找二分法查找是把查找范围中的数据按照个数一分为二找到位于中间位置的一个数据,中间值,然后用我们的查找值和中间值做比较。当中间值等于查找值时,直接去获取结果;当中间值小于查找值时,则原创 2020-12-01 15:32:57 · 31322 阅读 · 4 评论 -
Pandas 中 SettingwithCopyWarning 的原理和解决方案
这篇文章讲解的很清楚:https://www.jianshu.com/p/72274ccb647a最重要的是学会识别链式索引,不惜一切代价避免使用链式索引。原创 2020-10-27 20:21:54 · 212 阅读 · 0 评论 -
pandas绘图常用API
DataFrame.plot([x, y, kind, ax, ….]) 折线图DataFrame.plot.area([x, y]) 区域情节DataFrame.plot.bar([x, y]) 垂直条形图。DataFrame.plot.barh([x, y]) 制作一个水平条形图。DataFrame.plot.box([by]) 制作DataFrame列的方框图。DataFrame.plot.density([bw_method, ind]) 使用高斯核生成核密度估计图。Dat原创 2020-07-27 21:10:19 · 214 阅读 · 0 评论 -
数据分析案例:利用pandas清洗数据
假如你有一份数据,有淘宝店铺的一些基本数据,比如店铺名称、发货地址、付款人数、评论数、商品价格、商品名称。由于爬取的数据较乱不能直接用于数据分析,所以要先进行数据清洗。数据如下大概如下:(关于如何爬取可以参考前面博文python爬取淘宝评论)加载数据import pandas as pdpro_data=pd.read_csv("taobaoproducts.csv",header=0)pro_data数据清洗:地址列爬取的地址列是省+城市名,当然还有北京这种直辖市,这里我们要把城市和省原创 2020-07-18 21:57:02 · 2494 阅读 · 2 评论 -
pandas如何在现有的Excel表格上新建工作表并添加DataFrame?
如果我们要创建一个新的Excel文件,并将DataFrame添加到Excel的工作表中很简单。import pandas as pddf1=pd.DataFrame(np.arange(7))df2=pd.DataFrame(np.arange(7))writer=pd.ExcelWriter("Excel.xlsx")df1.to_excel(writer,"first") #first是第一张工作表名称df2.to_excel(writer,"second") #second是第二张工作原创 2020-07-17 16:52:05 · 11012 阅读 · 6 评论 -
pandas中dropna()参数详解
DataFrame.dropna( axis=0, how=‘any’, thresh=None, subset=None, inplace=False)有五个参数,官方文档链接https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.dropna.html1.axis参数确定是否删除包含缺失值的行或列axis=0或axis='columns’删除含有缺失值的行,axis=1或axis='index’删除原创 2020-07-15 16:36:23 · 6738 阅读 · 2 评论 -
Python数据分析库pandas高级接口dt的使用
Series对象和DataFrame的列数据提供了cat、dt、str三种属性接口(accessors),分别对应分类数据、日期时间数据和字符串数据,通过这几个接口可以快速实现特定的功能,非常快捷。今天翻阅pandas官方文档总结了以下几个常用的api。...原创 2020-07-13 21:25:59 · 10751 阅读 · 3 评论 -
利用pandas处理二级office的Excel试题(一)
最近在学《利用pandas进行数据分析》,想到计算机二级office就有现成的实例,虽然比较基础,但是还是适合练练手。目录一、试题概览二、初始表格三、实例按要求计算均值条件格式插入季度分类汇总折线图一、试题概览这是二级office的其中一套试题,对于题目中的设置单元格列宽和对其方式等就不在pandas中展示,我们直接从第5题开始。二、初始表格这是素材文件的初始表格。三、实例按要求计算均值第五题要求求出每个月的总支出、各个类别的月均支出、每月平均总支出、最后按照总支出升序排序。table原创 2020-06-11 13:15:14 · 566 阅读 · 0 评论