- 博客(6)
- 收藏
- 关注
原创 mysql语句执行顺序
sql执行顺序:(1)from(2)join(3)on(4)where(5)group by (开始使用select中的别名,后面的语句都可以使用)(6)avg,sum……(7)having(8)select(9)distinct(10)order by(11)limit另外,窗口函数只允许在select语句与order by语句中使,并且是在where、group by、having执行得到结果之后,在select distinct、order by、lim
2020-08-02 22:52:01
256
原创 python数据预处理之异常值、缺失值处理方法
数据预处理是明确分析目标与思路之后进行数据分析的第一步,也是整个项目中最基础、花费时间较长的工作。除了互联网埋点的数据或企业内部的业务数据之外,往往我们拿到的,比如说网上采集的数据并不是那样规整,这类数据经常出现错误值、缺失值和异常值。一、异常值 异常值是指样本中的个别值,其数值明显偏离其余的观测值。异常值也称离群点,异常值的分析也称为离群点的分析。 ...
2020-05-03 20:23:27
24605
3
原创 数据分析笔试经典sql题解
前言:sql是数据分析师笔试必考的考点之一,常考的题型有行列转换、联表查询,这些都比较简单,一般考的最难的就是hivesql窗口函数联表查询,普通的聚合函数每组(Group by)只返回一个值,而窗口函数则可为窗口中的每行都返回一个值。下面分享几道数据分析笔试中常考的经典sql题。(本文默认大家了解窗口函数语法)1、行列转换(京东数据分析笔试题)表salesyear m1 ...
2020-03-05 19:57:34
4444
8
原创 解决Anaconda环境中中文显示问题(windows)
在Anaconda中使用matplotlib设置中文时会出现很多小方框,不想每次都写代码设置中文字体,查了很多资料找到了解决方法:修改matplotlib的配置文件matplotlibrc。1.下载.ttf格式的中文字体simhei.ttf2.将下载的中文字体保存到matplotlib的字体库,并右键安装,我的路径如下:D:\Anaconda\Lib\site-packages\...
2019-07-18 14:36:06
13701
8
原创 pd.pivot_table数据透视表与pd.crosstab交叉表
在数据分析中,常常需要用到数据透视表和交叉表,下面介绍pandas.DataFrame.pivot_table数据透视表和pandas.DataFrame.crosstab交叉表的用法和区别。一、数据透视表数据透视表用来做数据透视,可以通过一个或多个键分组聚合DataFrame中的数据,通过aggfunc参数决定聚合类型,是groupby的高级功能。pd.pivot_table参数如下...
2019-03-05 21:12:50
4355
3
原创 Python入门与词频分析初步
一.python与其他语言的区别1.python作为一门解释性语言,与java、C等语言相比,Python不用编译,可以直接运行
2018-06-16 18:39:31
8577
3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人