自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(202)
  • 资源 (2)
  • 收藏
  • 关注

原创 18个常见的数据分析面试题-概率统计类

总结了一些常见的概率与统计类的数据分析面试题,不定期更新……随机变量的含义一个随机事件的所有可能的值X,且每个可能值X都有确定的概率P,X就是P(X)的随机变量。比如掷骰子中出现的点数随机变量和随机试验间有什么关系随机试验:相同条件下对某随机现象进行的大量重复观测的试验,如掷硬币100次统计正面朝上的次数 随机变量是用来描述随机试验结果的。划分连续型随机变量和离散型随机变量的依据离散型随机变量:随机变量X能被一一列举出来,如一批产品中次品的数量,某地区人口的出生数等。

2020-11-17 06:07:32 3776 2

原创 泰坦尼克号数据分析案例实战

这是一个很经典的案例,很多博主都写过,对,就是它:泰坦尼克号生存率的分析,它是kaggle上的一道题,通过船上乘客的信息分析和建模,预测哪些乘客得以生还。我们就非常粗暴地拿这个数据集做一个简单的分析好了。使用工具:Excel(对,就是这么简单粗暴)一、明确目的1912年泰坦尼克号撞上冰山沉没,船上2224名乘客和机组人员中有1502人遇难,幸存下来的人是出于运气还是存在一定的规律?这是我们比较关心的,所以就要提出问题:那些人士生还的可能性大?其次了解数据,数据集总共有以下的字段

2020-05-23 11:56:21 8663

原创 用Excel做直方图(2):频率分布直方图

一、什么是直方图1、定义直方图是一种条形图,是以组距为底边、以频数为高度的一系列连接起来的直方型矩形图2、相关概念组数:在统计数据时,把数据按照不同的范围分成几个组,分成的组的个数称为组数。组距:每一组两个端点的差规格上限:Tu规格下限:Tl公差中心:M=3、步骤求出其最大值和最小值。 将数据分成若干组,并做好记号。 计算组距的宽度。用最大...

2019-03-23 17:02:54 103256 2

原创 用Excel做回归分析

Excel数据分析工具库是个很强大的工具,可以满足基本的统计分析,这里介绍用Excel数据分析工具库中的回归做回归分析。本文仅作为学习笔记之用,欢迎各位交流指正。本节知识点: Excel数据分析工具库—回归 线性回归和非线性回归 简单线性回归和多重线性回归 逻辑斯蒂回归 一、什么是回归分析(Regression)1、定义确定两种...

2019-02-27 22:17:37 88965 1

翻译 学习链上数据分析前的准备01

区块链 + 数据分析

2022-12-08 20:57:56 577

原创 浅析『链上数据分析』 : 区块链 + 数据分析

什么是链上数据分析?链上数据分析,顾名思义,就是对区块链上的数据进行分析。其实就是将数据分析运用到区块链行业上,和其他的如电商数据分析一样,没有什么特别大的区别,只需要我们有数据分析的思维,掌握数据分析的技能,会用数据分析的工具,同时理解区块链行业.下图是一个链上数据分析的案例。要做好链上数据分析,首先要了解什么是区块链,我试着用简单的语言来描述区块链。一提到区块链,我们首先想到的就是,可以说,比特币是区块链技术的一个应用。关于比特币,最好的学习方法,是直接看它的白皮书——《比特币:一种点对点电子货币系统》

2022-12-07 20:56:33 4297

原创 数据分析之历史上的百年奥运

2020东京奥运会已经结束了,才想起来写一篇关于奥运会的数据分析文章,真是前些天都太热衷于追奥运了。找了一下,网上果然有从1896第一届现代奥运会开始至2016年里约奥运会的全部数据,当然如果你感兴趣,还可以把2020年的给加上,于是,我们就可以用这些数据来重新回顾一下这100多年来的奥运会历史了!01 提出问题奥运会,全称:奥林匹克运动会,发源于2000多年前的古希腊,因举办地在奥林匹亚而得名,每4年一届,是世界上影响力最大的体育盛会。1896年,停办了1500年的奥运会终于得以重办,这也是首届

2021-08-11 22:05:08 2127

原创 相亲多少次就该做出决定了?答案是:37%

作者:可乐来源:可乐的数据分析之路转载请联系授权(微信ID:data_cola)你好,我是可乐很多人都有选择恐惧症,我也不例外,然而生活中的很多选择类的问题其实都可以依靠数学来解决,今天就来聊聊怎么治好你的选择恐惧。1.问题的提出1.1 麦穗问题传说古希腊哲学大师苏格拉底的3个弟子曾求教老师,怎样才能找到理想的伴侣。于是苏格拉底带领弟子们来到一片麦田,让他们每人在麦田中选摘一支最大的麦穗,不能走回头路,且只能摘一支。第一个弟子刚刚走了几步便迫不及待地摘了一支自认为是最大的麦穗,结果发现后面

2021-06-08 21:37:41 523

原创 原来图表还有这样的发展历史,这下总学会怎么用了吧

你好,我是可乐今天,当我们游刃有余地使用图表来进行数据可视化操作的过程中,不知道你有没有想过一个问题:这些图表都是怎么来的?一开始,人们并没有意识到可以用图形来描述枯燥的文字,通过图形来表示数量,还是一个相对较新的发展领域。前人栽树,后人乘凉,这篇文章就带你了解那些图形/图表的发展历史。1、折线图1786年,William Playfair绘制了英格兰在1700年到1780年的进出口数据的线图,被认为是历史上最早的线图,也就是折线图,横轴是时间刻度,年份,纵轴是数值。(插一个题外话,178

2021-05-24 22:48:10 581 1

原创 在私企有多少人能工作到退休?

你好,我是可乐在上一篇文章中 中国月入过万的人多不多 有小伙伴留言,希望统计下员工在私企做到退休的比例。今天就来聊聊这个问题因为私企在我国发展壮大的时间短,企业自身寿命短,人员流动性也大,所以要系统地回答这个问题,需要查阅许多背景数据。概念解读这个问题有2个关键字:私企和退休那我们一个一个来看私企私营企业,指由自然人投资设立或由自然人控股,以雇佣劳动为基础的营利性经济组织,通俗一点就是生产资料归私人所有。退休是指根据国家有关规定,劳动者因年老或因工、因病致残,完全丧失劳动能力(或部分丧失

2021-05-16 15:30:16 1573

原创 中国月入过万的人多不多

单从这个问题来看,这是个费米问题啊:估算中国月入过万的有多少人?要解决费米问题,其实也很好办,就是逻辑拆解,这篇文章也分为3个部分,先从公开数据中估算,然后聊聊身边的情况,最后说说自己。一、 估算估算月收入1万以上的有多少人,先说结论,估计7560万人。大致步骤如下:1.已知我国目前的总人口是14亿2.抽样,从华北、华东、华中、华南、东北、西北、西南,这几个地区中随机抽7个城市,看他们薪资10K以上的人数占比(2021年)3.总人数x平均占比 = 月收入1万以上的人数从这个网站中找到

2021-05-13 20:37:58 328

原创 第七次人口普查数据新鲜出炉,有哪些信息值得关注?

你好,我是可乐第七次人口普查数据昨天(5月11日)上午11点由国新办举行新闻发布会,正式公布。从3月拖到4月一直到现在,千呼万唤始出来,我们都等的好着急。我昨天也看了直播,对不是很清楚人口普查和这次发布会公布了哪些数据,以及这些数据背后的含义是什么的小伙伴,看这篇文章就差不多了解啦。什么是人口普查人口普查是依法对全国现有人口普遍地、逐户逐人地进行一次全项调查登记。时间线梳理人口普查工作每10年进行一次,通常是尾数逢0的年份为普查年度,从1949年至今,中国分别在1953年、1964年、1982

2021-05-12 21:17:53 2251 2

原创 上班族们都有哪些一直坚持的业余兴趣爱好?(2)

你好,我是可乐上一篇文章随便聊了聊我的2个爱好上班族们都有哪些一直坚持的业余兴趣爱好?今天接着唠如果说上一期的爱好是音乐的话,那么这一期的关键字则是:动脑03数独比较喜欢玩数独,在前期玩惯...

2021-05-05 13:00:00 769

原创 上班族们都有哪些一直坚持的业余兴趣爱好?

我是一个兴趣爱好比较广泛的人所以这个问题特别想回答一下打工之余,我有哪些一直坚持的兴趣爱好01古琴很多人觉得学一门乐器一定要趁早,越早越好,最好是3、4岁就开始启蒙,练就一身童子功。我就是...

2021-04-27 08:00:00 2267 2

原创 学会就能效率翻倍的数组公式,到底怎么用?

↑ 点击上方“可乐的数据分析之路”关注 + 星标~大概率每天早8点更新你好,我是可乐Excel的数组公式很好用,能解决很多普通公式解决不了的问题,因此这篇文章就来聊聊数组公式,...

2021-04-19 08:00:00 2276

原创 Excel里关于if的9个函数,如何指定条件求和、计数、平均等

总结了一下Excel里的求满足条件的计数、求和、平均值、最大值、最小值、标准差等9个方法。01countif作用:对满足条件的区域统计个数 模板:countif(条件所在的区域,条件)...

2021-04-12 08:00:00 13864 1

原创 将博客搬至优快云

优快云有提供将微信公众号的内容同步更新的功能,以前都是复制粘贴过去,具体还有哪些平台呢?还有简书、知乎、掘金等。同样地,还有视频搬家的功能,不过目前只支持B站,期待同步视频号吧。对了,可...

2021-04-08 08:00:00 116

原创 精读5:讲几个其他行业的业务知识

这是精读系列的第5篇文章哈喽大家好,我是可乐这是精读《数据分析思维:分析方法和业务知识》系列的最后一篇文章,想回顾之前4篇的可以点下方链接:精读4:一个和钱打交道的数据分析行业精读3:关于电商数据分析,你知道多少精读2:11种数据分析方法,别再说你不会了精读1:总说业务,到底业务常用的指标有哪些最后一篇文章主要讲运营商、内容、房产、汽车和销售行业如何进行数据分析。运营商行业运营商是提供网络服务的供应商,国内三大运营商如移动、联通和电信。一般把入网用户称为存量用户,运营商根据不同用户的.

2021-04-06 20:58:37 489

原创 13万字原创文档免费分享,可乐的数据分析学习宝典

哈喽大家好,我是可乐其实这段时间在整理自18年至今写过的数据分析文章,不整理不知道,一整理吓一跳,好家伙,13万字,都快成一本书了,于是就干脆整理成了pdf的形式,内容涵盖:Excel、S...

2021-04-06 08:00:00 199

原创 精读4:一个和钱打交道的数据分析行业

金融信贷行业主要讲金融信贷的线上模式,也就是网贷,如花呗、京东白条网贷在国内的发展大致分为4个阶段:缘起、野蛮生长、监管来临、后网贷时代。网贷的业务模式:获取客户提交审核过审签约放贷还款网贷业务是如何赚钱的呢?总结来说就是依靠风控技术准确地找到目标用户,将风险控制在低水平,在合规的利率下实现盈利。因此,风控可以说是网贷最核心的环节。风控策略是一些用来判断用户是否满足放款条件的规则,好的风控策略一定是数据分析和机器学习相结合产生的,风控伴随这整个业务流程。反欺诈是指识别交易诈骗、

2021-01-31 18:00:01 588

原创 精读3:关于电商数据分析,你知道多少

这是精读系列的第3篇文章用数据分析解决问题将前一章单独的分析方法结合起来运用。明确问题通过观察现象,把问题定义清楚,要明确数据来源和准确性,通常可以从时间、地点和数据来源上进行确认。其次对业务指标进行充分的理解,包括指标和含义,以及和谁对比的问题。比如某店铺上半年完成的利润,与年初制定的月平均盈利500万的目标还有很大差距,领导要求找到没有达标的原因。首先要确认数据的准确性,明确是哪个部门提供的,每个月的数据是什么,数据是否核对清楚无误?然后理解其中的指标,利润是如何定义的等,和上半年.

2021-01-21 23:22:08 908

原创 关于电商数据分析,你知道多少

↑ 点击上方“可乐的数据分析之路”关注 + 星标~大概率每天早8点25更新这是精读系列的第3篇文章哈喽,大家好,我是可乐,今天是精读《数据分析思维:分析方法和业...

2021-01-21 08:25:00 622

从0到1学习Power BI(准备篇)

Power BIWhat什么是Power BI?由微软发布的一款商业智能(BI)软件,或者说数据分析工具。那么什么是BI呢?可以理解为把业务知识和数据整合起来的工具。我们知道Excel中有几大非常好用的插件:Power Map(数据地图)、Power Query(数据查询) 、Power Pivot (数据建模)、Power View(数据可视化)。而Power BI则是集成了Power Query 、Power Pivot 和Power View的一个工具,让数据分析一体化。Why Power

2021-01-20 22:25:13 6322

原创 精读2:11个数据分析方法,别再说你不会了

5W2H定义:可以用来解决简单的问题,面对复杂的问题时就无从下手了逻辑树由费米提出,拆解问题,像树枝那样逐渐展开,把一个复杂的问题变成一个个简单的子问题。面试中常问,如深圳有多少个产品经理,芝加哥有多少钢琴调音师等行业分析方法PEST...

2021-01-20 22:23:45 995

原创 11种数据分析方法,别再说你不会了

这是精读《数据分析思维:分析方法和业务知识》的第2篇文章哈喽大家好,我是可乐,上周五的精读我们总结了常用的指标,以及如何选择指标,如何构建指标体系,如果你还没读,可以再看下:精读1:总说业...

2021-01-15 10:30:00 371

原创 精读——数据分析思维:分析方法和业务知识(1)

1.业务指标1.1 如何理解数据可从以下两个方面理解数据:每一列的含义数据分类从数据分类里,进一步地可以分为:用户数据:比如用户的姓名、年龄、职业等;行为数据:如浏览了哪些产品,停留时长等;产品数据:如产品名称、类别等。分类列名用户数据昵称、性别、年龄、地域 、访问设备、何时关注行为数据阅读数、分享数、收藏数、在看数、点击菜单数产品数据文章标题、日期、阅读量1.2 常用的指标有哪些用户数据指标对用户分类,可以分为新增用户、活跃用户和

2021-01-14 21:55:50 5172

原创 这款可视化工具也太好用了吧

↑ 点击上方“可乐的数据分析之路”关注 + 星标~大概率每天早8点25更新哈喽大家好,我是可乐今天我们一起从0开始学习Power BIPower BIWhat什么是Power ...

2021-01-11 08:25:00 156

原创 112篇数据分析原创内容合辑

↑ 点击上方“可乐的数据分析之路”关注 + 星标~大概率每天早8点25更新哈喽,大家好,我是可乐这是 可乐的数据分析之路 公众号112篇原创文章,内容涵盖Excel、SQL、P...

2021-01-08 16:00:00 194

原创 总说业务,到底业务常用的指标有哪些

↑ 点击上方“可乐的数据分析之路”关注 + 星标~大概率每天早8点25更新今天和大家一起精读一本最近很火热的数据分析新书——《数据分析思维:分析方法和业务知识》,作者猴子·数据...

2021-01-07 15:00:00 1074

原创 我的2020年终总结

2020年真是魔幻的一年,今天例行总结一下。2019年公众号定的小目标是粉丝数达到5000,截止2020年1月3日是6119,完成。计划2020年输出72篇文章,今年已经原创了87篇文章,达标。计划知乎关注破5000,截止1月3日是4770,啊居然没达标。19年计划读14本书,今年已完成。公众号2020年,微信公众号上一共发了169篇文章,其中原创87篇。犹记得19年一年只发了47篇文章,虽然和很多比还差的远,但也算超越了自己。从分类情况来看,SQL写的最多,主要是

2021-01-03 15:50:39 289 4

原创 2021的第一篇文章,开个好头先

↑ 点击上方“可乐的数据分析之路”关注 + 星标~大概率每天早8点25更新2020年真是魔幻的一年,在2021年的开头还是要例行总结一下,今天总结的有两个人,一个是可乐我自己,...

2021-01-03 12:09:36 160

原创 SQL今日一题(19):表复用

这是SQL今日一题的第19篇文章题目描述对所有员工的当前(to_date='9999-01-01')薪水按照salary进行按照1-N的排名,相同salary并列且按照emp_no升序排列用到的是salaries表salaries表题目给了输出展示表如下,注意第2条和第3条记录,薪资相同,排名都为2。方法1selects1.emp_no,s1.salary,count(distincts2.salary)asrankfromsalariess1,s...

2020-12-31 15:23:39 245

原创 SQL今日一题(21):3个子查询

这是SQL今日一题的第21篇文章题目描述获取员工其当前的薪水比其manager当前薪水还高的相关信息,当前表示to_date='9999-01-01',结果第一列给出员工的...

2020-12-30 08:25:00 110

原创 数据会说谎的真实例子有哪些

今天参加了知乎的线下活动——快闪课堂主题:数据会说谎吗?主讲人:程毅南(知乎心理学、互联网话题优秀回答者,73万关注)我们为什么需要数据因为要决策因为要科学、准确地决策,并解决实际问题什么是科学地搜集数据世界客观存在,但需要人去发现和认知数据是连接客观世界和主观认知的桥梁,但修桥是个技术活搜集数据有什么难处人的想法和感受很难丈量我爱你,你有多爱我为什么我爱你很难回答,因为爱的程度无法用工具测量用得分或数字表达,都极易失真,缺乏信度爱的状态本身就不稳定,但是测量时的状态

2020-12-29 14:21:32 1361

原创 有哪些值得推荐的可视化工具?

哈喽,大家好,我是可乐今天来聊聊有哪些值得推荐的数据可视化工具?Excel说到可视化工具,首先当然是Excel,你敢说你没用过Excel来作图?作为一款强大、好用、易上手的数据分析工具,它使用简单、易上手,几乎不用刻意去学习,只要有数据,就可以作图,主要用来做工作汇报的图多一些。我也写过Excel可视化专题,可参考:高手都是怎样用图表的:《用图表说话》如何制作高大上的图表这样用Excel动态交互图表,还要什么前端?包括基础图表:以及基础图表...

2020-12-26 12:26:11 444

原创 有哪些值得推荐的数据可视化工具?(文末送书)

↑ 点击上方“可乐的数据分析之路”关注 + 星标~大概率每天早8点25更新哈喽,大家好,我是可乐今天来聊聊有哪些值得推荐的数据可视化工具?哦对了,今天还是圣诞节,周五,老规矩,...

2020-12-25 08:25:00 237 1

原创 SQL今日一题(18):3表连接

这是SQL今日一题的第18篇文章题目描述统计各个部门的工资记录数,给出部门编码dept_no、部门名称dept_name以及部门在salaries表里面有多少条记录sum这题用到salaries表、dept_emp表和departments表salaries表dept_emp表departments表方法selectdp.dept_no,dp.dept_name,count(s.salary)assumfromdept_empde,depart...

2020-12-23 13:59:09 266

原创 教你做超惊艳的南丁格尔玫瑰图

其实早在今年初,疫情还很严重的时候,人民日报发布的这个图就吸引了广大数据分析者的注意。今天我们就把这个图的前因后果以及怎么做一次性讲清楚。玫瑰图的前世今生这个图学名:南丁格尔玫瑰图,是弗罗伦斯·南丁格尔女士发明的,又名为极区图、鸡冠花图。要说到南丁格尔女士,也是很传奇,她首先是一位护士,其次也是一名统计学家,更是英国皇家统计学会的第一位女性会员。19世纪50年代,英国、法国、土耳其和俄国进行了克里米亚战争。南丁格尔主动申请,自愿担任战地护士。当时的医院卫生条件极差,甚至连干净的水源与厕所都没有,

2020-12-21 22:26:29 8213 2

原创 SQL今日一题(17):涨幅

这是SQL今日一题的第17篇文章题目描述1查找员工编号emp_no为10001其自入职以来的薪水salary涨幅(总共涨了多少)growth(可能有多次涨薪,没有降薪)用到salaries表salaries表方法1selectMAX(salary)-MIN(salary)asgrowthfromsalarieswhereemp_no=100011、where子句给定限定条件,是10001号员工where emp_no = 100012、...

2020-12-19 13:58:10 831

原创 数据分析方法论3:综合指标分析法

之前提到的对比、平均、分组和交叉的分析思路,都是在单一指标下分析的方法。而综合指标评价法是建立在复杂数据情况下,将多个指标的转化为一个综合指标对某一特征进行总体评价,如人民的幸福程度、人才评价、用户活跃程度等,这种方法经常出现在行业报告中。极光数据在2019年8月19日发布的APP流量价值评估报告中,就用到了综合指标分析方法。首先构造了流量价值这个综合指标,然后从四个维度:用户规模、流量质量、用户特征和产品特性分别选取相应指标。权重是如何确定的、具体值是多少,我们就不得而知了,只能看到它的.

2020-12-17 16:54:19 6471

可乐的SQL速查文档.pdf

SQL基础知识点汇总

2021-05-15

可乐的数据分析学习宝典.pdf

内容包含Excel基础、可视化、SQL、Python、统计学、数据分析类书籍的读书笔记、笔试面试题等,数据分析学习手册

2021-04-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除