
【数据分析面试】
文章平均质量分 66
整理自己学习数据分析遇到的一些面试题
数据闲逛人
18级双非本科学生
展开
-
数据分析常见SQL面试题汇总
<1> SQL——计算次日留存率问题:计算用户是否是次留用户计算每日次日留存率原数据表:user_login_table表表字段:用户、登陆日期原创 2021-07-02 22:23:59 · 939 阅读 · 0 评论 -
数仓中的全量表,增量表,拉链表,流水表,快照表
数仓中的全量表,增量表,拉链表,流水表,快照表数仓中的全量表与增量表的区别:全量表:每天的所有的最新状态的数据。(1)全量表,有无变化,都要报(2)每次上报的数据都是所有的数据(变化的 + 没有变化的)增量表:新增数据,增量数据是上次导出之后的新数据。(1)记录每次增加的量,而不是总量;(2)流量是指在一定时间内的增量;(3)流量一般设计成增量表(日报-常用、月报);(4)流量和存量的区别:流量是增量;存量是总量;(5)增量表,只报变化量,无变化不用报参考:知乎...原创 2021-06-06 15:13:49 · 725 阅读 · 0 评论 -
因果推断 AB测试 -----> 数据分析实战
因果推断知乎链接----点我简单例子:对于ABtest的话,实际上是由变量的相关关系到因果关系的过渡。那如何进行因果分析?这里以定期接受体检就能长寿吗?为列子,判断这是相关还是因果?可以用5步方式来尝试判断第一步,将要素套入到“原因”与“结果”中,依据经验看是否合理;比如这里,因为我们去体检了,所以我们长寿了。第二步,查看此事是否纯属巧合?如果是,那就不能判为因果第三步,是否存在同时影响原因和结果的第三变量? 一个定期体检都人,比起不体检的人来说,本身更注重健康和养生。所以存在第三方变量原创 2021-05-25 12:18:58 · 6817 阅读 · 0 评论 -
全网最全数据分析师面试干货-业务逻辑篇
全网最全数据分析师面试干货-业务逻辑篇首发于胖熊酱的数据分析分享全网最全数据分析师面试干货-业务逻辑篇[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-1eYUrBG5-1621687444783)(…/全网最全数据分析师面试干货-业务逻辑篇.assets/v2-fd07bcdfa2892ee061ae4581644328e4_xs.jpg)]胖熊酱以下内容如有借鉴,均在文章末尾附上原文章链接。不用任何公开参考资料,估算今年新生儿出生数量?采用两层模型(人群画转载 2021-05-22 20:44:19 · 5952 阅读 · 0 评论 -
每日一题打卡
文章目录day1 链表中倒数第k个节点day1 链表中倒数第k个节点连接# Definition for singly-linked list.# class ListNode(object):# def __init__(self, x):# self.val = x# self.next = Noneclass Solution(object): def getKthFromEnd(self, head, k):原创 2021-05-09 10:36:36 · 135 阅读 · 0 评论 -
AI面试百题 # 技术求职路上遇到的问题
#接龙例 第六天题目问题 及 技术求职路上遇到的问题双非学历是否可以从事算法工作?工作中调参比较多还是改进算法比较多,如果主要是调参的工作薪资上限是多少?面试中遇到完全不会的问题时如何尝试回答?能否介绍一下randomForest,xgboost,lightgbm,catboost的对比和优缺点和适用场景?如何在面试中,体现自己的技术水平,获得考官认可?项目从什么角度介绍最好?算法原理及公式推导理解起来很吃力,感觉自己弄懂了,过段时间再看又不明白了n个随机变量的均值的方差;公式推导过程能不原创 2021-04-20 14:37:13 · 217 阅读 · 0 评论 -
AI面试百题算法 逻辑回归 随机森林 XGBoost 集成学习
AI面试百题Day02Day02在模型评估过程中,过拟合和欠拟合具体指什么现象?过拟合是指模型对于训练数据拟合呈过当的情况,反映到评估指标上,就是模型在训练集上的表现好,但是在测试集和新数据上的表现较差。欠拟合指的是模型在训练和预测时表现都不好。用模型在数据上的偏差和方差指标来表示就是。欠拟合时候,偏差和方差都比较大,而过拟合时,偏差较小但方差较大。对于树形结构为什么不需要归一化?决策树的学习过程本质上是选择合适的特征,分裂并构建树节点的过程;而分裂节点的标准是由树构建前后的信息增益,信息增益比以原创 2021-04-08 18:29:17 · 265 阅读 · 1 评论 -
常见的数据分析师的面试问题 完整文件放在GitHub链接上了!!!擅用crtl + F
文章目录前言1.常见的数据分析师的面试问题1.1 基础知识考查**1.1.1概率论与数理统计:**(1)用简洁的话语简述**随机变量**的含义。(2) 随机变量和随机试验间有什么关系(3) 划分连续型随机变量和离散型随机变量的依据。(4)变量独立和不相关的区别(5) 常见分布的分布函数/概率密度函数,以及分布的特性,如指数分布的无记忆性。:smile:(6) 协方差和相关系数的区别(7) 随机变量常用特征的解释(期望,方差等)。(8) 中位数是否等于期望。(9) 常见分布的期望和方差是什么?(10)如何给没原创 2021-03-24 21:59:49 · 9760 阅读 · 0 评论