单选 + 多选 + 2道解答题
选择题涉及机器学习、概率论与数理统计、业务等
部分题目:
选择题:
1.若投掷硬币,正面概率= 3 4 \frac{3}{4} 43,反面概率= 1 4 \frac{1}{4} 41,求连续投掷2次正面所需次数的期望。
详解见 知乎链接
E ( N k ) = 1 p + 1 p 2 + 1 p 3 + . . . + 1 p k E(N_{k})=\frac{1}{p}+\frac{1}{p^2}+\frac{1}{p^3}+...+\frac{1}{p^k} E(Nk)=p1+p21+p31+...+pk1,其中k为连续投掷正面次数。
计算得期望: 28 9 \frac{28}{9} 928
2.500张多米诺骨牌,每轮取出奇数位牌,求最后剩下的牌是原第几张牌?
第一轮:2,4,6,8,10,…,500
第二轮:4,8,12,16,…,500
第三轮:8,16,24,…,496
最终第 2 8 = 256 < 500 2^8=256<500 28=256<500留下。
3.MAU与DAU的换算
DAU = MAU * 当月活跃天数/当月自然天数
MAU = 上月留存 + 本月新增 + 本月回流
月留存 = 上月MAU * 月留存率
2 道解答题:
1.计算每个页面首次被各个用户访问的平均次序。举例说明:小王依次访问了A,C,A,A,C,B页面,则首次访问排序为:A,C,B;各页面的首次访问次序为:A=1,B=3,C=2.表结构:data_date(string) user_id(int) page_name(string) ts(datetime) 输出page_name(string) avg_rank(float)
select page_name,avg(rank1) avg_rank from(
select user_id,page_name,ts,row_number() over(partition by user_id order by ts) rank1 from(
select user_id,page_name,ts,row_number() over(partition by user_id,page_name order by ts)rn from events) A where rn = 1) B
group by page_name;
2.产品经理发现日活跃用户较上一周均值下降5%,怎么分析?
从内、外部来看:
内:分为时空两个维度分析
时间段
用户、渠道、活动、产品四方面
外:竞对、社会舆论