- 博客(11)
- 收藏
- 关注
原创 AB test
**AB test 的介绍:**AB test又称为分组隔离实验,是可以对产品页面的不同设计进行科学实验的方法。例如一个产品页面,有两个不同颜色的按钮,可以通过AB测试两个不同颜色的按钮的点击次数是否存在显著的差异。**AB test 的原理:**假设检验。检验我们提出的假设是否正确,分为实验组和对照组。原假设:实验组和对照组没有显著差异备择假设:实验组和对照组存在显著差异AB test 的流程:选取指标——建立假设——选取实验单位——计算样本量——流量分割——实验周期计算——线上验证——数据验
2021-04-27 17:11:23
2167
原创 假设检验
假设检验中心极限定理如果总体均值为μ\muμ,方差为σ2\sigma^2σ2,我们进行随机抽样,样本容量为nnn,当nnn增大时,则样本均值X‾\overline{X}X ~ N(μ,σ2/n)N(\mu,\sigma^2/n)N(μ,σ2/n)我们会得到如下结论:1、进行多次抽样,则每次抽样会得到一个均值,这些均值会围绕在总体均值左右,呈正态分布。2、当样本容量nnn足够大时,样本均值...
2020-04-07 15:51:46
1657
原创 电商交易数据清洗和分析
电商交易数据清洗和分析数据源:csv文件,某电商的交易数据,先需要对这部分数据进行清洗和分析工具:python(matplotlib/numpy/pandas),jupyter实现数据清洗加载数据分析需要的库import numpy as npimport pandas as pd import matplotlib.pyplot as plt加载数据,加载数据之前先用文本编辑器查...
2020-03-27 15:00:10
1886
4
原创 Hive窗口函数
Hive窗口函数对2017和2018年公司的支付总额按月度累计进行分析,按年度进行汇总select a.year,a.month,a.pay_amount, sum(a.pay_amount) over(partition by a.year order by a.month)from (select substr(dt,1,4) as year, ...
2020-03-26 13:33:58
228
原创 Hive连接查询
Hive连接查询需求1:某年度对用户满意度进行调研分析,找出目标人群。参考实现:2019年购买又退款的客户select a.user_namefrom (select distinct user_name from user_trade where year(dt)=2019) as ajoin (select distinct user_name from user...
2020-03-26 13:25:49
518
原创 Hive基本查询
Hive基本查询需求1:某次经营活动中,商家发起了"异性拼团购",试着针对某个地区的用户进行推广,找出匹配用户。参考实现:选出城市在北京,性别为女的10个用户名select user_namefrom user_infowhere city='beijing' and sex='female'limit 10;注意:如果该表是一个分区表,则WHERE条件中必须对分区字段进行限制。需...
2020-03-26 13:20:29
307
原创 python判断真假身份证号
python判断真假身份证号'''python判断真假身份证号识别一串身份证是否是真实的身份证号码: 公民身份号码是特征组合码,共18位,由十七位数字本体码和一位数字校验码组成。 排列顺序从左至右依次为:六位数字地址码,八位数字出生日期码,三位数字顺序码和一位数字校验码。作为尾号的校验码,是由号码编制单位按统一的公式计算出来的。 身份证第18位(校验码)的计算方法:1、将前面的身份证号码...
2020-03-18 12:16:05
3012
1
原创 SQL50题
SQL50题#1.查询" 01 "课程比" 02 “课程成绩高的学生的信息及课程分数select student.*,sc_01.CId,sc_01.score,sc_02.CId,sc_02.scorefrom studentLEFT JOIN(select Sid,CId,score from sc where CId='01') as sc_01 on student.SId=sc...
2020-03-11 10:21:55
203
原创 python随机生成电话号码
python随机生成电话号码'''中国电信号段:133,153, 180,181,189,173, 177,149中国联通号段:130,131,132,155,156,185,186,145,176,185中国移动号段:134,135,136,137,138,139,150,151,152,158,159,182,183,184,147,17811位第一位 :1第二位:3,4,5,7...
2020-03-11 09:48:24
3234
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人