- 博客(26)
- 收藏
- 关注
原创 数据分析方法02多维度拆解法
数据显示只有超一线城市有打开APP,因为公司推广时只推送了北上广深,因此用户打开几率大,所以启动事件多。背景:某公司做了一款穿搭产品的APP,前段时间在微博上进行了一波大V推广,老板想看看推广情况…数据分析团队综合分析之后,决定对推广之后的APP启动事件进行4个维度的拆解。数据显示用户主要是因PUSH下发的穿搭推送产生兴趣,而进入APP。但实际上是老用户占比下降、新用户占比上升,掩盖了用户流失。而我们的运营力量不足,只在北上广深等超一线城市进行了推送。但是因为用户打开APP的绝大部分原因,都来自推送。
2023-03-24 15:15:51
564
原创 列表和元组基本方法
序列:序列是一种数据结构。列表、字符串和元组都属于序列,其中列表是可变的,而元组和字符串是不可变的。要访问序列的一部分,可使用切片操作。要修改列表,可给其元素赋值,也可使用赋值语句给切片赋值。列表方法append:将一个对象附加到列表末尾。(python 没有 push 操作,用append 代替 push)clear:就地清空列表内容。copy:复制列表。count:计算制定元素在列表...
2023-02-20 20:44:15
195
原创 决策树(学习笔记)
算法学习算法理解决策树的本质就是从数据集中归纳出一组分类规则,也称‘树归纳’,对于给定数据集,存在许多对他无错编码的树,我们感兴趣的是从中选出最小的树(树的结点数和决策结点的复杂性度量)。(一个if-then规则的集合)从另一个角度看,决策树学习是根据训练数据集估计条件概率模型。基于特征空间划分的类的条件概率模型有无数个,我们选择的数据应该是不仅能对训练数据有很好的拟合,而且对未知数据也有...
2019-11-29 11:07:07
911
原创 KNN(学习笔记)
import numpy as npimport pandas as pdimport matplotlib.pyplot as pltplt.rcParams['font.sans-serif'] = 'SimHei' ## 设置中文显示# plt.rcParams['font.family']='Arial Unicode MS' # mac中文显示plt.rcParams['ax...
2019-11-22 20:38:25
243
原创 特征工程之数据预处理(笔记)
特征工程:对原始数据进行一系列工程处理,将其提炼为特征,作为输入供算法和模型使用。特征工程的目的:去除原数据中的杂项和冗余,设计更高效的特征以刻画要求解的问题和预测模型之间的关系。特征工程的重要性:**1.特征越好,灵活性越强。**好的特征的灵活性在于它允许你选择不复杂的模型,同时运行速度也更快,也更容易和维护。**2.特征越好,构建的模型越简单。**好的特征可以在参数不是最优的情况,依然...
2019-10-09 19:20:30
4250
原创 集成算法学习笔记
https://nbviewer.jupyter.org/github/CDA-zhanghuarui/-/blob/master/%E9%9B%86%E6%88%90%E7%AE%97%E6%B3%95%E5%AD%A6%E4%B9%A0%E7%AC%94%E8%AE%B0.ipynb
2019-10-08 16:25:57
188
原创 聚类算法学习笔记
https://nbviewer.jupyter.org/github/CDA-zhanghuarui/-/blob/master/cluster%E7%AE%97%E6%B3%95%E5%AD%A6%E4%B9%A0%E7%AC%94%E8%AE%B0.ipynb
2019-10-08 11:51:36
221
1
原创 二分类模型评估
分类算法最常见的指标是分类准确率(accuracy),而当样本中的分类极度不均衡时,accuracy不能说明问题(例如在100个观测样本中,有95个0,5个1,全部预测为0,accuracy是95%,已经很高了)。一般我们用混淆矩阵(Confusion matrix)来描述二分类的好坏,也通过此矩阵衍生出一系列指标。举例:ROC曲线ROC意指Receiver Operating Ch...
2019-10-03 15:09:20
1601
1
原创 python基础练习题
https://nbviewer.jupyter.org/github/CDA-zhanghuarui/-/blob/master/python%E5%9F%BA%E7%A1%80%E7%BB%83%E4%B9%A0%E9%A2%98.ipynb
2019-10-02 14:27:51
312
原创 项目:评分卡制作
https://nbviewer.jupyter.org/github/CDA-zhanghuarui/Machine-Learning-Algorithms/blob/master/%E9%A1%B9%E7%9B%AE%EF%BC%9A%E8%AF%84%E5%88%86%E5%8D%A1%E5%88%B6%E4%BD%9C.ipynb
2019-09-26 16:40:56
461
原创 SVM案例:预测明天是否会下雨
https://nbviewer.jupyter.org/github/CDA-zhanghuarui/-/blob/master/SVM%E6%A1%88%E4%BE%8B%EF%BC%9A%E9%A2%84%E6%B5%8B%E6%98%8E%E5%A4%A9%E6%98%AF%E5%90%A6%E4%BC%9A%E4%B8%8B%E9%9B%A8.ipynb
2019-09-26 15:46:46
1278
原创 案例:泰坦尼克
https://nbviewer.jupyter.org/github/CDA-zhanghuarui/-/blob/master/%E6%A1%88%E4%BE%8B%EF%BC%9A%E6%B3%B0%E5%9D%A6%E5%B0%BC%E5%85%8B.ipynb
2019-09-26 14:43:55
175
原创 电商案例:基于聚类的个性化推荐
https://nbviewer.jupyter.org/github/CDA-zhanghuarui/-/blob/master/%E7%94%B5%E5%95%86%E6%A1%88%E4%BE%8B%EF%BC%9A%E5%9F%BA%E4%BA%8E%E8%81%9A%E7%B1%BB%E7%9A%84%E4%B8%AA%E6%80%A7%E5%8C%96%E6%8E%A8%E8%8D%9...
2019-09-24 17:33:28
1640
1
原创 案例:基于决策树的保险业数据分析
https://github.com/CDA-zhanghuarui/-/blob/master/%E6%A1%88%E4%BE%8B%EF%BC%9A%E5%9F%BA%E4%BA%8E%E5%86%B3%E7%AD%96%E6%A0%91%E7%9A%84%E4%BF%9D%E9%99%A9%E4%B8%9A%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90.ipynb...
2019-09-20 17:53:25
2765
3
原创 SPSS学习笔记:逻辑回归
因变量:分类变量##获取一个数的绝对值floor(数值表达式)##获得小于一个数的最大整数值ceiling(数值表达式)##获得大于一个数的最小整数值round(数值表达式)##获得一个数的四舍五入的数值执行结果:sqrt(数值表达式)##函数返回一个数的平方根字符串函数ascii(字符表达式)##返回字符表达式中最左侧字符的ascii码值执行结果:char...
2019-08-10 16:02:57
110
翻译 用match和index查找数值
Index:返回给定区域中特定行列的交叉值=INDEX(给定查找区域,区域中的先对行,区域中的相对行,区域中的相对列)Match:返回特定值在数组中的相对位置=MATCH(想匹配的值,含有想匹配值的区域或数组,0or1)...
2019-07-15 21:57:30
213
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人