- 博客(10)
- 收藏
- 关注
原创 Uplift Modeling:原理,应用及Python实现
0、背景营销,市场用户画像中,相关的业务无论是广告还是优惠券,我们都称为营销的干预手段,这些手段均有一定的成本(arppu降低/用户打扰/其他成本)。营销的目标就是:在成本有限的情况下最大化营销的总产出,这其中最关键的一点就是我们能否准确找到真正能被营销打动的用户,我们称之为营销敏感人群,在营销活动中,对用户进行干预成为treatment,例如发放优惠券就是一次treatment,对人群进行四象限划分,我们可以将用户分为以下四类:Persuadables: 不发券不购买,发券才会购买的人群,即优
2023-01-05 21:04:48
2973
原创 SQL窗口函数相关总结
1. 窗口函数基本语法窗口函数是对表中一组数据进行计算的函数,一组数据跟当前行相关基本语法:<window_function> OVER (PARTITION BY column1, column2 ... column_n)1.1 <window_function>聚合函数,(`COUNT()`, `SUM()`, `AVG()` 等)rank等排序函数,分析函数等。1. 排序函数 (Ranking Function) ;2. 聚合函数 (Aggreg.
2022-04-15 18:02:21
632
转载 各类距离度量定义及公式【转载】
转载自:https://blog.youkuaiyun.com/weixin_42715356/article/details/82845376总结各类距离度量方法。1、欧氏距离 最常见的两点之间或多点之间的距离表示法,又称之为欧几里得度量,它定义于欧几里得空间中,如点 x = (x1,…,xn) 和 y = (y1,…,yn) 之间的距离为:(1)二维平面上两点a(x1,y1)与b(...
2020-04-23 14:33:42
2813
原创 集成学习原理及实现(Regressor)
前段时间与手下同学一起研究并实现了某回归问题,除了多个Regressor模型(LR, GBDT, RFR),我们也尝试了应用模型融合学习去提升模型效果。在此总结一下模型融合的父类方法-集成学习原理及Python实现。1.集成学习模型融合是集成学习的一个类别。集成学习可分为两类,一种是把强分类器进行强强联合,使得融合后的模型效果更强,称为模型融合。另一种是将弱分类器通过学习算法...
2020-02-25 14:51:55
2399
转载 Python多线程与多进程【转载】
自留学习。转载自https://www.cnblogs.com/whatisfantasy/p/6440585.html1 概念梳理:1.1 线程1.1.1 什么是线程线程是操作系统能够进行运算调度的最小单位。它被包含在进程之中,是进程中的实际运作单位。一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发多个线程,每条线程并行执行不同的任务。一个线程是一个execu...
2019-07-30 16:04:48
151
原创 Python Folium地理信息可视化案例
0、背景在研究、挖掘GPS位置数据、轨迹数据的过程中,地理信息的可视化展示是非常关键的一步。folium是js上著名的地理信息可视化库leaflet.js为Python提供的接口,通过它,我们可以通过在Python端编写代码操纵数据,来调用leaflet的相关功能,基于内建的osm或自行获取的osm资源和地图原件进行地理信息内容的可视化,以及制作优美的可交互地图。[1]1、Folium...
2019-06-26 16:46:36
19767
6
转载 Wide and deep by Google模型学习
参考:http://baijiahao.baidu.com/s?id=1582203712490596565&wfr=spider&for=pchttps://blog.youkuaiyun.com/a819825294/article/details/71080472《Wide & Deep Learning for Recommender Systems》 学习图1.Wide&am...
2018-06-27 16:45:29
4066
转载 Adaboost原理、实例及调参
Adaboost原理http://www.cnblogs.com/pinard/p/6133937.htmlAdaboosts实例及调参http://www.cnblogs.com/pinard/p/6136914.html
2018-06-25 11:55:28
9286
原创 Superset的安装配置及基础使用手册
之前研究过一些可视化工具/开源框架,包括powerBI、Tableau和Superset等。Superset是Airbnb开源BI数据分析与可视化平台(曾用名Caravel、Panoramix),该工具主要特点是可自助分析、自定义仪表盘、分析结果可视化(导出)、用户/角色权限控制,还集成了一个SQL编辑器,可以进行SQL编辑查询等,原来是用于支持Druid的可视化分析,后面发展为支持很多种关系数据...
2018-06-15 16:15:24
34278
20
转载 特征选择及scikit-learn中的实现
转载自https://blog.youkuaiyun.com/a1368783069/article/details/52048349,学习L1正则化进行特征选择时查到的。特征选择(Feature Selection):choosing a subset of all the features(the ones more informative)。最终得到的特征选是原来特征的一个子集。特征选取是机器学习领域非...
2018-06-14 19:13:50
590
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人