自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 基于Xgboost的不均衡数据分类

1.项目分析与设计该项目通过美国人口普查数据训练一个模型来预测美国人口收入水平。数据集上包含199523个训练数据和99762个测试数据,各包含了41个属性。经分析,该数据包含了人口统计信息、年龄、贷款信息、国籍、种族等信息。属性数据中有包含空值和有偏分布等问题,处理思路如下: 1.读取数据,观察特征及其分布 2.分析缺失情况,处理缺失值 3.异常值处理 4.对分类变量进行哑编码 5.用随机森林进...

2018-03-04 21:07:45 17516 3

原创 A/B test分析某网站是否可以发布更改

A / B测试介绍 A / B 测试是一种流行的网页优化方法,可以用于增加转化率注册率等网页指标。简单来说,就是为同一个目标制定两个方案(比如两个页面),将产品的用户流量分割成A / B 两组,一组试验组,一组对照组,两组用户特点类似,并且同时运行。试验运行一段时间后分别统计两组用户的表现,再将数据结果进行对比,就可以科学的帮助决策。 度量选择 1.不变度量 一个。Coo

2018-01-28 17:37:01 412

原创 泰坦尼克生还因素分析及建模生还预测

问题背景: 泰坦尼克豪华游轮即将沉没,救生艇数量有限,无法人人都有,副船长‘女士小孩优先的指示下’,打破了随机获救的平衡。 分析过程: 1.流程设计:数据准备,数据清理,分析展示,建模评估 2.数据准备和观察 3.数据预处理:清理、变换、缺失值填补等 4.分析展示(一维分析、二维分析) 5.建模与评估 一:数据准备

2018-01-28 17:16:45 891

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除