- 博客(9)
- 收藏
- 关注
原创 零基础数据挖掘——金融风控(五)实践树类模型
在重看我的项目的过程中发现自己对于相关知识点理解并不透彻,希望能理论联系实际,加深自己对基础知识的理解。项目来源于阿里天池学习赛——零基础入门金融风控-贷款违约预测,感兴趣的小伙伴可以自己去原文了解。
2022-05-19 20:35:09
754
原创 零基础数据挖掘——金融风控(四)实践逻辑回归
在重看我的项目的过程中发现自己对于相关知识点理解并不透彻,希望能理论联系实际,加深自己对基础知识的理解。项目来源于阿里天池学习赛——零基础入门金融风控-贷款违约预测,感兴趣的小伙伴可以自己去原文了解。
2022-05-17 20:33:43
1009
原创 零基础数据挖掘——金融风控(三)特征工程
特征工程是数据挖掘过程中至关重要的一块, 因为数据和特征决定了机器学习的上限,而算法和模型只是逼近这个上限而已,所以特征工程的好坏往往决定着最后的结果。特征工程在我看来分为数据清洗过程以及特征降维&交互&选择的过程。 前者通过重复值、异常值、缺失值的去除/填充,更好地表示出潜在问题的特征;后者或通过构造新特征使得数据的表达能力进一步放大,或根据相关性等进行特征的选择和降维以减少“维度灾难”。
2022-05-16 19:31:25
1466
原创 零基础数据挖掘——金融风控(二) 探索性数据分析(EDA)
1、前言在重看我的项目的过程中发现自己对于相关知识点理解并不透彻,希望能理论联系实际,加深自己对基础知识的理解。项目来源于阿里天池学习赛——零基础入门金融风控-贷款违约预测,感兴趣的小伙伴可以自己去原文了解。探索性数据分析(Exploratory Data Analysis, EDA)是通过了解数据集,了解变量间的相互关系以及变量与预测值之间的关系,从而帮助我们后期更好地进行特征工程和建立模型,是数据挖掘中十分重要的一步。2、数据总览2.1 导入数据和需要的packagesimport n
2022-05-14 19:42:24
1451
原创 零基础数据挖掘——金融风控(一)赛题理解
1、前言在重看我的项目的过程中发现自己对于相关知识点理解并不透彻,希望能理论联系实际,加深自己对基础知识的理解。项目来源于阿里天池学习赛——零基础入门金融风控-贷款违约预测,感兴趣的小伙伴可以自己去原文了解。正确了解赛题背后的思想以及赛题业务逻辑的清晰,也很有利于花费更少时间构建更为有效的特征模型。 今天我们就从赛题的理解出发, 首先了解一下这次赛题的概况和数据,从中分析赛题以及大致的处理方式, 其次我们了解一些模型评测的指标,最后对赛题的理解整理一些经验。2、赛题了解赛题以金融风控中的个人信贷
2022-05-14 11:05:14
466
原创 数据挖掘项目——Airbnb 新用户的民宿预定结果预测
摘要本文主要根据对Airbnb 新用户的民宿预定结果进行预测,完整的陈述了从数据探索到特征工程到构建模型的整个过程。项目地址:Airbnb New User Bookings | Kaggle其中:1. 数据探索部分主要基于pandas库,利用常见的:head(),value_counts(),describe(),isnull(),unique()等函数以及通过matplotlib作图对数据进行理解和探索;2. 特征工程部分主要是通过从日期中提取年月日,季节,weekday,对年龄进行分段,计.
2022-03-02 22:24:07
1552
原创 数据挖掘项目:金融风控-贷款违约预测
项目地址:team-learning-data-mining/FinancialRiskControl at master · datawhalechina/team-learning-data-mining · GitHub本文主要根据自某信贷平台的贷款记录进行预测,以金融风控中的个人信贷为背景,要求根据贷款申请人的数据信息预测其是否有违约的可能,以此判断是否通过此项贷款,是一个典型的多分类的问题。本文完整的陈述了从数据探索到特征工程到构建模型的全过程。
2022-03-02 21:29:20
6252
1
原创 如何用mysql对淘宝用户行为进行分析
一、项目背景和目的项目集中于对淘宝用户行为的分析,如购买时段的分析、热销商品的分析、用户行为转化漏斗分析以及通过RFM模型对用户进行分类等,希望从中探索用户购买的规律,并将这些规律与店铺营销策略相结合,以实现更精细和精准的运营,让业务获得更好的增长。项目数据来源于数据集-阿里云天池,通过此项目学习电商数据分析的指标与数据分析的基本方法。本数据集(UserBehavior.csv)包含了2017年11月25日至2017年12月3日之间,有行为的约一百万随机用户的所有行为(行为包括点击、购买、加购、
2021-10-19 23:47:24
569
原创 母婴产品电商销售情况的深入分析
一、分析背景:随着互联网新零售市场的不断壮大,以及年轻一代父母的互联网消费观念,促进了母婴产品线上购买的行为占比快速增加。作为母婴产品的电商商家为了提高产品销售量,提高老顾客的回购率的同时不断吸引更多的新顾客顾客,可以通过对过往的销售和用户数据进行分析,提出有效的建议,帮助产品进行精细化的运营。本次分析的数据来源于阿里巴巴天池数据,数据来源:数据集-阿里云天池本次分析数据集包含两个数据集(Tianchi_mum_baby和Tianchi_mum_baby_trade_history):理
2021-10-19 22:32:32
781
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人