- 博客(5)
- 收藏
- 关注
原创 关于利用Tushare构建自己的股票数据库
关于利用Tushare构建自己的股票数据库1.安装MongoDB数据库2.抓取股票行情数据3.抓取股票基本数据安装MongoDB数据库MongoDB作为一个非关系型数据库,储存我们的股票数据是非常合适的,因为很对时候我们的数据都是键值对的形式,同时格式并不完全一致。可以去MongoDB官网去下载下载网址,安装完成后可以下载一个可视化的操作软件叫MongoDBCompass,我们能够像navicat那样对数据进行操作。...
2020-11-27 00:50:33
1651
1
原创 招商银行fintech评分卡案例
这里写目录标题数据简介数据预处理变量筛选相关性分析三级目录数据简介此次分享的数据案例是我的同学参加的2020年招商银行fintech项目时碰到的案例,我就正好拿这个案例来进行了一下评分卡的建模练习,首先此次数据主要包括三个数据集,分别是行为数据、标签数据、交易数据。训练集和测试集都已经分好,最终的目的如下所示。数据预处理import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn a
2020-07-01 18:00:05
1519
3
原创 adaboost算法原理及实现
模型概述Adaboost模型属于boost模型中的一种,boost模型的思想是通过从弱学习算法出发,反复学习,得到一系列弱分类器(又称为基本分类器),然后组合这些弱分类器,得到相应的强分类器。大多数的boost方法都是改变训练数据的概率分布,然后针对不同的训练数据分布学习相应的弱分类器。Adaboost的模型的思想是在每一次训练过程中提高被前一轮弱分类器的错误分类的样本的权重,这样可以让分类器更好的纠正错误。在训练完所有的分类器后,Adaboost采用的是加权多数表决的方法来进行投票,加大分类误差率小的
2020-06-29 23:06:31
285
原创 感知机模型原理及实现
模型概述感知机是分类模型中最经典和简单的一种模型,根据《统计学习方法》中的定义:假设输入空间(特征空间)是 χ⊆Rn\chi\subseteq\R^{n}χ⊆Rn,输出空间是φ={+1,−1}\varphi={ \lbrace {+1, -1}} \rbraceφ={+1,−1}。输入x∈χx\in\chix∈χ表示实例的特征向量,对映输入空间(特征空间)的点;输出y∈φy\in\varphiy∈φ表示实例的类别。由输入空间到输出空间的如下函数:f(x)=sign(w⋅x+b)f(x) = sign(
2020-06-28 20:52:25
918
原创 kaggle 电商数据分析
kaggle电商零售数据分析案例项目背景数据清洗退货情况分析客户RFM分析项目背景这个数据集是kaggle上面的一个电商数据集,其中包含2010年12月12日至2011年12月9日之间在英国注册的非商店在线零售的所有交易。该公司主要销售各种独特的礼品之类,其中许多客户该公司是批发商。因此本次数据分析将对客户进行分析,并对客户进行相关分层处理。数据清洗import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimpor
2020-06-17 17:01:46
5913
4
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人