- 博客(8)
- 收藏
- 关注
原创 机器学习实战之 -- NaiveBayes
机器学习实战之 -- NaiveBayesNaiveBayes一、工作原理1.条件概率:2.朴素贝叶斯成立的条件概率假设:3.后验概率:3.朴素贝叶斯分类器:二、核心代码NaiveBayes一、工作原理1.条件概率:P(X=x∣Y=ck)=P(X(1)=x(1),...,X(n)=x(n)∣Y=ck), k=1,2,3,...,K P(X=x|Y=c_...
2019-03-29 15:47:05
334
原创 集成学习实战之 -- RandomForest
集成学习实战之 -- RandomForest一、引入1.Linear modela.用线性模型拟合非线性数据:1)拟合较平滑的曲线2)拟合不规则曲线2.引入决策树a.两个问题1)决策树是线性模型吗?2)决策树能解决上面的问题吗?b.决策树的特点c.拟合数据二、模型融合1.Bagging2.Random Foresta.手动构建a.用sklearn中的模型构建一、引入1.Linear mode...
2019-03-29 10:51:40
560
原创 集成学习实战之 -- AdaBoost
机器学习实战之 -- AdaBoostAdaBoost一、AdaBoost简介二、工作原理1.错误率:2.弱分类器权重值:3.权重更新:4.最终分类器a.弱分类器的线性组合b.最终分类器三、核心代码1.基于单层决策树构建弱分类器3.基于单层决策树的AdaBoost训练4.测试算法:基于 AdaBoost的分类四、示例AdaBoost一、AdaBoost简介AdaBoost采用的是boosti...
2019-03-29 01:53:05
258
原创 模型评估与模型选择
模型评估与模型选择一、损失函数和风险函数1.经验风险和结构风险2.经验风险最小化与结构风险最小化二、模型评估与模型选择1.最小二乘法2.过拟合代码实现3.模型选择a.正则化一、损失函数和风险函数损失函数:一次预测的好坏风险函数:平均意义下模型预测的好坏0-1损失函数 (0-1 loss function)L(Y,f(X))={1,Y≠f(X)0,Y=f(X)L(Y,f(X))=\be...
2019-03-10 05:55:27
560
原创 scikit-Learn demo
Scikit-Learn -- 实战一、大致流程1.Practice regressiona.LinearRegressionb.DecisionTree2.practice Classificationa.LogisticRegressionb.SVM二、Model selection1.Cross - Validation2.模型参数的选择三、underfit和overfit一、大致流程1...
2019-03-07 00:22:46
469
原创 python 应用之 -- 爬虫
python -- 爬虫 requests 获取页面内容,BeautifulSoop解析requests 获取页面内容,BeautifulSoop解析以爬取链家数据为例:import requestsfrom bs4 import BeautifulSoupurl = "https://bj.lianjia.com/zufang/"headers = {'User-Agent' :...
2019-02-21 23:58:58
230
原创 机器学习实战 -- 决策树
机器学习实战 -- 决策树决策树一、决策树算法简介二、工作原理经验熵(empirical entropy)经验条件熵(empirical conditional entropy):信息增益(information gain):三、核心代码1.创建数据集2.计算数据集的经验熵3.划分数据集a. 按照指定的特征划分数据集b. 选择最好的特征划分数据集4.递归构建决策树5.绘制树形图a. 使用文本注解绘...
2018-12-23 01:09:58
224
原创 机器学习实战之 -- kNN
机器学习实战之 -- kNNk-近邻算法一、工作原理二、代码实现1.创建样本数据集和标签2.利用kNN算法返回频率最高的元素标签三、示例1.准备数据:从文本中解析数据,输出训练样本矩阵和类标签向量。2.分析数据:使用Matplotlib绘制散点图3.归一化数值4.测试算法5.使用算法k-近邻算法Lp(xi,xj)=(∑l=1n∣xi(l)−xj(l)∣p)1/pL_p(x_i,x_j) = (...
2018-12-22 00:13:53
211
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人