
机器学习
文章平均质量分 62
Happybigman
如果好就拼命去努力,如果不好就随遇而安。
展开
-
xgboost原生接口和sklearn的区别
1、区别如图:2、(1)原生形式使用Xgboost(import xgboost as xgb)from sklearn import datasetsfrom sklearn.model_selection import train_test_splitimport xgboost as xgbimport numpy as npfrom sklearn.metrics import precision_score, recall_score# 加载数据iris .原创 2021-09-20 21:02:29 · 1510 阅读 · 0 评论 -
机器学习算法与Python实践之逻辑回归(Logistic Regression)(二)
#!/usr/bin/python# -*- coding:utf-8 -*-import numpy as npfrom numpy import *import matplotlib.pyplot as plt#处理数据函数def loadDataSet(): dataMat=[] labelMat=[] fr=open('C:\\Users\\root\...原创 2018-09-17 17:37:59 · 488 阅读 · 0 评论 -
机器学习算法与Python实践之逻辑回归(Logistic Regression)
机器学习算法与Python实践这个系列主要是参考《机器学习实战》这本书。在参考大神的代码自己测试一番。################################################## logRegression: Logistic Regression# Author : cai# Date : 2018-09-13# HomePage : http://bl...原创 2018-09-13 17:24:21 · 385 阅读 · 0 评论 -
Python2《机器学习实战》学习笔记(一):k-近邻算法
K最近邻(k-Nearest Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。K 近邻算法使用的模型实际上对应于对特征空间的划分。K 值的选择,距离度量和分类决策规则是该算法的三个基本要素: K 值的选择会对算法的...原创 2018-09-20 17:27:46 · 414 阅读 · 0 评论 -
《机器学习实战》学习笔记:朴素贝叶斯分类算法
贝叶斯决策理论选择高概率对应的类别是贝叶斯决策理论的核心思想,即选择具有最高概率的决策。朴素贝叶斯朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法 。最为广泛的两种分类模型是决策树模型(Decision Tree Model)和朴素贝叶斯模型(Naive Bayesian Model,NBM),本文主要讨论朴素贝叶斯模型。我们称之为“朴素”,是因为整个形式化过程只做最原...原创 2018-09-26 14:39:51 · 2683 阅读 · 10 评论 -
皮尔逊相关系数的,余弦相似性,欧式距离计算(python代码版)
皮尔逊相关系数的,余弦相似性,欧式距离是我们经常用到的计算相似性的函数,下面自己实现一下:一、介绍下三个公式(1)皮尔逊相关系数(2)欧式距离 ---------- 二维空间 -----------n维空间(3)余弦相似性 二、代码实现如下# 皮尔斯相关系数fr...原创 2018-10-24 15:29:21 · 6067 阅读 · 3 评论 -
Python2《机器学习实战》学习笔记(四):利用AdaBoost元算法提高分类性能
'''Created on Nov 02, 2018Adaboost is short for Adaptive Boosting@author: peter cai'''from numpy import *#数据集def loadSimpData(): datMat = matrix([[ 1. , 2.1], [ 2. , 1.1], ...原创 2018-11-02 18:11:47 · 341 阅读 · 0 评论 -
机器学习实战-利用PCA来简化数据(降维)
一 理论 降维是对数据高维度特征的一种预处理方法。降维是将高维度的数据保留下最重要的一些特征,去除噪声和不重要的特征,从而实现提升数据处理速度的目的。在实际的生产和应用中,降维在一定的信息损失范围内,可以为我们节省大量的时间和成本。降维也成为了应用非常广泛的数据预处理方法。 降维具有如下一些优点:(1)使得数据集更易使用(2)降低算法的计算开销(3)去除噪声(...原创 2018-11-19 10:49:43 · 1314 阅读 · 0 评论