
机器学习
Wang_Jiankun
这个作者很懒,什么都没留下…
展开
-
Python实现K-Means算法
Python实现K-Means算法原创 2018-07-16 10:53:51 · 720 阅读 · 1 评论 -
Kaggle 入门练习 -- Titanic
Kaggle 入门练习 – TitanicKaggle 大数据比赛的入门练习,泰坦尼克遇难者预测import pandas as pd# 导入数据集train = pd.read_csv('Titanic_dataset/train.csv')test = pd.read_csv('Titanic_dataset/test.csv')# 查看数据集的信息# print...原创 2018-09-25 13:14:48 · 498 阅读 · 0 评论 -
Scikit-Learn 常用函数
Scikit-Learn 常用函数1、数据集划分 函数原型:train_test_split(train_data, train_label, test_size=None, random_state=None, shuffle=True)train_data:数据集的数据,可以是列表或者numpy数组train_label:数据集的标签test_size:测试集的样本占...原创 2018-09-17 17:14:06 · 1305 阅读 · 0 评论 -
机器学习性能评估指标汇总
机器学习性能评估指标汇总Accuracy:准确率Precision:精确率 / 查准率Recall:召回率 / 查全率F1 score:F1 值PR:查准率、查全率曲线ROC:真正率、假正率曲线AUC:ROC曲线下方的面积(Area Under Curve)混淆矩阵(Confusion Matrix):P:positive N:negative 1、...原创 2018-08-10 11:14:01 · 1026 阅读 · 0 评论 -
Scikit-Learn 机器学习笔记 -- MNIST
Scikit-Learn 机器学习笔记 – MNISTimport numpy as npimport matplotlib.pyplot as pltfrom sklearn.linear_model import SGDClassifier# 加载MNIST数据集def load_dataset(): from sklearn.datasets import fet...原创 2018-07-21 16:22:23 · 1140 阅读 · 0 评论 -
Scikit-Learn 机器学习笔记 -- 模型训练
Scikit-Learn 机器学习笔记 – 模型训练import numpy as npfrom matplotlib import pyplot as plt# 创建线性回归数据集def create_dataset(): X = 2 * np.random.rand(100, 1) # 结果加上高斯噪声 y = 4 + 3*X + np.random....原创 2018-07-21 16:21:05 · 771 阅读 · 0 评论 -
Scikit-Learn 机器学习笔记 -- 决策树
Scikit-Learn 机器学习笔记 – 决策树import numpy as np# 加载鸢尾花数据集def load_dataset(): from sklearn import datasets iris = datasets.load_iris() # print(iris) # 使用第3和第4个特征 X = iris['data'...原创 2018-07-21 10:27:23 · 440 阅读 · 0 评论 -
Scikit-Learn 机器学习笔记 -- SVM
Scikit-Learn 机器学习笔记 – SVMimport numpy as np# 加载鸢尾花数据集def load_dataset(): from sklearn import datasets iris = datasets.load_iris() # print(iris) # 使用第3和第4个特征 X = iris['data'...原创 2018-07-21 10:26:48 · 473 阅读 · 0 评论 -
SVM算法
SVM算法:原创 2018-06-03 16:41:16 · 201 阅读 · 0 评论 -
K-Means算法
K-Means算法原创 2018-06-06 18:51:17 · 243 阅读 · 0 评论 -
Python实现kNN算法
k-NN(k-最近邻)算法1. 原理k-NN(k-NearestNeighbor)分类算法机器学习中最简单的分类方法之一。所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。 k-NN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最...原创 2018-06-18 15:39:41 · 552 阅读 · 0 评论 -
机器学习算法--无监督学习--聚类
机器学习算法–无监督学习–聚类一、原型聚类特点:需要预先指定簇的个数K1、K-Means原理:从数据集中选择K个样本作为初始的K个簇中心,计算每个样本与这K个簇中心的距离,把这个样本划分到与之距离最小的那个簇,直至每个样本都被遍历,计算每个簇的平均值作为新的簇的中心。不段迭代直至簇的中心不再被改变或达到迭代的终止条件。 2、LVQ(learning vector quan...原创 2018-07-15 11:35:16 · 858 阅读 · 0 评论 -
Scikit-Learn 机器学习笔记 -- 线性回归、逻辑回归、softmax回归
Scikit-Learn 机器学习笔记 – 线性回归、逻辑回归、softmax回归import numpy as npfrom matplotlib import pyplot as plt# 创建线性回归数据集def create_dataset(): X = 2 * np.random.rand(100, 1) # 结果加上高斯噪声 y = 4 + 3...原创 2018-07-19 14:24:43 · 5151 阅读 · 0 评论 -
Python实现 logistic 回归算法
Python实现 logistic 回归算法1、算法介绍模型描述: sigmoid函数: 原理: 优化目标:最小化 sigmoid(f(x)) 和真实标签的差别(有不同的 cost function)。运用算法(梯度上升等)更新参数w、b。2、Python代码实现及注释决策边界: 代码:import numpy as npfrom matplotli...原创 2018-07-16 15:58:36 · 1394 阅读 · 0 评论 -
Python实现朴素贝叶斯算法
Python实现朴素贝叶斯算法1、算法介绍朴素贝叶斯假设特征相互独立,于是有下面的公式: x表示特征向量,c表示类别。 原理: 通过数据集计算出公式中右边分子中的各个概率。预测时根据公式计算出该样本属于不同类别的概率,选择概率大的那个类别作为预测值。2、算法流程模型中各个概率的计算,看下面代码中的 trainNB() 函数。3、Python代码实现及注释i...原创 2018-07-16 15:22:04 · 1973 阅读 · 0 评论 -
Python实现决策树算法
Python实现决策树算法1、算法介绍原理:决策树算法是根据特征对数据进行不断的细分,从而得到该样本的类别。构建决策树时,依次选取信息增益最大的特征进行划分。信息熵: k表示类别,pk表示该类别的占比 信息增益: v表示该特征的特征值,Dv表示属于该特征值的数据子集 2、算法流程3、Python代码实现及注释import math# 创建数据集...原创 2018-07-16 14:39:46 · 1130 阅读 · 0 评论 -
机器学习基础算法
机器学习算法1、机器学习概述假设用P来评估计算机程序在某任务类T上的性能,若一个程序通过利用经验E在T中任务上获得了性能改善,则我们就说关于T和P,该程序对E进行了学习。示例(instance)/ 样本(sample): 一个对象。数据集(data set):一组对象的集合。属性(attribute)/ 特征(feature):对象在某方面的表现或性质的事项。属性值 / 特征值:对象...原创 2019-04-02 09:22:50 · 511 阅读 · 0 评论