
模式识别与机器学习
szfhy
这个作者很懒,什么都没留下…
展开
-
scikit-learn xgboost 预测波士顿房价
xgboost需要单独安装pip install xgboost #安装xgboost库pip install --upgrade xgboost #更新xgboost库import xgboost as xgbfrom xgboost import XGBRegressor as XGBRfrom sklearn.ensemble import RandomForestRegr...翻译 2019-05-27 21:51:16 · 2688 阅读 · 0 评论 -
matplotlib画散点图
import matplotlib.pyplot as pltimport numpy as npheight = [161,170, 182, 175, 173, 165]weight = [50, 58, 80, 70, 69, 65]plt.scatter(height, weight)plt.show()#散点图 随机的,无相关性N = 1000x=np.rand...原创 2018-09-15 08:46:34 · 1801 阅读 · 0 评论 -
matplotlib 学习
画正弦余弦曲线%matplotlib inlinefrom matplotlib import pyplot as pltimport numpy as npX = np.linspace(-np.pi, np.pi, 200, endpoint=True)C, S = np.cos(X), np.sin(X)plt.figure(figsize=(20, 6), dpi=80...原创 2018-09-15 08:30:07 · 317 阅读 · 0 评论 -
scikit-learn 逻辑回归实现信用卡欺诈检测
读书笔记import numpy as npimport pandas as pdimport matplotlib.pyplot as pltdata = pd.read_csv('creditcard.csv')#data.head(10)print (data.shape)count_class = pd.value_counts(data['Class'],s...原创 2018-09-14 21:31:40 · 1596 阅读 · 2 评论 -
scikit-learn 支持向量机实现手写体识别
随时代码,阅读笔记%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as npfrom sklearn import datasetsdigits = datasets.load_digits() # 加载数据# 把数据所代表的图片显示出来images_and_labels = list(zip...原创 2018-09-14 10:47:05 · 1684 阅读 · 0 评论 -
scikit-learn kmeans实现文本聚类
kmeans 无监督的学习方法。需要根据实际业务需要确定K值。加载数据集%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as npfrom time import timefrom sklearn.datasets import load_filesprint("loading documents ....原创 2018-09-13 22:49:50 · 2138 阅读 · 0 评论 -
scikit-learn 结合PCA和SVM实现人脸识别
准备数据集%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as npimport timeimport loggingfrom sklearn.datasets import fetch_olivetti_faceslogging.basicConfig(level=logging.INFO, for...原创 2018-09-13 21:33:31 · 2818 阅读 · 0 评论 -
scikit-learn 线性回归拟合正弦函数,预测房价
随书代码,阅读笔记。 线性回归拟合正弦函数%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as npn_dots = 200X = np.linspace(-2 * np.pi, 2 * np.pi, n_dots)Y = np.sin(X) + 0.2 * np.random.rand(n_d...原创 2018-09-13 20:46:36 · 1358 阅读 · 0 评论 -
scikit-learn 决策树预测泰坦尼克号幸存者
决策树的使用手册http://sklearn.apachecn.org/cn/0.19.0/modules/tree.html决策树预测结果容易理解,易于解释,预测速度快。基于Entropy的分类:ID3, C4.5,C5.0,运算效率更高,使用内存更小,创建出来的决策树更小,准确性高,适合大数据集的决策树创建;基于gini不纯度:CART,分类回归树。sklear...原创 2018-09-13 17:06:19 · 2651 阅读 · 0 评论 -
机器学习-分类性能评价指标-混淆矩阵confusion_maxtrix
关于混淆矩阵,之前看别人的一些教程,感觉作者很牛,图形化显示出来也很酷,最近深挖了一下文档,顿时感觉我们很牛人就间隔一张纸。详细的实现:confusion_matrix顺便添加自己的调试的代码,记个笔记。import numpy as npimport matplotlib.pyplot as pltfrom sklearn import svm, datasetsfrom ...原创 2019-05-10 11:05:17 · 2913 阅读 · 0 评论 -
机器学习模型评估混淆矩阵、ROC曲线和AUC以及PR曲线
在机器学习中,当我们基于某个业务建立模型并训练后,接下来我们需要评判模型好坏的时候需要基于混淆矩阵,ROC和AUC等来进行辅助判断。混淆矩阵也叫精度矩阵,是用来表示精度评价,为N *N的矩阵,用来判别分类好坏的指标。混淆矩阵中有以下几个概念:TP(True Positive): 被判定为正样本,实际也为正样本FN(False Negative):伪阴性 ,被判定为负样本,实际为正样...转载 2019-05-26 09:08:54 · 1528 阅读 · 0 评论 -
scikit-learn 以线性回归为例学习性能评估指标
代码:from sklearn.linear_model import LinearRegression as LRfrom sklearn.model_selection import train_test_splitfrom sklearn.model_selection import cross_val_scorefrom sklearn.datasets import fetc...翻译 2019-05-27 21:34:31 · 2093 阅读 · 1 评论 -
scikit-learn 支持向量机--图视化
代码笔记:from sklearn.datasets import make_blobsfrom sklearn.svm import SVCimport matplotlib.pyplot as pltimport numpy as npX,y = make_blobs(n_samples=50, centers=2, random_state=0, cluster_std=0....翻译 2019-05-27 21:20:38 · 732 阅读 · 0 评论 -
scikit-learn 支持向量机-乳腺癌数据集探索
代码笔记:from sklearn.datasets import load_breast_cancerfrom sklearn.svm import SVCfrom sklearn.model_selection import train_test_splitimport matplotlib.pyplot as pltimport numpy as npfrom time im...翻译 2019-05-27 21:13:43 · 5021 阅读 · 0 评论 -
scikit-learn 逻辑回归--调参
代码笔记:from sklearn.linear_model import LogisticRegression as LRfrom sklearn.datasets import load_breast_cancerimport numpy as npimport matplotlib.pyplot as pltfrom sklearn.model_selection import...翻译 2019-05-27 20:32:25 · 8515 阅读 · 0 评论 -
scikit-learn 主成分分析--数据降维
代码笔记import matplotlib.pyplot as pltfrom sklearn.datasets import load_irisfrom sklearn.decomposition import PCAiris = load_iris()y = iris.targetX = iris.dataimport pandas as pdpd.DataFrame(X...翻译 2019-05-27 20:25:06 · 1720 阅读 · 0 评论 -
scikit-learn 随机森林代码学习--乳腺癌检测
from sklearn.datasets import load_breast_cancerfrom sklearn.ensemble import RandomForestClassifierfrom sklearn.model_selection import GridSearchCVfrom sklearn.model_selection import cross_val_scor...翻译 2019-05-26 22:18:23 · 1236 阅读 · 0 评论 -
scikit-lean 随机森林代码学习--红酒
代码笔记%matplotlib inlinefrom sklearn.tree import DecisionTreeClassifierfrom sklearn.ensemble import RandomForestClassifierfrom sklearn.datasets import load_winewine = load_wine()from sklearn....翻译 2019-05-26 18:02:35 · 1274 阅读 · 1 评论 -
scikit-learn 决策树代码学习-红酒数据
代码笔记1.导库from sklearn import treefrom sklearn.datasets import load_winefrom sklearn.model_selection import train_test_split2. 加载数据,拆分wine = load_wine()Xtrain, Xtest, Ytrain, Ytest = train_...翻译 2019-05-26 16:23:43 · 2100 阅读 · 0 评论 -
scikit-learn KNN实现糖尿病预测
随书代码,阅读笔记。KNN是一种有监督的机器学习算法,可以解决分类问题,也可以解决回归问题。算法优点:准确性高,对异常值和噪声有较高的容忍度;算法缺点:计算量大,内存消耗也比较大。针对算法计算量大,有一些改进的数据结构,避免重复计算K-D Tree, Ball Tree。算法变种:根据邻居的距离,分配不同权重。另外一个变种是指定半径。KNN进行分类%matplotlib...原创 2018-09-13 14:41:42 · 5558 阅读 · 1 评论 -
scikit-learn 逻辑回归实现乳腺癌检测
随书代码,阅读笔记载入数据%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as np# 载入数据from sklearn.datasets import load_breast_cancercancer = load_breast_cancer()X = cancer.datay = cancer...原创 2018-09-12 22:18:42 · 2877 阅读 · 0 评论 -
scikit-learn 支持向量机实现乳腺癌检测
随书代码,阅读笔记。载入数据并准备测试机和训练集# 载入数据from sklearn.datasets import load_breast_cancercancer = load_breast_cancer()X = cancer.datay = cancer.targetprint('data shape: {0}; no. positive: {1}; no. negat...原创 2018-09-12 17:49:16 · 4104 阅读 · 4 评论 -
python+opencv目标匹配技术
先上两个code吧#!/usr/bin/env pythonimport cv2import numpy as npimg1 = cv2.imread('box.png', 0)img2 = cv2.imread('box_in_scene.png', 0)orb = cv2.ORB_create()kp1, des1 = orb.detectAndCompute(img1原创 2016-04-10 22:34:20 · 8503 阅读 · 0 评论 -
目标特征检测之ORB
ORB: Oriented Fast and Rotated BRIEF它是OpenCV_Labs 在2011年提出的,首先它是免费的,而SIFT 和 SURF 是受专利保护,并且要收费的,ORB 是他们的一个替代品,在计算能力比有限的设备上适合这个东西。它的效果: sift > orb > surf, 计算速度 orb > surf > sift#!/usr/bi原创 2016-04-10 11:31:50 · 7479 阅读 · 0 评论 -
目标特征检测之BRIEF描述符
BRIEF:Binary Robust Independent Elementary Rreatures占位原创 2016-03-09 21:22:33 · 6778 阅读 · 0 评论 -
目标特征检测之SURF特征
SURF: speeded-up robust features是SIFT 的加速版#!/usr/bin/env pythonimport cv2img = cv2.imread('chess.png')gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)surf = cv2.SURF(400)print surf.shapekp,原创 2016-04-09 20:20:19 · 6994 阅读 · 0 评论 -
目标检测之Harris角点特征
占位原创 2016-03-09 21:18:08 · 1263 阅读 · 0 评论 -
目标检测之HOG特征
模式识别的一般步骤是:(1)特征提取(2)根据特征和正负样本训练分类器(3)利用分类器识别HOG就是一个描述图像信息的特征。Histogram of Oriented Gradient, 既方向梯度直方图,在特定梯度方向上的梯度值总和。概念性的东西不说了,下面通过代码详细讲解。HOG特征对图像几何的和光学的形变都能保持很好的不变性,这两种形变只会出现在更大的空间领域上。其次原创 2016-03-09 21:16:35 · 6532 阅读 · 0 评论 -
目标检测之Haar特征
最初在Opencv的人脸检测中接触到这个特征。占位,原创 2016-03-09 21:24:50 · 556 阅读 · 0 评论 -
目标检测之LBP特征
LBP:Local Binary Pattern占位原创 2016-03-09 21:23:42 · 664 阅读 · 0 评论 -
MNIST手写体数据库介绍
官方主页:http://yann.lecun.com/exdb/mnist/Google实验室的Corinna Cortes和纽约大学柯朗研究所的YannLeCun建有一个手写数字数据库,训练库有60,000张手写数字图像,测试库有10,000张。训练库train-images.idx3-ubyte,文件大小47040016,每个图像784=28×28,784×60000 =47040原创 2016-12-08 17:01:47 · 18053 阅读 · 0 评论 -
win10 anacoda2 cuda theano安装笔记
找不到cudnn –lcudnn在[dnn]中配置library_path之后就好了。原创 2017-12-04 17:54:13 · 6425 阅读 · 0 评论 -
scikit-learn 朴素贝叶斯实现文档分类
随书代码,做些笔记。加载数据集http://mlcomp.org/datasets/379 下载%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as npfrom time import timefrom sklearn.datasets import load_filesprint("loadin...原创 2018-09-12 14:24:57 · 1019 阅读 · 0 评论 -
sklearn study
手册:http://sklearn.apachecn.org/一些视频教程:http://i.youku.com/apachecn原创 2018-09-12 10:58:12 · 144 阅读 · 0 评论 -
scikit-learn使用KNN进行回归
k近邻算法的核心思想是未标记样本的类别,由距离其最近的k个邻居投票决定。该算法具有准确性高,对异常值和噪声有较高的容忍度等优点。缺点是计算量比较大,内存消耗量也大。Text:code:import numpy as npimport matplotlib.pyplot as pltfrom sklearn.neighbors import KNeighborsRegressorn_dot...原创 2018-05-05 08:14:51 · 8606 阅读 · 0 评论 -
YoloV3 study
确保本机器已经成功安装了tensorflow, keras, opencv, python3.x下载python codehttps://github.com/xiaochus/YOLOv3下载darknet modelhttps://github.com/xiaochus/YOLOv3 从quick start中下载已经训练好的model,230+M将darknet model转换为h5进入y...原创 2018-04-26 14:25:37 · 3309 阅读 · 0 评论 -
scikit-learn使用KNN进行分类
k近邻算法的核心思想是未标记样本的类别,由距离其最近的k个邻居投票决定。该算法具有准确性高,对异常值和噪声有较高的容忍度等优点。缺点是计算量比较大,内存消耗量也大。demo code如下:from sklearn.datasets.samples_generator import make_blobsimport matplotlib.pyplot as pltimport numpy as ...原创 2018-05-03 22:42:39 · 7455 阅读 · 0 评论 -
决策树算法实现
1、python本课程的机器学习的算法都是基于python语言实现的,所以你需要有一定的python语言基础,可以参考彭亮在麦子学院讲授的“Python语言编程基础”。2、python机器学习的库:scikit-learn特性: 1)简单高效的数据挖掘和机器学习分析 2)对所有用户开放,根据不同需求高度可重用性 3)基于Numpy, SciPy和matplotl转载 2017-11-27 19:30:22 · 9494 阅读 · 0 评论 -
win10 tensorflow MTCNN Demo
doc mark hereMTCNN 入口代码#coding = gbkimport tensorflow as tfimport numpy as npimport cv2import detect_faceimport time#face detection parametersminsize = 20 # minimum size of facethresh原创 2017-12-13 17:54:46 · 7634 阅读 · 5 评论 -
机器学习&深度学习视频资料大汇总
第一部分 基础语言pandax视频教程链接: https://pan.baidu.com/s/1pLqavVX 密码: fathpython入门到精通链接: https://pan.baidu.com/s/1mhVNIkC 密码: cvp3第二部分 数据篇链接: https://pan.baidu.com/s/1pLK25zP 密码: qtuu第三部分 机器学习部分吴恩转载 2017-11-25 21:55:09 · 531 阅读 · 0 评论