
机器学习
文章平均质量分 90
-Heres-
他每做一件小事的时候,都像救命稻草一样抓着。有一天我一看,嚯,好家伙!他抱着的是已经让我仰望的参天大树了。
展开
-
机器学习:关联分析
1 引言说到关联分析,顾名思义的就可以联想到,所谓关联就是两个东西之间存在的某种联系。关联分析最有名的例子是“购物篮事务”,以前在美国西部的一家连锁店,店家发现男人们在周四购买尿布后还会购买啤酒。于是他便得出一个推理,尿布和啤酒存在某种关联。但是具体怎么来评判呢?先看下表: 表 1表中每一行对应一个事物,包含一个唯一标识TID和给定顾客购买的商品的集合。从这个表中所示的数据中可以提原创 2017-09-10 21:49:22 · 4412 阅读 · 0 评论 -
科比生涯数据集分析与预测
import numpy as npimport pandas as pdimport matplotlib.pyplot as plt%matplotlib inlinefrom sklearn.ensemble import RandomForestClassifierfrom sklearn.cross_validation import KFoldfilen...转载 2018-08-12 22:40:47 · 3573 阅读 · 4 评论 -
利用最小二乘法做线性回归
最小二乘法概述对于一元线性回归模型, 假设从总体中获取了n组观察值(x1,y1)(x1,y1)(x_1,y_1),(x2,y2)(x2,y2)(x_2,y_2),… ,(xn,yn)(xn,yn)(x_n,y_n)。对于平面中的这n个点,可以使用无数条曲线来拟合。要求样本回归函数尽可能好地拟合这组值。综合起来看,这条直线处于样本数据的中心位置最合理。 选择最佳拟合曲线的标准可以确定为:使总的拟...转载 2018-05-28 16:49:42 · 7064 阅读 · 0 评论 -
梯度与梯度下降法
概述在讲述梯度下降算法之前,我们先需要了解一下导数(derivative)、偏导数(partial derivative)和方向导数(directional derivative),然后我们看看梯度下降法(Gradient Descent),了解为什么在优化问题中使用梯度下降法来优化目标函数。导数一张关于导数和微分的图: 导数定义如下: f′(x0)=limΔx→0ΔyΔ...转载 2018-05-26 22:07:45 · 3194 阅读 · 0 评论 -
K-means聚类
与回归与分类不同,聚类是无监督学习算法,无监督指的是只需要数据,不需要标记结果,试图探索和发现一些模式。比如对用户购买模式的分析(用户的行为、地址)、图像颜色分割(图像边缘)、邮件聚类(工作、财务、私人)等。聚类算法的提出比较早,是数据挖掘的一个重要模块,可以对大量数据分类并概括出每一类的特点,可用于发现共同的群体。目前也有很多种聚类算法,包括划分法、层次法、基于密度的方法、基于网格的方法等。实际...转载 2018-04-11 11:31:20 · 600 阅读 · 0 评论 -
特征工程
前言 机器学习领域的大神Andrew Ng(吴恩达)老师曾说“Coming up with features is difficult, time-consuming, requires expert knowledge. “Applied machine learning” is basically feature engineering. ”表达了特征工程是比较难,比较耗时的一个过程,需要较...转载 2018-04-01 21:13:55 · 502 阅读 · 0 评论 -
逻辑(斯特)回归及python实现
python代码实现:from numpy import *filename='bb.txt' #文件目录def loadDataSet(): #读取数据(这里只有两个特征) dataMat = [] labelMat = [] #列表 fr = open(filename) for line in fr.readlines(): lin原创 2018-01-01 20:58:10 · 2522 阅读 · 1 评论 -
机器学习之线性回归及python实现
python代码实现:import numpy as npimport pylabdef compute_error(b,m,data): totalError = 0 #Two ways to implement this #first way # for i in range(0,len(data)): # x = data[i,0]原创 2017-12-25 23:09:10 · 1011 阅读 · 0 评论 -
3种机器学习算法
原文:3 Machine Learning Algorithms You Need to Know 作者:Eleni Markou 翻译:Vincent译者注:决策树 & 聚类算法 & 线性回归:应该使用哪种机器学习算法?使用它的原因是什么?作者在本文中详细介绍了这些内容。以下为译文。假设有一些跟数据相关的难题需要你去解决。之前你已经听过机器学习算法的厉害之处了,因转载 2017-10-20 16:59:20 · 1002 阅读 · 0 评论 -
浅谈ANN:M-P模型
什么是M-P模型所谓M-P模型,其实是按照生物神经元的结构和工作原理构造出来的一个抽象和简化了的模型。简单点说,它是对一个生物神经元的建模。它实际上是两位科学家的名字的合称,1943年心理学家W.McCulloch和数学家W.Pitts合作提出了这个模型,所以取了他们两个人的名字(McCulloch-Pitts)。生物神经元的结构在谈M-P模型的内容之前,我们先得了解一下人转载 2017-09-25 15:48:12 · 4139 阅读 · 0 评论 -
BP神经网络数学原理及推导过程
说明:本博客引自博客:http://blog.youkuaiyun.com/zhongkejingwang/article/details/44514073;并对此博客中有些地方的推导的过程进行详细地说明。同时,对一些基础知识进行引申介绍。1.引言BP神经网络,BP即Back Propagation的缩写,也就是反向传播的意思。它是一种前馈神经网络。而前馈神经网络是神经网络的一种典型分层结构,在这种网转载 2017-10-18 16:15:26 · 5048 阅读 · 1 评论 -
信用卡欺诈检测机器学习案例(LR、RF)
import pandas as pdimport matplotlib.pyplot as pltimport numpy as np%matplotlib inlinepandas 一些知识点frame=pd.DataFrame(np.arange(12).reshape((4,3)),columns=['c','a','b'],index=['D','B','C',...转载 2018-08-30 17:23:24 · 1142 阅读 · 0 评论