
机器学习
Hi_Shook
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Keras 浅尝之MNIST手写数字识别
最近关注了一阵Keras,感觉这个东西挺方便的,今天尝试了一下发现确实还挺方便。不但提供了常用的Layers、Normalization、Regularation、Activation等算法,甚至还包括了几个常用的数据库例如cifar-10和mnist等等。下面的代码算是Keras的Helloworld吧!利用MLP实现的MNIST手写数字识别:from keras.models imp...转载 2019-03-11 17:51:38 · 268 阅读 · 0 评论 -
成为顶尖机器学习算法专家需要知道哪些算法?
本文为你介绍机器学习算法及其分类,助你成为机器学习领域的专家。机器学习算法简介有两种方法可以对你现在遇到的所有机器学习算法进行分类。 第一种算法分组是学习风格的。 第二种算法分组是通过形式或功能相似。 通常,这两种方法都能概括全部的算法。但是,我们将重点关注通过相似性对算法进行分组。通过学习风格分组的机器学习算法算法可以通过不同的方式对...原创 2018-10-16 14:24:41 · 172 阅读 · 0 评论 -
神经网络回顾-Relu激活函数
1. 神经元模型以下引用自Poll的笔记:神经网络基础。 神经元是神经网络中最基本的结构,也可以说是神经网络的基本单元,它的设计灵感完全来源于生物学上神经元的信息传播机制。我们学过生物的同学都知道,神经元有两种状态:兴奋和抑制。一般情况下,大多数的神经元是处于抑制状态,但是一旦某个神经元收到刺激,导致它的电位超过一个阈值,那么这个神经元就会被激活,处于“兴奋”状态,进而向其他的神经元传...转载 2018-12-03 14:54:03 · 1145 阅读 · 0 评论 -
机器学习实战之PCA
一,引言 降维是对数据高维度特征的一种预处理方法。降维是将高维度的数据保留下最重要的一些特征,去除噪声和不重要的特征,从而实现提升数据处理速度的目的。在实际的生产和应用中,降维在一定的信息损失范围内,可以为我们节省大量的时间和成本。降维也成为了应用非常广泛的数据预处理方法。 降维具有如下一些优点:(1)使得数据集更易使用(2)降低算法的计算开销(3)去除噪声(4)使得结...转载 2018-12-03 15:08:01 · 338 阅读 · 0 评论 -
机器学习实战之AdaBoost算法
一,引言 前面几章的介绍了几种分类算法,当然各有优缺。如果将这些不同的分类器组合起来,就构成了我们今天要介绍的集成方法或者说元算法。集成方法有多种形式:可以使多种算法的集成,也可以是一种算法在不同设置下的集成,还可以将数据集的不同部分分配不同的分类器,再将这些分类器进行集成。 adaBoost分类器就是一种元算法分类器,adaBoost分类器利用同一种基分类器(弱分类器),基于分类器的...转载 2018-12-03 17:50:33 · 399 阅读 · 0 评论 -
Black-Scholes期权定价模型
Black-Scholes期权定价模型用手机看条目Black-Scholes期权定价模型(Black-Scholes Option Pricing Model),布莱克-肖尔斯期权定价模型 目录 [隐藏] 1Black-Scholes 期权定价模型概述 2B-S期权定价模型(以下简称B-S模型)及其假设条件 2.1(一)B-S模型有7个重要的假...转载 2018-12-28 18:21:44 · 8064 阅读 · 1 评论 -
阿尔法狗的利器:蒙特卡洛算法,看完就懂了!
在今年3月9日-15日,围棋界发生了一件大事,一场总计五轮的人与机器的大战在韩国首尔上演。这场比赛的结果是人类完败,世界围棋冠军李世石以1比4最终败给了谷歌公司的人工智能程序AlphaGo。那么AlphaGo是什么,获胜的关键又在哪里呢?这里我们就要来了解一个算法:蒙特卡洛算法。 AlphaGo和蒙特卡洛算法 根据新华社的报道,AlphaGo程序是美国谷歌公司旗下DeepM...转载 2018-12-29 14:26:49 · 18378 阅读 · 0 评论 -
xgboost中XGBClassifier()参数详解
常规参数booster gbtree 树模型做为基分类器(默认) gbliner 线性模型做为基分类器silent silent=0时,不输出中间过程(默认) silent=1时,输出中间过程nthread nthread=-1时,使用全部CPU进行并行运算(默认) nthread=1时,使用1个CPU进行运算。scale_pos_weig...原创 2019-02-01 14:13:14 · 3317 阅读 · 0 评论 -
基于卡方分箱的评分卡建模
卡方分布—chi-square distribution, χ2-distribution:若k个独立的随机变量Z1, Z2,..., Zk 满足标准正态分布 N(0,1) , 则这k个随机变量的平方和:为服从自由度为k的卡方分布,记作:或者卡方检验—χ2检验是以χ2分布为基础的一种假设检验方法,主要用于分类变量之间的独立性检验: 基本思想是根据样本数据推断总体...转载 2019-02-26 09:51:18 · 1441 阅读 · 0 评论 -
用pandas中的DataFrame时选取行或列
import numpy as npimport pandas as pdfrom pandas import Sereis, DataFrameser = Series(np.arange(3.))data = DataFrame(np.arange(16).reshape(4,4),index=list('abcd'),columns=list('wxyz'))data['w...转载 2019-02-27 15:34:15 · 21733 阅读 · 0 评论 -
ChiMerge & 卡方分箱
# -*- coding: utf-8 -*-"""Created on@author:"""import pandas as pdimport numpy as npdata = pd.read_csv('iris.csv', sep="\t", na_values=['', '?'])temp = data[['x','y']]# 定义一个卡方分箱(可设置参数置信度水...转载 2019-02-27 18:41:05 · 2177 阅读 · 1 评论 -
pandas set_option
import pandas as pd1、pd.set_option('expand_frame_repr', False)True就是可以换行显示。设置成False的时候不允许换行2、pd.set_option('display.max_rows', 10)pd.set_option('display.max_columns', 10)显示的最大行数和列数,如果超额就显...转载 2019-03-10 21:02:47 · 2800 阅读 · 0 评论 -
聚类评估算法-轮廓系数(Silhouette Coefficient )
轮廓系数(Silhouette Coefficient),是聚类效果好坏的一种评价方式。最早由 Peter J. Rousseeuw 在 1986 提出。它结合内聚度和分离度两种因素。可以用来在相同原始数据的基础上用来评价不同算法、或者算法不同运行方式对聚类结果所产生的影响。 方法: 1,计算样本i到同簇其他样本的平均距离ai。ai 越小,...原创 2018-10-16 14:14:07 · 13606 阅读 · 0 评论