
机器学习
文章平均质量分 65
王勇21633012
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
安装GraphViz
在Python机器学习实践中需要使用GraphViz显示决策树的图下面是安装、配置及验证过程:1、官网下载稳定版并安装;2、将“C:\Program Files (x86)\Graphviz2.38\bin”加入系统变量的“Path”这一步是必须的否则程序报错;3、pip install graphviz;4、使用下面代码验证:import graphvizimport sklearn.data...原创 2018-05-08 21:41:19 · 2050 阅读 · 0 评论 -
TensorFlow实战——Softmax分类MNIST
下面代码使用Softmax分类MNIST,并绘制准确率随训练次数变化的关系图:(代码会自动下载MNIST数据集放在"MNIST_data/"文件夹中,若数据及存在则直接使用)# coding:utf-8import matplotlib.pyplot as pltimport tensorflow as tffrom tensorflow.examples.tutorials.m...原创 2018-08-01 10:55:42 · 542 阅读 · 0 评论 -
Boston房价数据集线性回归—— sklearn & statsmodels 比较
import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom sklearn import datasets, linear_model, metricsimport statsmodels.api as smboston = datasets.load_boston() # 这个数据集是一个字典d...原创 2018-05-16 20:48:40 · 4721 阅读 · 0 评论 -
Sigmoid函数推导(逻辑回归激活函数来历)
转载请注明出处:逻辑回归实际上是使用回归进行二分类的方法。线性回归返回的范围为\((-\infty,+\infty)\),而分类预测结果需要得到取值范围为\([0,1]\)的概率值,这样就需要一个由\((-\infty,+\infty)\)映射到\([0,1]\)的关系函数,这个函数关系,我们就可以使用\(Sigmoid(x)=1\over{1+e^{-x}}\)函数。那为什么要用这个函数呢?请看...原创 2018-05-16 18:39:25 · 8903 阅读 · 5 评论 -
比较样本方差对线性拟合结果的影响
代码和结果如下:import numpy as npimport pandas as pdfrom sklearn.linear_model import LinearRegressionimport seaborn as snsdef self_func(i): np.random.seed(i) n = 101 x = np.linspace(0,1...原创 2018-05-16 00:16:18 · 833 阅读 · 0 评论 -
线性拟合最小二乘法Python实现
下面代码实现的是最小二乘法线性拟合,并且包含自己造的轮子与别人造的轮子的结果比较。问题:对y=2.5x+0.8y=2.5x+0.8直线附近的带有噪声的数据进行线性拟合,最终求出w,b的估计值。最小二乘法基本思想是使得样本方差最小。代码中self_func()函数为自定义拟合函数,skl_func()为调用scikit-learn中线性模块的函数。import numpy as npimport ...原创 2018-05-15 22:28:56 · 6991 阅读 · 0 评论 -
使用TensorFlow实现简单的线性拟合
本文使用TensorFlow实现最简单的线性回归模型。线性回归拟合\(y=2.7x+0.6\),代码如下:import tensorflow as tfimport numpy as npimport matplotlib.pyplot as pltn = 201 # x点数X = np.linspace(-1, 1, n)[:,np.newaxis] # 等差数列构建X,[...原创 2018-05-07 23:57:36 · 1256 阅读 · 1 评论 -
深度学习手册——深度神经网络的超参数调试、正则化及优化方法(长文多图)
0 前言本文对深度神经网络超参数优化进行概要总结,适合有一定基础的人员查阅。 1 训练基础深度神经网络选择超参数是一个迭代过程,即使经验丰富的工程师,在面对新的任务时也需要在不断尝试中找到好的网络参数。1.1 训练集、验证集、测试集比例:在机器在学习时代,数据集往往不大,一般几百条到几万条,这种小规模数据集被分为:70%训练集、30%测试集(或着说60%训练集、20%验...原创 2018-08-17 10:46:56 · 14398 阅读 · 0 评论