
数据挖掘
文章平均质量分 64
王勇21633012
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
安装GraphViz
在Python机器学习实践中需要使用GraphViz显示决策树的图下面是安装、配置及验证过程:1、官网下载稳定版并安装;2、将“C:\Program Files (x86)\Graphviz2.38\bin”加入系统变量的“Path”这一步是必须的否则程序报错;3、pip install graphviz;4、使用下面代码验证:import graphvizimport sklearn.data...原创 2018-05-08 21:41:19 · 2050 阅读 · 0 评论 -
最大似然估计,最大后验估计
条件概率: $$P(A|B)={P(AB)\over P(B)}$$ 这个公式看下面韦恩图就懂了:在事件\(B\)发生的条件下发生事件\(A\)的概率\(P(A|B)\),就是\(AB\)同时发生的概率\(P(AB)\),比\(B\)发生的概率\(P(B)\). 贝叶斯公式:$$P(A|B) = \frac{P(B|A)P(A)}{P(B)}$$ 形式上很明显,这个公式是条...原创 2018-05-03 14:50:40 · 1030 阅读 · 0 评论 -
使用TensorFlow实现简单的线性拟合
本文使用TensorFlow实现最简单的线性回归模型。线性回归拟合\(y=2.7x+0.6\),代码如下:import tensorflow as tfimport numpy as npimport matplotlib.pyplot as pltn = 201 # x点数X = np.linspace(-1, 1, n)[:,np.newaxis] # 等差数列构建X,[...原创 2018-05-07 23:57:36 · 1256 阅读 · 1 评论 -
线性拟合最小二乘法Python实现
下面代码实现的是最小二乘法线性拟合,并且包含自己造的轮子与别人造的轮子的结果比较。问题:对y=2.5x+0.8y=2.5x+0.8直线附近的带有噪声的数据进行线性拟合,最终求出w,b的估计值。最小二乘法基本思想是使得样本方差最小。代码中self_func()函数为自定义拟合函数,skl_func()为调用scikit-learn中线性模块的函数。import numpy as npimport ...原创 2018-05-15 22:28:56 · 6991 阅读 · 0 评论 -
比较样本方差对线性拟合结果的影响
代码和结果如下:import numpy as npimport pandas as pdfrom sklearn.linear_model import LinearRegressionimport seaborn as snsdef self_func(i): np.random.seed(i) n = 101 x = np.linspace(0,1...原创 2018-05-16 00:16:18 · 833 阅读 · 0 评论 -
Sigmoid函数推导(逻辑回归激活函数来历)
转载请注明出处:逻辑回归实际上是使用回归进行二分类的方法。线性回归返回的范围为\((-\infty,+\infty)\),而分类预测结果需要得到取值范围为\([0,1]\)的概率值,这样就需要一个由\((-\infty,+\infty)\)映射到\([0,1]\)的关系函数,这个函数关系,我们就可以使用\(Sigmoid(x)=1\over{1+e^{-x}}\)函数。那为什么要用这个函数呢?请看...原创 2018-05-16 18:39:25 · 8903 阅读 · 5 评论 -
Boston房价数据集线性回归—— sklearn & statsmodels 比较
import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom sklearn import datasets, linear_model, metricsimport statsmodels.api as smboston = datasets.load_boston() # 这个数据集是一个字典d...原创 2018-05-16 20:48:40 · 4721 阅读 · 0 评论