
机器学习
背后——NULL
保持善良!
展开
-
机器学习-初级入门(分类算法-随机森林)
一、构建随机森林中的树构建随机森林假设共有N个样本,M个特征。这里我们讲“随机”的含义。对于每棵树都有放回的随机抽取训练样本,这里抽取随机抽取的样本作为训练集,再有放回的随机选取个特征作为这棵树的分枝的依据,这里要注意。这就是“随机”两层含义,一个是随机选取样本,一个是随机选取特征。这样就构建出了一棵树,需要注意的是这里生成的树都是完全生长的树(关于为什么是要完全生长的树,我认为的原因是便于...原创 2020-04-17 22:31:58 · 1064 阅读 · 0 评论 -
机器学习-初级入门(分类算法-决策树)
一、信息增益熵在信息论中,熵(entropy)是随机变量不确定性的度量,也就是熵越大,则随机变量的不确定性越大。设X是一个取有限个值得离散随机变量,其概率分布为:则随机变量X的熵定义为:条件熵设有随机变量(X, Y),其联合概率分布为:条件熵H(Y|X)表示在已知随机变量X的条件下,随机变量Y的不确定性。随机变量X给定的条件下随机变量Y的条件熵H(Y|X),定义为X给定条...原创 2020-04-16 14:12:08 · 426 阅读 · 0 评论 -
机器学习-初级入门(分类算法-逻辑回归、softmax详解)
一、逻辑回归实现二分类sigmod函数g(z) = 1 / (1 + e-z)替换推导令z = WTX则g(z) = 因为g(z)函数的特性,它输出的结果也不再是预测结果,而是一个值预测为正例的概率,预测为负例的概率就是1-g(z)。函数形式表达:P(y=0|w,x) = 1 – g(z)P(y=1|w,x) = g(z)sigmod函数预测结果为一个0到1之间的小...原创 2020-04-12 16:11:41 · 405 阅读 · 0 评论 -
机器学习-初级入门(回归算法-多种线性回归算法详解)
一、简单线性回归基本公式根据假设条件推出损失函数所有样本独立同分布(iid),且误差项服从以下分布:用最小二乘法与以上假设的关系推导如下:使用MLE(极大似然法)估计参数如下:...原创 2020-04-11 17:36:13 · 928 阅读 · 0 评论 -
机器学习-初级进阶(k次交叉验证;网状搜索)
一、交叉验证原理将数据集划分为若干等分,然后对每一等分数据当测试集数据进行验证,最后对每一个测试结果进行汇总取平均值代码实现数据: User ID Gender Age EstimatedSalary Purchased15624510 Male 19.0 19000.0 015810944 Male 35.0 ...原创 2020-02-24 20:58:25 · 255 阅读 · 0 评论 -
机器学习-初级进阶(Kernel PCA)
一、Kernel PCA(将线性不可分转化为线性可分)原理代码实现数据: User ID Gender Age EstimatedSalary Purchased15624510 Male 19.0 19000.0 015810944 Male 35.0 20000.0 015...原创 2020-02-24 20:43:49 · 656 阅读 · 0 评论 -
机器学习-初级进阶(PCA)
一、主成分分析原理最终不断压缩团圆范围,坐落于椭圆内的点为主要影响因素,实现降维操作代码实现数据:Alcohol,Malic_Acid,Ash,Ash_Alcanity,Magnesium,Total_Phenols,Flavanoids,Nonflavanoid_Phenols,Proanthocyanins,Color_Intensity,Hue,OD280,Proli...原创 2020-02-24 20:35:52 · 368 阅读 · 0 评论 -
机器学习-初级进阶(深度学习-卷积神经网络)
一、卷积神经网络卷积神经网络介绍学习资料卷积神经网络流程分解(1)卷积:卷积后的几种照片展示图:(2)最大池化(3)扁平化(4)全连接层线性整流激活层线性整流层资料总结代码实现数据集:测试集和训练集中是包含小猫,小狗的照片,训练集中小猫小狗图片各4000张,测试集中小猫小狗图片各1000张...原创 2020-02-24 20:19:16 · 404 阅读 · 0 评论 -
机器学习-初级进阶(深度学习-人工神经网络)
一、人工神经网络什么是神经元?图中可以看出一个完整的神经元主要由三部分组成:输入层->隐藏层->输出层,输入层与隐藏层之间多种关系通过W(权重)来区别隐藏层对于输入值和权重进行分析,最终输出判断结果实际生活中神经网络是由多个神经元组成,视图如下:激活函数(而在A-NN中的具体操作是这样的,我们做输入(X)和它们对应的权重(W)的乘积之和,并将激活函数f(x...原创 2020-02-24 19:52:36 · 553 阅读 · 0 评论 -
机器学习-初级进阶(自然语言处理 )
一、自然语言处理要处理的问题对于多组对话中判断这段化是消极的还是积极的处理的短语数据 Review Liked Wow... Loved this place. 1 Cru...原创 2020-02-24 18:09:12 · 286 阅读 · 0 评论 -
机器学习-初级进阶(Thompson 抽样算法 )
一、Thompson 抽样算法原理代码实现from matplotlib import pyplot as pltimport pandas as pdimport randomdataset = pd.read_csv("Ads_CTR_Optimisation.csv")d = 10N = 10000numbers_of_rewards_1 = [0] * d...原创 2020-02-15 15:15:04 · 1582 阅读 · 0 评论 -
机器学习-初级进阶(置信区间上界算法)
一、置信区间上界算法原理代码实现数据: Ad 1 Ad 2 Ad 3 Ad 4 Ad 5 Ad 6 Ad 7 Ad 8 Ad 9 Ad 10 1 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0...原创 2020-02-15 15:04:50 · 1501 阅读 · 0 评论 -
机器学习-初级入门(集群和关联规则)
一、集群和关联规则K-Means Clustering(K平均聚类算法 , 无监督学习)原理组内平方和选择类的个数数据: CustomerID Genre Age Annual Income (k$) Spending Score (1-100) 1 Male 19 15 ...原创 2020-02-15 14:41:48 · 683 阅读 · 0 评论 -
机器学习-初级入门(分类算法)
一、分类算法逻辑回归原理数据 User ID Gender Age EstimatedSalary Purchased 15624510 Male 19.0 19000.0 0 15810944 Male 35.0 20000.0 0 15668575 ...原创 2020-02-14 20:21:14 · 248 阅读 · 0 评论 -
机器学习-初级入门(回归算法)
一、回归算法简单线性回归数据YearsExperience Salary 1.1 39343.0 1.3 46205.0 1.5 37731.0 2.0 43525.0 2.2 39891.0 2.9 56642.0 ...原创 2020-02-14 19:35:36 · 372 阅读 · 0 评论 -
机器学习-初级入门(数据预处理)
一、数据预处理数据(Data.csv) Country Age Salary Purchased France 44.0 72000.0 No Spain 27.0 48000.0 Yes Germany 30.0 54000.0 No Spain 38.0 61000.0 No Ge...原创 2020-02-14 18:41:23 · 284 阅读 · 0 评论