
机器学习
文章平均质量分 55
elkluh
简单,容易,一看就会。
展开
-
读论文:Learning to Compare: Relation Network for Few-Shot Learning
我们提出了一个概念上简单、灵活且通用的少镜头学习框架,其中分类器必须学习识别每个只给出少量示例的新类。我们的方法称为关系网络(RN),从头到尾进行训练。在元学习过程中,它学习学习一个深度距离度量来比较插曲中的少量图像,每个图像都被设计用来模拟少数镜头设置。经过训练后,RN能够通过计算查询图像与每个新类的少数示例之间的关系分数来对新类的图像进行分类,而无需进一步更新网络。除了在少镜头学习上提供更好的性能外,我们的框架很容易扩展到零镜头学习。原创 2022-12-20 10:56:03 · 902 阅读 · 0 评论 -
L1,L2范数
正则化原创 2022-07-11 02:03:03 · 367 阅读 · 0 评论 -
logits, logistic, sigmoid, softmax区别和联系
logit,logistic,sigmoid,softmax原创 2022-07-07 03:39:00 · 532 阅读 · 0 评论 -
随机森林的理解
一个样本容量为N的样本,有放回的抽取N次,每次抽取1个,最终形成了N个样本。这选择好了的N个样本用来训练一个决策树,作为决策树根节点处的样本。这用了(a.)bagging的思想。 当每个样本有M个属性时,在决策树(c.)的每个节点需要分裂时,随机从这M个属性中选取出m个属性 (b.),满足条件m << M。然后从这m个属性中采用某种策略(比如说信息增益)来选择1个属性作为该节点的分裂属性。 决策树形成过程中每个节点都要按照步骤2来分裂(很容易理解,如果下一次该节点选出来的那一个属性是刚刚其父原创 2022-05-20 23:17:19 · 411 阅读 · 0 评论 -
中心极限定理
中心极限定理指出了大量随机变量近似服从正态分布的条件。import numpy as npimport matplotlib.pyplot as pltN = 1000x1 = np.zeros(N)print(x1.shape)for n in range(N): x1[n] = np.sum(np.random.rand(12,1)) - np.sum(np.random.rand(12,1)) fig, ax = plt.subplots(figsize=(5,5)) #原创 2022-01-19 21:03:54 · 774 阅读 · 0 评论 -
频率派和贝叶斯派
频率派:他们认为世界是确定的。他们直接为事件本身建模,也就是说事件在多次重复实验中趋于一个稳定的值p,那么这个值就是该事件的概率。是未知的常量, x是随机分布的变量。MLE(极大似然估计,Maximum likelihood estimation):估计使p最大的贝叶斯派:他们认为世界是确定的。他们直接为事件本身建模,也就是说事件在多次重复实验中趋于一个稳定的值p,那么这个值就是该事件的概率。是随机的变量,贝叶斯定理:MAP(最大后验估计,Maximum A post..原创 2022-01-19 20:36:23 · 923 阅读 · 0 评论 -
Fisher线性判别分析Fisher Linear Distrimination
Fisher线性判别分析是一种线性分类方法,它的主要思想是:是类内的方差小,类均值之间相差比较大。(类间大,类内小)以两个类的分类为例:将两个类由在x1,x2上投影到向量u 上,这样由二维转到了一维,然后将两类从两团点的中间分开。如果要使类间相差大的话,那么每个类的平均数之间也会相差大,设分别为加号点和减号点的平均值,那么投影后,他们距离的平方,也就是尽可能大。如果要使类内方差小的话,那么两个类投影到直线(向量)上后,他们的点分别为所以他们的和也要尽可能小因此把大的作为分子,小的原创 2022-01-17 23:59:09 · 2865 阅读 · 0 评论 -
高斯分布的性质(含代码)
多元高斯分布:一元高斯分布:(将多元高斯分布中的D取值1)其中代表的是平均值,是方差的平方,也可以用来表示,是一个对称正定矩阵。--------------------------------------------------------------------------------------------------------------------------------一.不同的平均值对二元高斯分布的影响:平均值不同时,高斯分布的中心不一样。二. 不同...原创 2022-01-17 06:03:22 · 3353 阅读 · 0 评论 -
ROC 曲线讲解 (Receiver Operarating Curve)
概念在信号检测理论中,接收者操作特征曲线(receiver operating characteristic curve,或者叫ROC曲线)是一种坐标图式的分析工具,在同一模型中设置最佳阈值。by WikipediaROC曲线的画法如下图所示,每个点表示不同阈值下 TP(横坐标) FP(纵坐标)的值,TP,FP的定义如下 实际值 ture 真的 false 假的 预测值 ture 真的 TP (true positive)原创 2022-01-15 22:08:54 · 4546 阅读 · 0 评论 -
PCA主成分分析(降维)过程推导
主成分分析的作用是降维。当数据量有多个维度时,有些维度对于数据的贡献大,有些维度对数据的贡献小。通过主成分分析,找到重要的维度,能大大减少计算量。PCA的中心思想:一个中心:原始特征空间的重构。两个基本点:最大投影方差,最小重构距离。--------------------------------------------------------------------------------------------------------------------------------...原创 2021-12-22 08:11:36 · 12592 阅读 · 2 评论 -
偏差(bias)和方差(variance)
偏差:偏差指的是由模型训练得到的结果与真实值之间的差。如果偏差太大,我们就要缩小它,也就是缩小与真实值之间的差异,这样训练的效果会更好。方差:方差指的是由模型训练得到的结果之间的差异。...原创 2021-11-14 23:43:32 · 11811 阅读 · 4 评论 -
吴恩达的机器学习笔记
前面不会使用软件字有点丑,后面好多了。原创 2020-03-10 17:14:15 · 135 阅读 · 0 评论