- 博客(6)
- 收藏
- 关注
原创 K-means聚类算法的代码实现和算法过程的详细分析
K-means聚类算法1.聚类的了解 聚类是一种无监督的学习,它将相似的对象归到同一个簇中。它有点像全自动分类。 聚类与分类的最大不同在于,分类的目标事先已知,而聚类则不一样2.K-均值聚类的算法优点:容易实现缺点:可能收敛到局部最小值,在大规模数据集上收敛较慢适用数据类型:数据型数据K-均值的算法工作流程:随机确定K个初始点作为质心。将数据集中在每个点分配到一个簇中...
2018-12-19 21:18:28
1203
原创 logistic回归
logistic回归1. logistic回归的基本思想 logistic回归是一种分类方法,用于两分类问题。其基本思想为:a. 寻找合适的假设函数,即分类函数,用以预测输入数据的判断结果;b. 构造代价函数,即损失函数,用以表示预测的输出结果与训练数据的实际类别之间的偏差;c. 最小化代价函数,从而获取最优的模型参数。 2. 逻辑回归的过程逻辑函数(sigmoid函数):...
2018-10-27 16:32:00
674
原创 线性回归
线性回归线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。其表达形式为y = w’x+e,e为误差服从均值为0的正态分布。回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。一...
2018-10-20 18:42:49
197
原创 最大似然估计
最大似然估计图列:总结:我认为目前对我最有用的是在考研必考的一道大题,学习了最大似然估计让我了解到机器学习的最大似然估计只是一种概率论在统计学的应用,它是参数估计的方法之一。说的是已知某个随机样本满足某种概率分布,但是其中具体的参数不清楚,参数估计就是通过若干次试验,观察其结果,利用结果推出参数的大概值。最大似然估计是建立在这样的思想上:已知某个参数能使这个样本出现的概率最大,我们当...
2018-10-05 18:21:03
23539
原创 均方误差
均方误差具体情况分析相合估计(或一致估计)是在大样本下评价估计量的标准,在样本量不是很多时,人们更加倾向于基于小样本的评价标准,此时,对无偏估计使用方差,对有偏估计使用均方误差。一般地,在样本量一定时,评价一个点估计的好坏标准使用的指标总是点估计yˆ与参数真值y的距离的函数,最常用的函数是距离的平方,由于估计量yˆ具有随机性,可以对该函数求期望.均方误差是评价点估计的最一般的标准,自然,...
2018-09-24 09:25:36
3528
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人