
基础机器学习算法及其实现
在我经历秋招之后,趁着最近空闲时间,对于基础的机器学习算法进行梳理,并且使用Python进行实现
seeInfinite
这个作者很懒,什么都没留下…
展开
-
Python不调包实现逻辑回归和自动求导
导言逻辑回归是机器学习中最基础也最常用的模型一句话介绍LR:逻辑回归假设数据服从伯努利分布,通过极大化似然函数的方法,运用梯度下降来求解参数,来达到将数据二分类的目的。LR具体的推导可以参考李航老师的统计学习方法为什么LR损失函数不选MSE,而采用极大似然估计(即交叉熵损失)参考:https://www.cnblogs.com/smartwhite/p/9109815.html对于...原创 2020-01-29 19:19:35 · 1872 阅读 · 1 评论 -
Tensorflow实现knn算法
导言knn是一个比较简单的机器学习算法,区别于其他算法,它没有显式的模型训练过程,模型直观简单,但是它的预测耗时较长(因为需要与所有训练样本进行举例计算,找出最近的k个训练样本进行投票,所有耗时久)。KNN中有一个比较重要的数据结构—KD树,用来优化这一过程,KD树在许多这类找最近k个样例的问题中,都有广泛的应用。KNN相关问题1、k值设定为多大?k太小,分类结果易受噪声点影响(模型复杂...原创 2020-01-28 19:03:11 · 1510 阅读 · 0 评论 -
numpy实现kmeans算法
导言基于numpy实现的kmeans要比基于TensorFlow的好写,基于TensorFlow的实现可以参考我的这篇博文:https://blog.youkuaiyun.com/qq_41058526/article/details/104093115具体实现import numpy as npimport copyimport random# 计算两个向量之间距离def ca...原创 2020-01-28 00:28:51 · 1274 阅读 · 0 评论 -
TensorFlow实现kmeans算法(字节跳动面试题)
目录导言关于Kmeanskmeans本质是EM算法的特殊情况Kmeans收敛性证明为什么在计算k-means之前要将数据点在各维度上归一化k-means不适用哪些数据(异常值对聚类中心影响很大,需要离群点检测和剔除)K值选择质心选择时间复杂度伪代码具体实现导言这题是我今年秋招面试字节跳动遇到的题,当时比较紧张,磕磕绊绊写了个大概,面试完后我又整理...原创 2020-01-27 16:10:54 · 3034 阅读 · 1 评论