
机器学习实战
文章平均质量分 86
西湖太极熊
一切用数据说话,用产品触达心灵!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
我在阿里做数据分析师,一位阿里数据分析师的日常
截止今天我离开阿里已经有5个年头了,在阿里的1000多个日子里,我一直从事数据分析师的工作。 今天总结一下过去的工作日常,详细讲述一下我的日常工作中都做了些什么?主要用到哪些分析工具,分析方法,锻炼了哪些能力,日常用作会运用到哪些能力呢? 1、快速熟悉业务和数据库数据 在刚进入阿里的时候,我进入一个事业部作为一个运营数据分析师,负责部门部分业务。首先,和大多数公司一样会有导师和很多非常nice的同事先帮助你了解你所在部门的业务,当然在阿里你需要更快速的进入状态了解业务,当你初步了解业务之后,作为一个分析.原创 2021-03-31 10:36:54 · 539 阅读 · 0 评论 -
机器学习实战:K-近邻算法(KNN)
KNN K-近邻算法原理 欧几里得距离公式: 伪代码原理 计算已知类别数据集中的点与当前点之间的距离 按照距离递增次序排序 选取与当前点距离最小的K个点 确定前K个点所在类别的出现频率 返回前K个点出现频率最高的类别作为当前点的预测分类 详细代码 #coding=utf-8 ''' 列表:创建一个列表,只要把逗号分隔的不同的数据项使用方括号括起来即可。如下:labe...原创 2018-04-20 14:29:50 · 352 阅读 · 0 评论 -
机器学习实战:降维方法
降维方法 主成分分析(Principal Component Analysis,PCA) 因子分析(Factor Analysis) 独立成分分析(Independent Component Analysis,ICA) 主成分分析:PCA 伪代码如下 去除平均值 计算协方差矩阵 计算协方差矩阵的特征值和特征向量 将特征值从大到小排序 保留最上面的N个特征向量 将数据转换到上述N个...原创 2018-04-20 14:04:55 · 574 阅读 · 0 评论 -
机器学习实战
机器学习十大算法 KNN算法 算法原理 k-近邻算法采用测量不同特征值之间的距离方法进行分类。 距离公式:欧氏距离 伪代码 计算已知类别数据集中的点与当前点之间的距离; 按照距离递增次序排序; 选取与当前点距离最小的k个点; 确定前k个点所在类别的出现频率; 返回前k个点出现频率最高的类别作为当前点的预测分类; def classify0(inX,dataSet,la...原创 2018-04-25 14:03:09 · 390 阅读 · 0 评论