
机器学习面试点总结
文章平均质量分 66
Spring_04
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
LDA
LDA简介原创 2018-02-07 15:54:01 · 518 阅读 · 0 评论 -
学习曲线的解读
学习曲线的解读学习曲线是什么?学习曲线就是通过画出不同训练集大小时训练集和交叉验证的准确率,可以看到模型在新数据上的表现,进而来判断模型是否方差偏高或偏差过高,以及增大训练集是否可以减小过拟合。怎么解读?1、当训练集和测试集的误差收敛但却很高时,为高偏差。 左上角的偏差很高,训练集和验证集的准确率都很低,很可能是欠拟合。 我们可以增加模型参数,比如,原创 2018-02-07 14:37:40 · 3198 阅读 · 0 评论 -
集成学习
集成学习1.Bagging1.1 随机森林RF1.2 随机森林优缺点1.3 Bagging与RF区别2.Boosting2.1 Boosting和Bagging区别2.2 AdaBoost2.3 提升树Boosting Tree2.4 梯度提升决策树Gradient Boosting Decision Tree2.4 GBDT原创 2018-02-07 15:42:27 · 723 阅读 · 2 评论 -
机器学习概论
机器学习概论原创 2018-02-07 14:58:16 · 257 阅读 · 0 评论 -
偏差-方差权衡
偏差-方差权衡偏差表示了学习算法的期望预测输出与真实输出的偏离程度,刻画了学习算法本身的拟合能力,反映了模型的准确性;方差表示了同样大小的训练集的变动所导致的学习性能的变化,刻画了数据扰动所造成的影响,反映了模型的稳定性;噪声表示给定学习任务下任何学习算法的期望泛化误差下界,反映了学习任务本身的难度。类似于打靶射击:偏差小方差大表示打的靶都在靶心附近,瞄的准但是原创 2018-02-07 14:42:50 · 954 阅读 · 0 评论 -
LR与SVM的区别
LR与SVM的区别相同点:1.LR和SVM都是分类算法;2.如果不考虑核函数,LR和SVM都是线性分类算法,即它们的分类决策函数都是线性的;3.LR和SVM都是监督学习算法;4.LR和SVM都是判别模型。不同点:1.从目标函数来看,LR采用的是对数损失函数,SVM采用的是合页损失函数。这两个损失函数的目的都是增加对分类影响较大原创 2018-02-07 14:39:06 · 854 阅读 · 0 评论 -
机器学习性能评估指标
机器学习性能评估指标原创 2018-02-07 14:06:35 · 243 阅读 · 0 评论 -
推荐系统
推荐系统1 什么是推荐系统如果一个用户有明确的需求,比如想买一包花生米,那么他可以去便利店根据分类牌找到自己的喜欢牌子的花生米,或者在淘宝上利用搜索引擎直接寻找。但是,如果用户没有明确的需求时,比如说,你今天很无聊,想下载一部电影看看。但是当你打开某个下载网站时,面对100年来发行的数不胜数的电影,你会手足无措,不知道该看哪一部。此时,你遇到了信息过载的问题,需要一个工具来帮助你做筛选,它原创 2018-02-07 13:41:38 · 1870 阅读 · 0 评论 -
机器学习常用算法的调用
机器学习常用算法的调用一、线性回归(LinearRegression)线性回归是利用连续性变量来估计实际数值(例如房价,呼叫次数和总销售额等)。我们通过线性回归算法找出自变量和因变量间的最佳线性关系,图形上可以确定一条最佳直线。这条最佳直线就是回归线。这个回归关系可以用Y=aX+b表示。Python代码:from sklearn import linear_modelx_t原创 2018-02-07 11:59:13 · 1907 阅读 · 0 评论 -
k-means算法、性能及优化
k-means算法、性能及优化一、k-means算法简介k-means是用来解决著名的聚类问题的最简单的非监督学习算法之一。该过程遵循一个简易的方式,将一组数据划分为预先设定好的k个簇。其主要思想是为每个簇定义一个质心。设置这些质心需要一些技巧,因为不同的位置会产生不同的聚类结果。因此,较好的选择是使它们互相之间尽可能远。接下来将数据中的每个点归类为距它最近的质心,距离的计原创 2017-12-14 16:31:15 · 16018 阅读 · 5 评论 -
特征工程
特征工程1 特征工程是什么?2 数据预处理2.1 无量纲化2.1.1 标准化2.1.2 区间缩放法2.1.3 标准化与归一化的区别2.2 对定量特征二值化2.3 对定性特征哑编码2.4 缺失值计算2.5 数据变换2.6 回顾3 特征选择3.1 Filter3.1.1 方差选择法3.1.2翻译 2017-12-26 19:16:04 · 301 阅读 · 0 评论 -
如何进行特征选择
如何进行特征选择原文地址:http://blog.youkuaiyun.com/u010670689/article/details/73196546特征选择对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点、底层结构,这对进一步改善模型、算法都有着重要作用。当数据预处理完成后,我们需要选择有意义的特征输入机器学习的算法和模型进行训练转载 2017-12-15 14:59:56 · 22159 阅读 · 1 评论 -
机器学习性能优化方法
原文地址:http://blog.youkuaiyun.com/han_xiaoyang/article/details/53453145机器学习最有价值(实际应用最广)的部分是预测性建模。也就是在历史数据上进行训练,在新数据上做出预测。 而预测性建模的首要问题是:如何才能获得更好的结果?为此,我们整理了一份备忘清单,用于提升机器学习算法的性能。该清单主要分为以下4个子主题:①基于数据改善性能②借转载 2017-12-14 10:12:43 · 955 阅读 · 0 评论 -
PCA
PCA简介原创 2018-02-08 10:57:13 · 376 阅读 · 0 评论