- 博客(16)
- 收藏
- 关注
原创 FAQ
关于一些常见的问题一. SVM和逻辑回归的区别 参考博客11.LR采用log损失, SVM采用合页损失. 2. LR对异常值敏感, SVM对异常值不敏感.3.LR需要较多的样本进行训练, 而训练集较小时, SVM也使适用4.LR模型找到的那个超平面, 是尽量让所有的点都远离他, 而SVM寻找的那个超平面只让最靠近中间分割线的那些点尽量...
2018-10-26 18:03:15
533
原创 C: 算法总结-----应用场景与优缺点
说明: 根据日常项目经验整理, 有些本人不常用的信息可能不是很全. 欢迎补充 一.监督学习算法 K-近邻 线性模型 朴素贝叶斯 说明 即邻居个数,一般用较小的邻居得到比较好的结果. 默认距离 1.尤其是回归模型中正则化的调节非常重要 ...
2018-10-26 17:47:45
1874
原创 决策树
项目: 按照 某种参数(Gini) 去递归 某种规则(建立子节点) 而我们要做的就是知道参数在怎么求, 掌握XX规则. 笔记整理时间:2018.10-11周四一.算法1.原理,应用基本思想:取净现值的期望大于零的概率,评价项目风险,判断其可行性的决策分析方法。在机器学习中是一个预测模型。Entropy=系统的凌乱程度, 使...
2018-10-24 20:26:36
642
原创 核支持向量机制
项目:[SVM]监督学习模型 笔记整理时间:2018.10-11周四一. 算法1.原理,应用什么是?SVM一般是用来分类的(一般先分为两类,再向多类推广一生二,二生三,三生万物哈)基本思想:SVM最基本的应用是分类。 求解最优的分类面,然后用于分类。最优分类面的定义: 对于SVM,存在一个分类面,两个点集到此平面的最小距离最大,两...
2018-10-18 14:38:33
253
原创 特征工程: 非负矩阵分解 (附: VQ, PCA, NMF)
附:VQ,PCA,NMF通俗点说,VQ是用一张完整的图像直接代表源脸部图像; PCA是将几个完整人脸加减压成一张脸;而NMF是取甲的眼睛,乙的鼻子,丙的嘴巴直接拼成一张脸。这样解释虽然细节上略有不妥,但不失其概念上的意义。一。非负矩阵分解(NMF)1.原理,应用简介什么是?NMF是由Lee和Seung在自然杂志上提出的一种矩阵分解方法,它使得分解后的所有分量均为非负值,并且同时实现...
2018-10-17 18:09:31
4965
原创 主成成分分析
一. 主成成分分析1. 原理分析, 应用(应用举例)什么是?PCA是一种统计方法, 通过正交 变换将一组可能存在相关性的变量转换为一组线性不相关的变量, 转换后的这组变量叫做主成分. (通俗的说就是将原来的线性相关的P个指标, 重新组合成一组线性不相关的综合指标来代替原来的指标)PCA首先是由K.皮尔森对非随机变量引入的, 然后K.皮尔森将此方法推广到随机向量的情形. 信息的大小通...
2018-10-16 20:02:16
4985
原创 项目管理利器:maven
1. maven介绍及环境搭建maven是基于项目对象模型(POM),可以通过一小段描述信息来管理项目的构建、报告和文档的软件项目管理工具。 maven下载链接maven目录简介: bin:mvn的运行脚本。 windows命令行中输入mvn会调用这些脚本。 boot: 包含类加载器的框架。 maven使用它来加载自己的类库。 conf: 配置文件。 比如以后经常会用到的set...
2018-10-09 11:23:24
162
原创 H3C第一天----书 大数据技术原理与应用
前端框架:A、bootstrap乘车路线:考勤制度:其他:key words:1. spark 专为大规模数据处理而设计的快速通用的计算引擎。是开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机...
2018-07-05 22:33:22
265
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人