
机器学习
a15957199647
这个作者很懒,什么都没留下…
展开
-
K-近邻算法
K-近邻算法原理:在一组样本数据中,每一个数据都有标签,然后输入没有标签的数据,通过输入数据的各个特征和样本数据进行比较,用算法分析出最合适输入数据的标签。 一般选择样本中k个相似的数据,最后选择k个中出现次数最多的标签,作为新输入数据的标签。 一般做法: step.1—计算未知样本和每个训练样本的距离dist step.2—得到dist,对dist进行排序 step.3—选取与当前点距离原创 2017-06-27 22:14:06 · 209 阅读 · 0 评论 -
决策树(decision tree)
决策树就是像树结构一样的分类下去,最后来预测输入样本的属于那类标签。 本文是本人的学习笔记,所以有些地方也不是很清楚。 大概流程就是 1. 查看子类是否属于同一个类 2. 如果是,返回类标签,如果不是,找到最佳的分类子集的特征 3. 划分数据集 4. 创建分支节点 5. 对每一个节点重复上述步骤 6. 返回树首先我们要像一个办法,怎么来原创 2017-07-10 22:48:23 · 355 阅读 · 0 评论 -
logistic regression
logistic regression就是逻辑回归。感觉上就是把数据进行分类,然后对输入样本进行预测。 为了区分许多邮件中存在的垃圾邮件, 我们假设: y = 1 不是垃圾邮件 y = 0 是垃圾邮件 要是y只能去0或1,提出了sigmoid函数 定义: g(z) >= 0.5, y=1 g(z) < 0.5, y=原创 2017-07-20 22:33:35 · 464 阅读 · 0 评论