
data ming
轩辕小猪
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
数据挖掘初识-简单例子
title: 数据挖掘初识-简单例子date: 2018-10-22 20:31:06updated: 2018-10-22 20:31:06description: 关联度分析+鸢尾花分类categories: 机器学习photo:tags:data mingmusic-id:password:math:关联度分析关联度分析是指给出物品或对象的相似度。主要有以下的...原创 2019-02-11 16:22:08 · 2025 阅读 · 0 评论 -
K近邻算法样例
K近邻算法介绍在模式识别领域,K近邻算法是一种用于分类和回归的非参数统计法。在这两种情况下,输入包含特征空间(Feature Space)中的k个最接近的训练样本。在k-NN分类中,输出是一个分类族群。一个对象的分类是由其邻居的“多数表决”确定的,k个最近邻居(k为正整数,通常较小)中最常见的分类决定了赋予该对象的类别。若k = 1,则该对象的类别直接由最近的一个节点赋予。在k-NN回归中...原创 2019-02-12 11:01:12 · 355 阅读 · 0 评论 -
决策树算法预测NBA赛事结果
决策树算法介绍决策树(decision tree)是一个树结构(可以是二叉树或非二叉树)。其每个非叶节点表示一个特征属性上的测试,每个分支代表这个特征属性在某个值域上的输出,而每个叶节点存放一个类别。使用决策树进行决策的过程就是从根节点开始,测试待分类项中相应的特征属性,并按照其值选择输出分支,直到到达叶子节点,将叶子节点存放的类别作为决策结果。总结来说:决策树模型核心是下面几部分:...原创 2019-02-12 15:04:25 · 28743 阅读 · 1 评论 -
Apriori算法在电影推荐中的运用
Apriori算法介绍Apriori算法是常用的用于挖掘出数据关联规则的算法,它用来找出数据值中频繁出现的数据集合,找出这些集合的模式有助于我们做一些决策。对于关联度分析,我们首先会用Apriori算法去产生频繁项集。第二步,我们通过其中的频繁项集测试其前提和条件,进而创建关联的规则。对于第一步,Apriori算法需要一个最小的支持度作为基准。低于这个最小支持度就舍去不考虑。第二步,在得...原创 2019-02-12 16:19:04 · 5646 阅读 · 3 评论 -
主成分分析提取好的特征
主成分分析PCA顾名思义,就是找出数据里最主要的方面,用数据里最主要的方面来代替原始数据。具体的,假如我们的数据集是 n维的,共有 m 个数据 (x_{1},x_{2},…,x_{m}) 。我们希望将这 m 个数据的维度从 n 维降到 n’ 维,希望这 m 个 n’ 维的数据集尽可能的代表原始数据集。我们知道数据从 n 维降到 n’ 维肯定会有损失,但是我们希望损失尽可能的小。成人收入分析...原创 2019-02-24 14:36:34 · 2543 阅读 · 0 评论