机器学习(一)-机器学习入门

名词

训练集 测试集
特征 数值型、二值型、枚举型
目标变量 标称型、连续型

监督学习

分类和回归。这类算法知道预测什么,及分类

无监督学习

没有类别信息,也没有目标值。做聚类
在这里插入图片描述

算法选择

  1. 考虑算法的目的 -> 预测值:监督学习 否则:无监督学习
  2. 目标变量类型:
    监督:
    如果目标变量是离散型的,如是/否、1/2/3、A/B/C,则选择分类器算法
    如果目标变量是连续型的,如-999~999,则选择回归算法
    非监督:
    需要划分为离散组,则使用聚类算法
    需要估计数据和每组的相似程度,则使用密度估计算法
  3. 数据:
    特征值是离散还是连续型的,缺失值、异常值

步骤

  1. 收集数据
  2. 准备输入数据
  3. 分析输入数据
  4. 训练算法
  5. 测试算法
  6. 使用算法

NumPy函数库

from numpy import *
rendMat = mat(random.rand(4,4)) //生成一个4,4矩阵
invRendMat = rendMat.I //生成rendMat的逆矩阵
myEye = rendMat * invRendMat
myEye - eye(4) //查看误差值,eye(4)生成了4*4的单位矩阵

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值