机器学习及低分段淘汰人总结

在这里插入图片描述
296 总共4人剩余1人
在这里插入图片描述
297 5人剩余2人
在这里插入图片描述
在这里插入图片描述
298 2人剩余1人
在这里插入图片描述
301 1人被淘汰
304 2人都没有被淘汰,最低一人复试分70.66
总共 复试91人,录取69人,其中淘汰了4人

问题

1、线性回归的基本原理是什么,采用的损失函数是什么

学习分类

其学习形式主要分为:有监督学习、无监督学习、半监督学习

有监督

有监督学习(supervised learning),需要你事先需要准备好要输入数据(训练样本)与真实的输出结果(参考答案)

预测结果分类

比如有监督学习可以划分为:回归问题和分类问题
如果预测结果是离散的,通常为分类问题,而为连续的,则是回归问题。

机器学习的专业术语

  1. 模型:模型这一词语将会贯穿整个教程的始末,它是机器学习中的核心概念。
  2. 数据集
  3. 样本&特征
  4. 向量
  5. 矩阵:矩阵看成由向量组成的二维数组

假设函数和损失函数

  1. 假设函数:假设函数(Hypothesis Function)可表述为 y=f(x) 其中 x 表示输入数据,而 y 表示输出的预测结果
  2. 损失函数:损失函数(Loss Function)又叫目标函数,简写为 L(x),这里的 x 是假设函数得出的预测结果“y”,如果 L(x) 的返回值越大就表示预测结果与实际偏差越大,越小则证明预测值越来越“逼近”真实值,
  3. 优化方法:“优化方法”可以理解为假设函数和损失函数之间的沟通桥梁。

拟合&过拟合&欠拟合

1)拟合:形象地说,“拟合”就是把平面坐标系中一系列散落的点,用一条光滑的曲线连接起来,因此拟合也被称为“曲线拟合”。
2) 过拟合:过拟合(overfitting)与是机器学习模型训练过程中经常遇到的问题,所谓过拟合,通俗来讲就是模型的泛化能力较差,也就是过拟合的模型在训练样本中表现优越,但是在验证数据以及测试数据集中表现不佳。过拟合问题在机器学习中经常遇到,主要是因为训练时样本过少,特征值过多导致的,后续还会详细介绍。
3) 欠拟合:欠拟合(underfitting)恰好与过拟合相反,它指的是“曲线”不能很好的“拟合”数据。

基本的人工智能工具的介绍与使用

详细介绍见复试文件夹中语雀文档

1 python

2 numpy (矩阵计算)

在这里插入图片描述

3 pandas(读取文件)

在这里插入图片描述

4 Matplotlib(数据可视化)

在这里插入图片描述

5 Scikit-Learn(算法库)

在这里插入图片描述

线性回归

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

利用梯度下降法求极小值

计算的过程比较复杂且涉及数学公式
所以我简单总结一下:就是
在这里插入图片描述
重复计算红点处的斜率,并通过不断的迭代,最终找到极小值

Sklearn求解线性回归问题

基于generated_data.csv数据,建立线性回归模型,预测x=3.5对应的y值,评估模型表现。
学会用Sklearn求解线性回归问题,寻找a、b (y = ax + b) 并且评估模型的好坏。
数据如下:

#加载数据
import pandas as pd
data = pd.read_csv('generated_data.csv')
data.head()
x = data.loc[:,'x']// 分别看下x和y的数值
y = data.loc[:,'y']
print(x,y)

#visualize the data
from matplotlib import pyplot as plt
plt.figure
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值