机器学习速成第一集——机器学习基础

目录

机器学习基础

机器学习概览

什么是机器学习?

机器学习的应用领域

机器学习的主要类型

监督学习

无监督学习

半监督学习

强化学习

数学基础复习

NO.1线性代数复习

向量

矩阵运算

特征值与特征向量

NO.2概率与统计复习

概率统计基础

一、概率de基本概念:

1.随机试验:

2.样本空间:

3..事件:

4.古典概率:

5.条件概率:

6.独立事件:

7.贝叶斯定理:

8.随机变量:

9.期望与方差:

10.协方差与相关系数:

二、统计推断de基本概念

三、例题

例题 1:

例题 2:

例题 3:

NO.3 微积分复习

微积分基础

 1. 导数与微分

2. 积分

3. 多元微积分

Python编程基础

NumPy库介绍

创建数组:​编辑

数组属性:

数组操作:

数组索引与切片:​编辑

数组重塑:​编辑

数组堆叠:​编辑

数组分割:​编辑

统计函数:​编辑

Pandas库介绍

创建Series:

创建DataFrame:

查看数据信息:

数据筛选:

数据清洗:

数据聚合:

数据合并:

数据排序:

数据分组求和:

实操: 

数据: 

 单组结果:

 多组结果:

总代码: 

Matplotlib或Seaborn库介绍

数据可视化

Matplotlib

安装 Matplotlib

导入 Matplotlib

基本绘图

​编辑

Seaborn

安装 Seaborn

导入 Seaborn

基本绘图

热力图

​编辑

箱型图

​编辑

小提琴图


机器学习基础

机器学习概览

什么是机器学习?

机器学习是人工智能的一个分支,它使计算机能够从经验中自动“学习”而无需明确编程。简而言之,机器学习是一种让计算机通过数据进行自我改进的方法。

机器学习的应用领域

机器学习的应用非常广泛,涵盖了从图像识别、语音识别到自然语言处理等多个领域。具体应用包括:

图像识别:用于人脸识别、物体检测等。

语音识别:用于语音助手、语音转文字等。

自然语言处理:用于情感分析、机器翻译、聊天机器人等。

推荐系统:用于电子商务网站上的产品推荐。

欺诈检测:用于信用卡欺诈检测、网络攻击检测等。

机器学习的主要类型

监督学习

给定带有标签的数据集,学习如何预测未知数据的标签

无监督学习

没有标签的数据集,目标是从数据中发现潜在的结构

半监督学习

介于监督学习和无监督学习之间,数据集包含少量带标签的数据和大量未带标签的数据。

强化学习

智能体通过与环境互动学习策略,以最大化某种累积奖励。

数学基础复习

NO.1线性代数复习

详细请看我的《线性代数》专栏

向量

矩阵运算

特征值与特征向量

NO.2概率与统计复习

概率统计基础

详细请看我的《概率论》专栏

一、概率de基本概念:
1.随机试验:

具有不确定结果的试验称为随机试验。

2.样本空间:

随机试验的所有可能结果组成的集合。

3..事件:

样本空间的子集。

4.古典概率:

当所有可能的结果都等可能发生时,事件A的概率定义为:
 

5.条件概率:

事件B发生条件下事件A发生的概率定义为:
 

6.独立事件:

则事件A和B相互独立。

7.贝叶斯定理:

贝叶斯定理是条件概率的一种重要应用,它描述了根据某些证据或观察更新对某事件的概率估计的过程。
 
  其中P(A|B) 是在已知B发生的情况下A发生的概率;P(B|A) 是在已知A发生的情况下B发生的概率;P(A)是A发生的先验概率;P(B)是B发生的边缘概率。

8.随机变量:


离散随机变量:取值为可数集合的随机变量。

(当我们说一个集合是“可数”的时候,这意味着这个集合中的元素可以通过自然数来一一对应。换句话说,如果一个集合中的元素可以用自然数来编号,那么这个集合就是可数的)


连续随机变量:取值为实数区间内的随机变量。


概率质量函数 (PMF):对于离散随机变量X ,
概率密度函数 (PDF):对于连续随机变量X ,


累积分布函数 (CDF):

9.期望与方差:


期望:随机变量的平均值。
 
方差:衡量随机变量与其均值的偏离程度。
 

10.协方差与相关系数:


协方差:衡量两个随机变量之间线性关系的强度。

相关系数:标准化的协方差,范围在\(-1\)到\(1\)之间。
 

二、统计推断de基本概念

参数估计:基于样本数据估计总体参数。
点估计:使用样本统计量来估计总体参数。
区间估计:构造一个包含总体参数的置信区间。
假设检验:根据样本数据判断关于总体参数的假设是否合理。
原假设 H_0:待检验的假设。
备择假设 H_1:与原假设相对立的假设。
显著性水平 \alpha:犯第一类错误的概率阈值。

常用分布:
正态分布:参数为均值\mu和方差\sigma^2的连续概率分布。
二项分布:n次伯努利试验中成功次数的概率分布。
泊松分布:在一定时间内事件发生次数的概率分布。
指数分布:等待某个事件发生的时间间隔的概率分布。

三、例题
例题 1:

假设一个骰子被投掷一次,计算出现偶数的概率。

解:
样本空间 S = \{1, 2, 3, 4, 5, 6\}
事件 A  表示出现偶数: A = \{2, 4, 6\}
因此,P(A) = \frac{|A|}{|S|} = \frac{3}{6} = \frac{1}{2}

例题 2:

假设有一个二项分布B(n, p),其中n = 10 ,p = 0.3 ,计算恰好有 3 次成功的概率。

解:
二项

评论 39
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

不到w粉不改名

谢谢大佬的赏识!!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值