目录
机器学习基础
机器学习概览
什么是机器学习?
机器学习是人工智能的一个分支,它使计算机能够从经验中自动“学习”而无需明确编程。简而言之,机器学习是一种让计算机通过数据进行自我改进的方法。
机器学习的应用领域
机器学习的应用非常广泛,涵盖了从图像识别、语音识别到自然语言处理等多个领域。具体应用包括:
图像识别:用于人脸识别、物体检测等。
语音识别:用于语音助手、语音转文字等。
自然语言处理:用于情感分析、机器翻译、聊天机器人等。
推荐系统:用于电子商务网站上的产品推荐。
欺诈检测:用于信用卡欺诈检测、网络攻击检测等。
机器学习的主要类型
监督学习
给定带有标签的数据集,学习如何预测未知数据的标签
无监督学习
没有标签的数据集,目标是从数据中发现潜在的结构
半监督学习
介于监督学习和无监督学习之间,数据集包含少量带标签的数据和大量未带标签的数据。
强化学习
智能体通过与环境互动学习策略,以最大化某种累积奖励。
数学基础复习
NO.1线性代数复习
详细请看我的《线性代数》专栏
向量
矩阵运算
特征值与特征向量
NO.2概率与统计复习
概率统计基础
详细请看我的《概率论》专栏
一、概率de基本概念:
1.随机试验:
具有不确定结果的试验称为随机试验。
2.样本空间:
随机试验的所有可能结果组成的集合。
3..事件:
样本空间的子集。
4.古典概率:
当所有可能的结果都等可能发生时,事件A的概率定义为:
5.条件概率:
事件B发生条件下事件A发生的概率定义为:
6.独立事件:
若
则事件A和B相互独立。
7.贝叶斯定理:
贝叶斯定理是条件概率的一种重要应用,它描述了根据某些证据或观察更新对某事件的概率估计的过程。
其中P(A|B) 是在已知B发生的情况下A发生的概率;P(B|A) 是在已知A发生的情况下B发生的概率;P(A)是A发生的先验概率;P(B)是B发生的边缘概率。
8.随机变量:
离散随机变量:取值为可数集合的随机变量。(当我们说一个集合是“可数”的时候,这意味着这个集合中的元素可以通过自然数来一一对应。换句话说,如果一个集合中的元素可以用自然数来编号,那么这个集合就是可数的)
连续随机变量:取值为实数区间内的随机变量。
概率质量函数 (PMF):对于离散随机变量X ,
概率密度函数 (PDF):对于连续随机变量X ,
累积分布函数 (CDF):
9.期望与方差:
期望:随机变量的平均值。
方差:衡量随机变量与其均值的偏离程度。
10.协方差与相关系数:
协方差:衡量两个随机变量之间线性关系的强度。
相关系数:标准化的协方差,范围在\(-1\)到\(1\)之间。
二、统计推断de基本概念
参数估计:基于样本数据估计总体参数。
点估计:使用样本统计量来估计总体参数。
区间估计:构造一个包含总体参数的置信区间。
假设检验:根据样本数据判断关于总体参数的假设是否合理。
原假设:待检验的假设。
备择假设:与原假设相对立的假设。
显著性水平:犯第一类错误的概率阈值。
常用分布:
正态分布:参数为均值和方差
的连续概率分布。
二项分布:次伯努利试验中成功次数的概率分布。
泊松分布:在一定时间内事件发生次数的概率分布。
指数分布:等待某个事件发生的时间间隔的概率分布。
三、例题
例题 1:
假设一个骰子被投掷一次,计算出现偶数的概率。
解:
样本空间。
事件 A 表示出现偶数:。
因此,。
例题 2:
假设有一个二项分布,其中n = 10 ,p = 0.3 ,计算恰好有 3 次成功的概率。
解:
二项