- 博客(2)
- 收藏
- 关注
原创 【西瓜书+南瓜书】第3章学习笔记
信息论:以概率论、随机过程为基本研究工具,研究广义通信系统的整个过程。常见的应用有无损数据压缩(如ZIP文件)、有损数据压缩(如MP3和JPEG)等。相对熵 (KL散度):度量两个分布的差异,其典型使用场景是用来度量理想分布。信息熵(自信息的期望): 度量随机变量X的不确定性,信息熵越大越不确定。当 b=2 时单位为bit,当b = e时单位为nat。a的模长的平方,相当于a的转置乘以a。(此处以离散型为例)计算信息熵时约定: 若。
2023-11-19 17:48:59
76
原创 西瓜书+南瓜书【 第0章 导学 】【第1章 绪论】笔记
数据集通常用集合来表示,令集合D={x1,x2,...,xm}表示包含m个样本的数据集,一般同一份数据集中的每个样本都含有相同个数的特征,假设此数据集中的每个样本都含有d个特征,则第i个样本的数学表示为d维向量(xi1,xi2;:在”房价预测”的例子中,当选用一元线性回归算法时.学得的模型是一元一次函数,当选用多项式回归算法时,学得的模型是一元二次函数,所以不同的机器学习算法有不同的偏好,我们称为“归纳偏好”。:表示样本的特征向量所在的空间为样本空间,也称为“输入空间”或“属性空间”。
2023-11-14 16:24:58
102
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人