【机器学习】机器学习常见符号

本文详细介绍机器学习中常见的数学符号及其含义,包括实数集、希尔伯特空间、输入与输出空间、训练数据集、概率分布、假设空间、模型参数、风险函数等,为初学者提供全面的符号解释。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

机器学习常见符号
符号 名称 符号 名称 
R实数集Rnn维实数向量空间 
H希尔伯特空间X输入空间
Y输出空间x∈X输入,实例
y∈Y输出,标记X输入随机变量 
Y输出随机变量T={(x1,y1),(x2,y2),···,(xN,yN)}训练数据集
N 样本容量 (xi,yi)第i个训练数据点
x=(x(1),x(2),···,x(n))T输入向量,n维实数向量 xi(j) 输入向量xi的第j分量
P(X),P(Y)概率分布P(X,Y)联合概率分布
F假设空间f∈F模型,特征函数
θ,ω模型参数ω=(ω1,ω2,···ωn)T权值向量 
b偏置J(f)模型的复杂度
Remp经验风险或经验损失Rexp风险函数或期望损失
L损失函数,拉格朗日函数η学习率
ll·ll1L1范数ll·ll2 L2范数
(x·x') 向量x与x'的内积H(X),H(p)
H(Y|X) 条件熵S分离超平面 
α=(α1,α2,···,αn)T拉格朗日乘子,对偶问题变量αi对偶问题的第i个变量 
K(x,z)核函数 sign(x)符号函数 
I(x)指示函数 Z(x)  规范化因子
### 机器学习常见符号及其含义 #### 数学基础符号机器学习领域,许多数学符号用于表达复杂的算法和模型。一些不太常见符号可能会影响公式的理解与应用[^1]。 - **集合运算符** - $\in$ 表示属于某个集合;$\notin$ 则表示不属于该集合。 - **逻辑运算符** - $\land$ (AND),$\lor$ (OR),$\lnot$ (NOT) - **微积分相关** - $\nabla f(x)$ 表示函数 $f(x)$ 的梯度向量,在优化过程中起到重要作用。 - $\partial/\partial x_i$: 对变量$x_i$求偏导数 - **概率论中的特殊记号** - $P(X=x|Y=y)$ 条件概率分布,给定事件 Y 发生的情况下 X 发生的概率。 - $\mathbb{E}[X]$ 随机变量 X 的期望值。 #### 基础概念符号定义 对于初学者来说,掌握以下几个核心符号有助于更好地理解和实现具体算法: - **权重矩阵 W 和偏差 b**: 在神经网络中用来调整输入数据到输出层之间的映射关系。 - **激活函数 σ(z)** : 将线性组合后的特征通过非线性的变换传递至下一层节点。 - **损失函数 L(y, \hat y)** :衡量预测结果与真实标签之间差异程度的一个量化指标。 ```python import numpy as np def sigmoid(z): """Sigmoid activation function.""" return 1 / (1 + np.exp(-z)) ``` #### 性能评估指标符号说明 当讨论分类器性能时会用到一系列统计量来描述其优劣特性: - **精准率 Precision**:正类样本被正确识别的比例。 \[ P = TP/(TP+FP)\] - **召回率 Recall/Sensitivity/True Positive Rate(TPR):** 实际为正的实例中有多少比例被判别成正例。 \[ R=TP/(TP+FN) \] - **F1 Score:** 综合考虑Precision和Recall两者平衡的结果。 \[ F_1=2*{(P*R)/(P+R)}\] 以上各项均基于混淆矩阵计算得出,其中TP(True Positives), FP(False Positives), TN(True Negatives), FN(False Negatives)[^2]. #### 强化学习特有标记体系 特别地,在强化学习场景下还有一些独特的符号约定: - 动作空间 A(action space) - 状态 s(state) - 策略 π(policy) - 折扣因子 γ(discount factor) - 即时奖励 r(reward signal) - V(s)(value function of state s) 或 Q(s,a)(action-value function given a pair of state-action pairs). 状态转移方程可以写作$s_{t+1}=T(s_t,a_t)$ ,而总回报则由即时奖励加上未来预期收益构成$r_t+\gamma *V(s_{t+1})$ [^3].
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值