- 博客(7)
- 收藏
- 关注
原创 动态系统的协同控制 (二、问题建立)
考虑一组由 qqq 辆车组成的系统: ϕ˙i=fi(ϕi,vi),ψi=hi(ϕi)(1) \dot{\phi}_i = f_i(\phi_i, v_i), \quad \psi_i = h_i(\phi_i)\tag{1} ϕ˙i=fi(ϕi,vi),ψi=hi(ϕi)(1)ϕi\phi_iϕi :原始状态变量(整车的“完整状态”); ϕ˙i\dot{\phi}_iϕ˙i:状态随时间的变化速度; ψi(t)∈Rm\psi_i(t) \in \mathbb{R}^mψi(t)∈Rm
2025-03-31 19:23:28
320
原创 带截断反馈的学习中的泛化误差界
截断反馈:指部分数据无法被观测到或只有一部分数据可被反馈。披露区域:系统能观察到的部分数据。截断区域:系统无法观察到的部分数据。每个智能体有一个特征xxx和一个真实标签yyy。用大写XXX和YYY分别表示对应的随机变量,使用小写xxx和yyy表示它们的具体取值。定义合格(不合格)样本的比例分别为p1p_1p1p0p_0p0决策者从一个已实现的初始/历史训练数据集开始,该数据集包含每个标签yyy的nyn_ynyn0n_0n0。
2024-12-15 14:33:30
577
原创 层级增强和蒸馏用于类增量的音视频识别
类增量音视频视频识别 (CIAVVR) 的目标是在学习新的视频类别时,尽可能避免忘记旧类别的知识。形式化地表示为,给定一个任务序列。
2024-12-13 15:44:18
612
原创 智能体的社会化学习
合作中的社交能力 问题设定 设 A={A1,A2,⋯ ,AN}A = \{A_1, A_2, \cdots, A_N\}A={A1,A2,⋯,AN} 表示一个包含 NNN 个智能体的集合。XXX 是输入空间,YYY 是标签空间。第 nnn 个智能体的唯一数据记为 DAn={xi,yi}i=1MAn, D_{A_n} = \{x_i, y_i\}_{i=1}^{M_{A_n}}, DAn={xi,yi}i=1MAn, 其中 MAnM_{A_n}MAn 表示 AnA_nAn 的样本总数
2024-11-27 21:26:40
847
原创 协作式多智能体系统中的泛化
协作式多智能体系统中的泛化 ——协作式多智能体系统的组合泛化的理论基础 MMDPMMDPMMDP(Multi-Agent Markov Decision Process,多智能体马尔可夫决策过程)是一种用于描述多智能体系统中的决策问题的数学模型。与传统的单智能体马尔可夫决策过程(MDP)相比,MMDP涉及多个智能体在共享环境中相互作用。以下是MMDP的几个关键特点: 状态空间(State Space):MMDP的状态空间通常由所有智能体的状态组成,即 S=S1×S2×⋯×SnS = S_1 \times
2024-11-26 22:11:41
673
原创 有限假设集合的保证
是基于独立同分布抽取的训练样本中正面的经验概率。正如 (2.9) 所示,一致假设的泛化误差上界随样本大小。,并使用大小为 500 的样本,那么以至少 98% 的概率,可以保证。的指数级,并非多项式。因此这个通用概念类不是 PAC 可学习的。的所有子集组成的概念类。个布尔字面组成的合取的概念类。是基于独立同分布抽取的训练样本中正面的经验概率。学习算法,因为由 (2.8) 给出的样本复杂度由。将此结果代入到样本复杂度的界中,可以得到。假设抛掷一个带偏的硬币,正面朝上的概率为。为一个有限的假设集合。
2024-11-18 21:08:47
584
原创 PAC学习模型
经验误差是在样本上的平均误差;泛化误差是基于分布的预期误差。注意到,对固定的 h ∈ H,基于iidi.i.diid样本SSS高概率:概率大于1−δ1-\delta1−δ近似正确:泛化误差小于ϵ\epsilonϵ。
2024-10-24 22:24:58
1033
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人