基于约束的学习与推理:原理、类型及应用
1. 约束环境下学习与推理的统一视角
传统上,学习和推理在人文学科中是分开的,学习被认为是为推理提供支持。但从贝叶斯的观点来看,学习和推理紧密相关,可将学习视为估计被看作随机变量的参数的推理过程。在基于约束描述智能体与环境交互的情况下,这种关系同样成立,不过在频率主义方法中,学习和推理有显著差异。
以手写字符识别和N皇后问题为例,N皇后问题初始看似无特征输入,但当已放置部分皇后形成特定配置 ( Q_m ) 时,后续放置皇后的决策就需基于 ( Q_m ),这使得推理可看作由学习函数 ( f(Q_m) ) 驱动的一系列前向步骤,将基于整数规划的约束满足转化为类似手写字符识别的前向操作。
为深入理解约束环境下的推理和学习,需区分基于特征感知空间的任务和基于虚拟输入空间的任务。给定环境图 ( G ) 和感知空间 ( X ),智能体返回关于个体的函数。对于某些缺少特征的情况,可通过引入 “nil” 符号丰富感知空间,即 ( X_o := X \cup {nil} )。环境中的个体可表示为 ( J = V \times X_o ),特征仅在 ( \overline{V} \subset V ) 集合中存在。个体可由特征向量 ( x ) 或顶点 ( v ) 表示,形式定义为 ( \chi := [p_x]x + [\neg p_x]v \in I = X \cup V ),其中 ( p_x = (v \in \overline{V}) \vee (x \in X \setminus \overline{X_o}) )。
在这个框架下,智能体由函数 ( f : I \to R^n ) 表示。学习和推理都涉及约束的实施,但学习要求智能体在
超级会员免费看
订阅专栏 解锁全文
2448

被折叠的 条评论
为什么被折叠?



