34、基于约束的学习与推理:原理、类型及应用

基于约束的学习与推理:原理、类型及应用

1. 约束环境下学习与推理的统一视角

传统上,学习和推理在人文学科中是分开的,学习被认为是为推理提供支持。但从贝叶斯的观点来看,学习和推理紧密相关,可将学习视为估计被看作随机变量的参数的推理过程。在基于约束描述智能体与环境交互的情况下,这种关系同样成立,不过在频率主义方法中,学习和推理有显著差异。

以手写字符识别和N皇后问题为例,N皇后问题初始看似无特征输入,但当已放置部分皇后形成特定配置 ( Q_m ) 时,后续放置皇后的决策就需基于 ( Q_m ),这使得推理可看作由学习函数 ( f(Q_m) ) 驱动的一系列前向步骤,将基于整数规划的约束满足转化为类似手写字符识别的前向操作。

为深入理解约束环境下的推理和学习,需区分基于特征感知空间的任务和基于虚拟输入空间的任务。给定环境图 ( G ) 和感知空间 ( X ),智能体返回关于个体的函数。对于某些缺少特征的情况,可通过引入 “nil” 符号丰富感知空间,即 ( X_o := X \cup {nil} )。环境中的个体可表示为 ( J = V \times X_o ),特征仅在 ( \overline{V} \subset V ) 集合中存在。个体可由特征向量 ( x ) 或顶点 ( v ) 表示,形式定义为 ( \chi := [p_x]x + [\neg p_x]v \in I = X \cup V ),其中 ( p_x = (v \in \overline{V}) \vee (x \in X \setminus \overline{X_o}) )。

在这个框架下,智能体由函数 ( f : I \to R^n ) 表示。学习和推理都涉及约束的实施,但学习要求智能体在

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值