- 博客(20)
- 收藏
- 关注
原创 机器学习数学基础课程复习——(6)收敛率
引言算法性能的衡量标准收敛率迭代复杂度优化算法对于一般凸优化问题的梯度下降法光滑且强凸函数的梯度下降算法随机梯度下降算法
2024-06-14 21:18:34
234
原创 机器学习基础课程复习——(3)复杂性
从定义上看,限制可以理解为多个映射构成的集合,每个映射对于同一个数据集D都会得到不同的向量值。为方便理解,不妨设假设空间H有两个映射f1和f2,数据集D:x1,x2f1:将x1和x2映射为了(1,-1)f2:将x1和x2映射为了(-1,1)则我们将f1与f2构成的集合称为假设空间H到数据集D上的限制从定义上看,增长函数表示假设空间H到大小为m的数据集D上的限制的最大映射数目可能有点抽象,下面我直白一点解释即从X空间选出多个可能的集合D,其中每个集合中变量的数目都为m、
2024-06-14 20:20:12
681
原创 人工智能原理课程复习——(15)规划图
先区分两个概念:全序规划和偏序规划全序规划:即所有的动作都排成一条线,串行执行偏序规划:只对部分动作进行排序,但还有些动作可以不排序,因此这些动作可以并行动作层A:表示初始状态有哪些可用的动作状态层S:表示执行动作后所有可能产生的效果其中灰色曲线表示两个动作之间是互斥的其中方块表示持续动作,即上述状态在动作层做完动作后状态保持不变,依然成立由于Have(Cake)会导致Have(Cake),然而Eat(Cake)会导致~Have(Cake)因此两个动作互相否定。
2024-06-07 09:16:28
460
原创 人工智能原理课程复习——(14)简单规划
我们考虑一个航空货物运输问题下面将该问题进行形式化对于上图的问题,如何表示我们就可以利用数据库语义,即未提及的语句都默认为false其中效果只用来描述发生变化的部分,在这个问题中,直升机从一个地点飞行到另一地点,则会导致At(p,from)会发生变化,以及会增加一个效果也就是At(p,to)因此我们在效果中只提及这两个部分基元动作:就是将变量进行赋值从而得到基元动作即只有当前状态满足动作a的前提条件时,才会执行该动作其中上图给的第一个状态s,其不蕴涵precond因此不能执行该动作。
2024-06-07 08:57:10
528
原创 人工智能原理课程复习:(13)一阶逻辑推理
答案为ABD,因为在C选项中x与y是不同的,因此R(x)与~R(y)两者不同但在D选项中可以先将y代换为x,此时语义不发生变化,故R(x)与~R(y)可以归结注意:在代换时只能将变量代换为常量,其它的代换都不对如在上图,只有第三个代换是正确的,其它的代换都是错误的Skolem常量指的是:知识库中尚未出现过的常量此时的与前面所有的变量都相关,故在代换时应用一个函数进行代换上图中的代换是错误的,应代换为,其中m(y)为skolem函数第一个图错在:不能代换为KB中已知的常量a。
2024-06-06 15:08:07
851
原创 人工智能原理课程复习:(12)一阶逻辑
标准的一阶逻辑语义比自然语言表述要累赘很多,在把知识翻译为一阶逻辑时直观上也很容易出错。对于量词的嵌套,只有任意任意,存在存在可以交换顺序,存在任意是无法交换顺序的。解释可以理解为映射,即将常量,谓词,函词映射到对应的对象,关系,函数上。我们需要定义一个“解释”,将常量,谓词,函词解释为对象,关系,函数。一般而言,任意一般与蕴含进行搭配,存在一般与合取进行搭配。若要用命题逻辑表示部分或全部对象,则需要枚举所有的对象。有了解释之后就可以判断语句α在所定义的世界的真值。上述图指的是只有两个。
2024-06-06 10:52:22
258
原创 人工智能原理课程复习——(11)命题逻辑的推理
上述给出的R1,R2,R3,R4,R5就是所对应的知识库,我们要列出所有能让知识库中的语句为真的模型如上图红色标注的行,即为知识库为真的前提下,推导出~P12。
2024-06-06 09:58:31
399
原创 人工智能原理课程复习——(8)约束满足问题
我们先来看一个例子:8皇后问题其需满足约束:任意两个皇后不能出现在同行,同列,同对角线上因此用来代表8皇后位置的每个遍历都必须满足上述约束上图表示F,T,U,W,R,O满足同一个约束(上方的蓝色块)剩下的两两满足一个约束(下方的蓝色块)
2024-06-05 21:26:34
440
原创 人工智能原理课程复习——(7)博弈搜索
minmax算法,其基本思想是,由于该决策具有先手顺序,因此先手玩家想要自己的利益最大化,而后手玩家想要让先手玩家利益最小化。因此A结点使用max,而B,C,D结点使用min。
2024-06-05 20:22:58
1048
原创 人工智能原理课程复习——(6)复杂环境搜索
此处的不确定性指的是动作结果的不确定性,此处假设环境是完全可观察的即Agent做一个动作,可能会导致多个结果出现因此对应于转移模型就会有多个状态,如下图中执行suck这个动作,可能会得到5这个状态也可能得到7这个状态因此现在的解不再是动作序列,而是一个条件规划因为我此刻不知道我现在是属于什么状态,所以我必须加上条件,来确定我在哪个状态,从而执行相应的动作,这就意味着解是以”树“的形式出现下面介绍一下与或树的概念与或树:即将所有可能的预测和更新进行组合,其中方块代表或结点,圆块代表与结点。
2024-06-05 15:49:57
607
原创 人工智能原理课程复习——(5)最优化问题与局部搜索
基本思想:从当前节点的所有后继中选择出最优的结点局限:当前最优的结点并不代表着全局最优,因此这里只考虑了局部最优性。
2024-06-05 14:53:14
1146
原创 人工智能原理课程复习——(4)搜索策略:启发式搜索
上图蓝色斜线去除的部分:表示新产生的子节点与已有的frontier结点重复,则保留小的,去除大的,因此450的Bucuresti被去除了,418的Bucuresti被保留了。GBFS搜索只考虑到当前离目标有多远,并没有考虑初始状态到当前结点有多远,故我们可以加入已经产生的路径代价,即f(n)=g(n)+h(n),这就是A*搜索的基本思想。左边的图表示原始的图,中间的图表示使用A*树搜索算法得到的结果,右边表示使用A*图搜索算法得到的结果。下面我们需要考虑:松弛问题所得到的启发式是否为原问题的一致的启发式?
2024-06-05 10:59:59
1673
原创 人工智能原理课程复习——(3)搜索策略:盲目搜索
我们在前文有提到,搜索就是不断地从frontier集合中移除结点,再将子节点加入到frontier的过程在这个过程中,最重要的就是从frontier中选择哪个结点进行扩展,这就决定了不同的搜索策略。
2024-06-05 09:26:39
1350
原创 人工智能原理课程复习——(2)搜索形式化与搜索求解
搜索:不断地扩展frontier内的结点,直到代表目标状态的结点出现树搜索:反复从frontier移出结点进行扩展,每个子结点都加入搜索树中(成为frontier结点)图搜索:反复从frontier移除结点进行扩展,将状态不重复的子节点加入搜索树(成为frontier结点)。用explored集合保存已被扩展过的结点。
2024-06-04 22:40:17
437
1
原创 人工智能原理课程复习——(1)理性Agent
Agent程序:指在物理架构上运行,从而产生Agent函数的程序Agent函数:指一种从历史感知序列到行动的映射一个智能体在任何瞬间采取的行动都将依赖于到目前为止所有的感知序列。通俗上讲,理性指的是:产生好的行为,做正确的事性能度量环境的先验知识到目前为止的感知序列智能体能采取的行动一个理性的Agent能够根据目前为止的感知和Agent所具有的先验知识,选取能够最大化性能度量的动作。
2024-06-04 22:06:17
1039
3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人