
算法
一位不想透露名字的路人甲
你想知道啥?
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
信赖域方法记录
这里有一个东北大学的关于"信赖域方法"的教学链接,比较基础和人性化.原创 2020-01-04 11:56:44 · 178 阅读 · 0 评论 -
拉格朗日乘子法和KKT条件的理解学习
如果本文有错误,特别欢迎大家指出。 目标: 我们的目标是在一定的限制条件下找到一个函数的最大、最小值。 正式的描述: 给定目标函数fff和定义在Ω∈Rn\Omega \in R^nΩ∈Rn上的函数g1,g2,...,gmg_1,g_2,...,g_mg1,g2,...,gm和h1,h2,...,hlh_1,h_2,...,h_lh1,h2,...,hl,求函数fff的极值。数学表示为:...转载 2019-12-01 17:04:05 · 367 阅读 · 0 评论 -
转载:傅里叶变换的通俗理解
深入浅出的讲解傅里叶变换(真正的通俗易懂) </h1> <div class="clear"></div> <div class="postBody"> 原文出处: 韩昊 ...转载 2020-02-27 21:39:00 · 236 阅读 · 0 评论 -
网络控制系统之被控对象离散化
网络控制系统是引入网络的控制系统,即网络可能存在于控制系统的反馈通道和控制通道。在网络控制系统中,被控对象的数学模型当然是连续的(这个世界上还有离散的物理系统么?)但是,由于网络控制系统不可能使用连续的信号来控制被控对象,所以我们需要把被控对象的模型离散化。 对于线性系统,可以参考现代控制理论的书籍的离散化方法,matlab的离散化方法是c2d. 对于非线性系统,目前没有具有完整理论的离散化方法...原创 2019-11-25 22:52:59 · 1464 阅读 · 0 评论 -
reinforcement leanrning : an introduction 第二章
Multi-armed bandit problem 强化学习和其它的学习算法的不同之处在于对动作的评价,其它的学习算法如监督学习、神经网络等不去评价或者度量动作的价值,而是直接被“教”去做最好的动作。强化学习是主动地评价动作而不是被“教”怎么去做动作;监督学习是被“教”怎么做动作而不是评价动作的价值。 k臂赌博机是一个非关联(nonassociative)问题,即不考虑在不同的情况下做动作,也就...原创 2019-11-24 17:32:18 · 214 阅读 · 0 评论