
AI
walkerfan
这个作者很懒,什么都没留下…
展开
-
机器学习
神经网络碰上高斯过程 神经网络是一类参数化函数,可以通过梯度下降来高精度地逼近标记数据集。高斯过程(GP)是一种概率模型,其定义了可能函数的分布,并通过概率推理规则和数据来更新。 俞扬:对抗模仿学习与逆强化学习的过程非常相似 深度学习的理论基础 1.数学基础≠理论基础。用数学描述深度学习只能说明模型是有理论保证的,并不能组成深度学习的理论基础。 2.深度学习的理论基础首先是通用近似定理——只要神经元足够多,单层前馈神经网络「有潜力」逼近任意复杂的连续函数。表征、最优化和泛化三大问题是其最重要与基础的理论方向原创 2021-02-07 17:47:26 · 160 阅读 · 0 评论 -
Exploitation和Exploration
Exploration&Exploitation的理解 From https://www.jianshu.com/p/22c4f36a52ff 1. 介绍 1.1 探索与利用间的困境 Online decision-making involves a fundamental choice: Exploitation Make the best decision given current...原创 2019-04-27 11:20:40 · 1555 阅读 · 0 评论