
机器学习
文章平均质量分 92
Green Lv
中科院计算所博士后研究员。研究领域:计算机网络,网络协议(TCP & QUIC),视频流(ABR、WebRTC)。个人主页:https://greenlv.github.io/
展开
-
强化学习的数学原理学习笔记 - Actor-Critic
强化学习的数学原理学习笔记: Actor-Critic,包括对A2C、DPG等算法和重要性采样等概念的介绍。原创 2024-01-08 13:21:44 · 2142 阅读 · 0 评论 -
强化学习的数学原理学习笔记 - 策略梯度(Policy Gradient)
强化学习的数学原理学习笔记:基于策略(Policy-based)的策略梯度方法(Policy Gradient),包括对REINFORCE算法的介绍。原创 2024-01-08 13:09:06 · 1557 阅读 · 0 评论 -
强化学习的数学原理学习笔记 - 值函数近似(Value Function Approximation)
强化学习的数学原理学习笔记:基于值的(Value-based)值函数近似方法(Value Function Approximation),包括对Sarse / Q-learning with function approximation以及DQN算法的介绍。原创 2024-01-08 12:51:41 · 1873 阅读 · 0 评论 -
强化学习的数学原理学习笔记 - 时序差分学习(Temporal Difference)
强化学习的数学原理学习笔记:时序差分学习(Temporal Difference,TD),包括对基础TD、Sarsa和Q-learning等算法的介绍。原创 2024-01-07 19:11:49 · 4510 阅读 · 0 评论 -
强化学习的数学原理学习笔记 - 蒙特卡洛方法(Monte Carlo)
强化学习的数学原理课程学习笔记:蒙特卡洛方法(Monte Carlo,MC),包括对ε-Greedy的介绍。原创 2024-01-07 17:45:42 · 1931 阅读 · 0 评论 -
强化学习的数学原理学习笔记 - 基于模型(Model-based)
强化学习的数学原理学习笔记:基于模型(Model-based)的强化学习方法,包括对值迭代和策略迭代算法的介绍。原创 2024-01-07 17:06:19 · 1719 阅读 · 0 评论 -
强化学习的数学原理学习笔记 - RL基础知识
强化学习的数学原理学习笔记:强化学习基础知识,包括对贝尔曼方程、贝尔曼最优方程的介绍。原创 2024-01-07 16:30:38 · 2370 阅读 · 0 评论 -
CausalSim (NSDI ‘23 Best Paper) 论文阅读笔记
CausalSim是NSDI '23的Best Paper。其主要工作是基于矩阵/张量完成和对抗学习设计了一个无偏的trace-driven模拟框架。CausalSim通过显示建模算法对于trace的影响,消除了传统模拟器中存在的偏差,从而实现与真实世界更为一致的模拟效果。CausalSim可以应用于ABR算法、异构服务器负载均衡等场景之中。原创 2023-05-15 20:06:13 · 1778 阅读 · 1 评论 -
2014斯坦福大学吴恩达机器学习课程笔记-4 Linear Regression with Multiple Variables
文章目录4 多变量线性回归(Linear Regression with Multiple Variables)4-1 多个特征(Multiple Features)4-2 多变量的梯度下降(Gradient Descent for Multiple Variables)4-3 梯度下降实践1:特征缩放(Gradient Descent in Practice I: Feature Scaling...原创 2019-11-24 15:27:26 · 293 阅读 · 0 评论 -
2014斯坦福大学吴恩达机器学习课程笔记-3 Linear Algebra
文章目录3 线性代数(Linear Algebra)3-1 矩阵(Matrix)和向量(Vector)矩阵向量3-2 矩阵加法与标量乘法(Addition and Scalar Multiplication)3-3&3-4 矩阵-向量/矩阵-矩阵乘法(Matrix-Vector / Matrix-Matrix Multiplication)3-5 矩阵乘法属性(Matrix Multipl...原创 2019-11-21 20:31:03 · 266 阅读 · 0 评论 -
2014斯坦福大学吴恩达机器学习课程笔记-2 Linear Regression with One Variable
2 单变量线性回归2-1 模型表达(Model Representation)定义:mmm:m:训练样本数xxx:输入变量 / 特征yyy:输出变量 / 目标变量(x,y)(x, y)(x,y):一个训练样本(x(i),y(i))(x^{(i)}, y^{(i)})(x(i),y(i)):第 iii 个训练样本hhh:机器学习算法的输出,一个假设函数,输入 xxx,输出 yyy ...原创 2019-11-21 15:17:22 · 225 阅读 · 0 评论 -
2014斯坦福大学吴恩达机器学习课程笔记-1 Introduction
1 Introduction1-1 & 1-2机器学习的使用场景数据挖掘无法人工编写的程序(如图像识别)自我定制程序(如推荐系统)机器学习算法分类监督学习(supervised learning)无监督学习(unsupervised learning)其他:增强学习(reinforcement learning)、推荐系统(recommender systems)...原创 2019-11-21 15:14:35 · 274 阅读 · 0 评论