羊阳杨Petrick-优快云博客

原创【CS 143 Compiler】Assignment 4.1：阅读源码 & 理解任务

Spim 手册中的图示如下，编译器输出的目标文件（Object File）布局为：代码存放在.text段，而代码的总入口是_start_start会做一些准备工作(包括初始化垃圾处理程序, 初始化 Main 函数) 最后调用 Main 对象实例中的 main 方法开始执行 COOL 程序._start作为入口符号是链接器的默认设置（也可以自定义）。_start也是大多数编程语言的 runtime 的入口函数。_start作为引导程序，包括一些准备工作，然后引导进入主程序。

2023-02-04 09:41:53 238

原创【CS 143 Compiler 编译原理】Assignment 3：静态语义分析

总的来说分为建立依赖图（build_inherit_graph）、验证无环（verify_acyclic）两步。install_basic_class 将基础类（如 Object、IO、Int、String）预先加入，和用户定义的 Class 一并处理。依赖图的构造遵顼一个先定义节点再连线的顺序。（因为建立继承关系时需要维护父节点的入度，这就需要父节点已经存在，所以需要所有节点定义完成后在连线。定义节点的过程嵌入重复定义的检查，只留下去重的 class 集合。

2023-01-30 16:00:06 341

原创【CS 285 DRL Homework 2】Policy Gradients 策略优化

CS 285 深度强化学习 Homework 2 思路总结

2023-01-18 18:44:17 183

原创【CS 143 Compiler 编译原理】Assignment 3：语法分析

这篇文章主要总结完成这次 Assignment 3 所需知识和思路的总结

2023-01-17 00:18:13 336

原创【CS 285 DRL Homework 1】模仿学习的策略函数

关于 CS 285 深度强化学习 Homework 1 的笔记很少，百度到前年一位同学发在优快云上的笔记，感觉有点不太对。。这里写一些个人理解，敬供各位批评。策略（Policy）函数的实现连续动作空间 & 高斯策略实现首先明确，这里的 “连续动作空间” ( ) 就是单峰的高斯分布。即动作向量的每个分量连续、独立且分别服从不同参数的高斯分布。因此首先如果是高斯函数 ( ) , 则待估计的未知参数为期望和标准差。动作值期望随观测值不同而变化。因此反映在 Pytorch 的

2023-01-05 16:14:41 438 2

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 【CS 143 Compiler】Assignment 4.1：阅读源码 & 理解任务

原创 【CS 143 Compiler 编译原理】Assignment 3：静态语义分析

原创 【CS 285 DRL Homework 2】Policy Gradients 策略优化

原创 【CS 143 Compiler 编译原理】Assignment 3：语法分析

原创 【CS 285 DRL Homework 1】模仿学习的策略函数

空空如也

空空如也

原创【CS 143 Compiler】Assignment 4.1：阅读源码 & 理解任务

原创【CS 143 Compiler 编译原理】Assignment 3：静态语义分析

原创【CS 285 DRL Homework 2】Policy Gradients 策略优化

原创【CS 143 Compiler 编译原理】Assignment 3：语法分析

原创【CS 285 DRL Homework 1】模仿学习的策略函数