- 博客(5)
- 收藏
- 关注
原创 【CS 143 Compiler】Assignment 4.1:阅读源码 & 理解任务
Spim 手册中的图示如下,编译器输出的 目标文件(Object File)布局为:代码存放在.text段,而代码的总入口是_start_start会做一些准备工作(包括初始化垃圾处理程序, 初始化 Main 函数) 最后调用 Main 对象实例 中的 main 方法 开始执行 COOL 程序._start作为入口符号是链接器的默认设置(也可以自定义)。_start也是大多数编程语言的 runtime 的入口函数。_start作为引导程序,包括一些准备工作,然后引导进入主程序。
2023-02-04 09:41:53
238
原创 【CS 143 Compiler 编译原理】Assignment 3:静态语义分析
总的来说分为 建立依赖图(build_inherit_graph)、验证无环(verify_acyclic)两步。install_basic_class 将基础类(如 Object、IO、Int、String)预先加入,和用户定义的 Class 一并处理。依赖图的构造遵顼一个 先定义节点再连线 的顺序。(因为建立继承关系时需要维护父节点的入度,这就需要父节点已经存在,所以需要所有节点定义完成后在连线。定义节点的过程嵌入重复定义的检查,只留下去重的 class 集合。
2023-01-30 16:00:06
341
原创 【CS 285 DRL Homework 2】Policy Gradients 策略优化
CS 285 深度强化学习 Homework 2 思路总结
2023-01-18 18:44:17
183
原创 【CS 143 Compiler 编译原理】Assignment 3:语法分析
这篇文章主要总结 完成 这次 Assignment 3 所需 知识和思路的总结
2023-01-17 00:18:13
336
原创 【CS 285 DRL Homework 1】模仿学习的策略函数
关于 CS 285 深度强化学习 Homework 1 的笔记很少,百度到 前年 一位同学发在 优快云 上的笔记,感觉有点不太对。。这里写一些个人理解,敬供各位批评。策略(Policy)函数的实现连续动作空间 & 高斯策略实现首先明确,这里的 “连续动作空间” ( ) 就是单峰的高斯分布。即 动作向量的每个分量连续、独立且分别服从不同参数的高斯分布。因此首先如果是高斯函数 ( ) , 则 待估计的 未知参数为 期望和标准差。动作值期望随观测值不同而变化。因此反映在 Pytorch 的
2023-01-05 16:14:41
438
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人