liuhui244-优快云博客

书接上回，为了使用好的深度学习的框架，我们需要使用pytorch的工具，那么必然要使用到我们的各种各样的关于pytorch的函数的用法，所以我们阅读了Pytorch深度学习指南，将里面的核心的关键的内容进行归纳和整理，当然这里的假设你有一定的numpy和简单的机器学习的基础。当然没有话也无所谓，你就当成pytorch的工具书也是一样，本书为第一卷，总共只有3章，包含了一章0，用于打一点简单的基础（简单的介绍，数据，梯度，学习率，标准化等）

2025-01-19 23:51:14 1120

原创量化分析：股票的筹码分布和获利比例

用自己的方式计算了筹码的分布，可以量化的获取所有的筹码的分布的情况

2024-12-13 11:04:13 1991 3

原创深度强化学习：强化学习部分已经完结

只是一个里程碑的总结，不为谁而唱的歌

2024-12-05 22:54:36 216

原创强化学习导论 -章13策略梯度算法

本文是策略梯度算法，尤其是因为了A2C的算法，用于计算和评估我们的策略梯度和价值函数同时执行

2024-12-05 22:16:38 1067

原创强化学习导论 -章12 资格迹

本章介绍了资格迹相关的内容，如何在尽可能保证精度的情况下，我们可以减少计算量来满足动态的在线的学习，我们使用了一种数学上优雅的方法。同时找到了论文证明了相关的定理的来源，提供了伪代码，后续应该会补充实际的案例

2024-12-02 16:31:52 893

原创 LeeCode 解题报告:2097. Valid Arrangement of Pairs

leecode里面关于欧拉通路的判断和查询的算法，核心Hierholzer算法的一点自我理解

2024-12-01 01:40:46 936

原创强化学习导论 -章10 基于函数逼近的同归控制策略

本文在上一章的接触上解释了为什么有基于函数逼近的同轨策略的控制过程，包括了sarsa和n步sarsa以及平均收益的计算方法，给了一个实际的解决高山行车的问题的学习的代码用于展示这一章节的核心内容

2024-11-29 15:43:31 802

原创强化学习导论 -章9 基于函数逼近的同轨策略预测

强化学习的函数逼近入门，介绍了线性逼近，深度学习，核函数等介绍方法，必须得说，我自己看书的时候有很多地方感觉很泛泛而谈，必须要自己写下这个blog才能更好的理解很多内容的实现.

2024-11-26 21:00:07 848

原创强化学习导论 -章8 基于表格型的规划和学习

本文强调了规划的重要性，在学习的过程中，使用DP等算法不停的对策略进行改进，可以在较少的样本数量得到很好的学习的效果同时我们强调了前向更新和优先级清扫的重要性，使用了决策时规划和启发式算法的原理来进行偏向于实时的算法的更新能力。

2024-11-20 18:36:50 788

原创强化学习导论 -章7 n步自举法

n步TD，在MC和TD(0)之间的一个算法，主要是通过n步的方法来快速的回溯到更远的步骤，从而更好的学习

2024-11-19 11:56:40 1147

原创强化学习导论 -章6 时序差分

这一章节讲解了开始逐步学习的方法，时间差分，同时学习了sarsa, Q-learning, 期望sarsa等内容

2024-11-17 10:34:05 1051

原创强化学习导论 -章5 蒙特卡洛

蒙特卡洛，重要度采样，21点的蒙特卡洛方法

2024-11-15 21:51:37 1213

原创蒙特卡洛--首次/每次访问型MC算法的收敛性证明

关于蒙特卡洛方法的收敛性证明

2024-11-14 21:12:06 825

原创强化学习导论 -章4 动态规划

动态规划的策略更新，策略迭代，价值迭代函数，以及异步dp

2024-11-14 16:00:59 749

原创强化学习导论 -章节3,4 马尔可夫决策过程与动态规划

这是对MDP，什么是马尔科夫决策链，以及什么事价值函数，什么是动作函数，他们的定理证明，以及互相的关系是什么

2024-11-13 20:08:48 1173 1

原创强化学习导论 -章节2 多臂赌博机

强化学习的多臂赌博机章节的介绍

2024-11-13 14:35:16 1101

原创管理类论文阅读之：BIFPET

BIFPET的中文阅读

2023-07-27 00:22:14 168 1

原创深入理解linux内核系列--第⑦章：进程调度

CFS和进程调度相关核心功能介绍

2023-02-07 17:18:56 288

原创深入理解linux内核系列--第三章：进程

《深入理解Linux内核》进程

2023-02-03 13:12:31 265

原创 Dynamic Debug [dyndbg] 概述

对kernel的dynamic debug（dyndbg）功能的一个用法概述

2022-08-26 14:25:02 1401 1

原创 networkx绘制任务关系图

使用networkx绘制任务关系图想要绘制管理学上，任务与任务之间的指向（前置）关系，发现并没有现成的库可以用来解决相关问题。后来发现networkx可以用来指定Node和edge之间的关系，具体的networkx的教程，可以参考各个博主的文章。networkx可以方便的添加node和edge，但是networkx现有的layout对于流程图式的从左推到右的图形并不支持。已有的例如，随机布局，星状布局，圆形布局等，都不满足流程图布局，为了实现，流程图的最终调用关系（见下图），我们需要自己来指定各个节点在

2021-06-09 09:23:18 1512 2

liuhui244的博客

原创量化分析：股票的筹码分布和获利比例（进化版本，全部免费接口）

原创 WiseFlow本地搭建实录---保姆教程

原创深度强化学习实践 Maxim Lapan 章节13：A3C方法

原创深度强化学习实践 Maxim Lapan 章节12：actor-critic方法

原创深度强化学习实践 Maxim Lapan 章节11：策略梯度：一种替代方法

原创深度强化学习实践 Maxim Lapan 章节9：加速强化学习的方法

原创深度强化学习实践 Maxim Lapan 章节8：DQN的扩展

原创深度强化学习实践 Maxim Lapan 章节7：高级强化学习库

原创深度强化学习实践 Maxim Lapan 章节6：深度Q-Network

原创 Pytorch深度学习指南卷I --编程基础（A Beginner‘s Guide）第3章：一个简单的分类

原创 Pytorch深度学习指南卷I --编程基础（A Beginner‘s Guide）第2章重新思考循环训练

原创 Pytorch深度学习指南卷I --编程基础（A Beginner‘s Guide）第1章一个简单的回归

原创 Pytorch深度学习指南卷I --编程基础（A Beginner‘s Guide）第0章