
实践
文章平均质量分 97
云端FFF
not because they are easy, but because they are hard
展开
-
VS2015 + OpenCV + OnnxRuntime-Cpp + YOLOv8 部署
本文详细介绍了使用 VS2015+OpenCV+OnnxRuntime+YOLOv8进行模型 C++ 部署的方法原创 2025-01-10 09:03:38 · 1551 阅读 · 5 评论 -
RL 实践(7)—— CartPole【TRPO & PPO】
本文介绍 PPO 这个 online RL 的经典算法,并在 CartPole-V0 上进行测试。由于 PPO 是源自 TRPO 的,因此也会在原理部分介绍 TRPO原创 2023-08-15 11:51:47 · 1249 阅读 · 2 评论 -
minGPT 代码详解(训练 GPT 模型执行两位数加法)
minGPT 是 GPT 模型的一个开源实现,因简洁干净解释性强而颇具教育意义。本文对该开源库实现的 GPT 代码进行详解,并给出一个使用它训练 GPT 模型计算两位数加法的例子原创 2023-07-31 04:59:31 · 4081 阅读 · 2 评论 -
RL 实践(6)—— CartPole【REINFORCE with baseline & A2C】
本文介绍 REINFORCE with baseline 和 A2C 这两个带 baseline 的策略梯度方法,并在 CartPole-V0 上验证它们和无 baseline 的原始方法 REINFORCE & Actor-Critic 的优势原创 2023-07-28 20:17:56 · 816 阅读 · 2 评论 -
RL 实践(5)—— 二维滚球环境【REINFORCE & Actor-Critic】
本文介绍如何用 REINFORCE 和 Actor-Critic 这两个策略梯度方法解二维滚球问题原创 2023-07-26 17:22:23 · 450 阅读 · 3 评论 -
RL 实践(4)—— 二维滚球环境【DQN & Double DQN & Dueling DQN】
本文介绍如何用 DQN 及它的两个改进 Double DQN & Dueling DQN 解二维滚球问题原创 2023-07-22 15:25:33 · 547 阅读 · 3 评论 -
RL 实践(3)—— 悬崖漫步【QLearning & Sarsa & 各种变体】
介绍 Sarsa、Expected Sarsa、N-Step Sarsa、N-Step Tree Backup、Q-Learning、Double Q-Learning 等六种经典表格型 TD Learning 算法,给出完整代码,并在自定义的经典悬崖漫步环境中进行性能对比原创 2022-12-17 20:30:34 · 4056 阅读 · 12 评论 -
RL 实践(2)—— 杰克租车问题【策略迭代 & 价值迭代】
使用策略迭代和价值迭代这两个经典的 model-based RL 方法解杰克租车问题原创 2022-10-10 12:17:30 · 2403 阅读 · 0 评论 -
RL 实践(1)—— 多臂赌博机
在多臂赌博机环境编程对比 ϵ-贪心,Decaying ϵ-贪心,UCB,汤普森采样等平衡探索和利用的方法原创 2022-09-29 13:03:58 · 752 阅读 · 0 评论 -
RL 实践(0)—— 及第平台辛丑年冬赛季【Rule-based policy】
RLChina 智能体挑战赛 - 辛丑年冬赛季的冠军代码复现报告原创 2022-06-24 07:53:44 · 1836 阅读 · 3 评论 -
经典机器学习方法(6)—— 非线性支持向量机器与核技巧
首先详细介绍核技巧与非线性SVM分类器,然后利用 sklearn 机器学习库进行非线性分类实践,并对比多种核函数原创 2022-10-08 00:38:56 · 626 阅读 · 0 评论 -
经典机器学习方法(5)—— 线性支持向量机器
详细介绍线性支持向量机的思想、理论和推导,并给出 python 实现代码原创 2022-10-05 11:56:26 · 539 阅读 · 0 评论 -
经典机器学习方法(4)—— 感知机
感知机原理分析及 pytorch 代码实现原创 2022-08-25 21:15:14 · 541 阅读 · 0 评论 -
经典机器学习方法(3)—— 多层感知机
多层感知机原理分析及 pytorch 实现原创 2022-08-18 03:22:35 · 1081 阅读 · 0 评论 -
经典机器学习方法(2)—— Softmax 回归
softmax 回归是一种经典的分类算法,本文详细介绍其原理并给出 pytorch 实现代码原创 2022-05-08 01:31:53 · 1588 阅读 · 0 评论 -
经典机器学习方法(1)—— 线性回归
线性回归原理分析与 Pytorch 代码原创 2022-02-11 10:35:12 · 890 阅读 · 0 评论