- 博客(61)
- 收藏
- 关注
原创 【从0开始】使用Flax NNX API 构建简单神经网络并训练
与 Linen API 不同,NNX 使用起来对初学者更加简单,跟 PyTorch 的体验更加接近。
2025-02-06 18:30:14
461
原创 Rust调用Windows API制作进程挂起工具
一个 sysinternals/pssuspend 替代工具,用于在Windows上挂起/恢复指定PID的进程。目前只能使用未公开的系统API来实现,底层使用了ntdll.dll。
2025-01-13 21:03:08
387
转载 静态优化问题与动态优化问题
静态优化问题:一次性决策,不考虑时间变化,目标函数和约束是固定的。动态优化问题:决策随时间演化,未来的决策影响当前决策,目标函数和约束可能随时间变化。
2024-08-14 21:30:29
524
原创 资本回收率(Captial Recovery Factor, CRF)
工程经济学中的一个概念,用于计算在一定期间内逐年回收投资本金和利息的年金值。它用于将初始投资金额(即现值)等效为一系列等额的年金付款,帮助分析投资的可行性或确定贷款的还款额。CRF1ry−1r1ry其中,r是年利率,y是年数。
2024-08-12 19:47:20
1245
原创 Rust中的特殊类型(引用、智能指针等)所占的内存大小
综上所述,智能指针/引用所占内存大小是固定的,但是其指向的数据大小未必固定。对于所占内存固定已知的数据类型,运行时会把它们放在栈上,对于所占内存不固定的数据类型,运行时会把它们放在堆上,然后可以通过存放在栈上的指针来操作堆上的数据。Rust中,一个普通指针的大小为usize,与计算机CPU字长相等,对64位计算机来说usize=64/8=8字节。的本质都是智能指针,它们的大小都是固定的(大小不固定也没法通过编译啊),它们的本质是通过存放在栈上的指针访问堆内存,来操作堆上包裹的数据。
2024-08-03 01:54:37
570
原创 Rust的运行时多态
Rust的静态多态即编译时多态,通过**泛型+特征约束(Generic Type + Trait Constrait)**来实现;那么动态多态(运行时多态)呢?答案是。特征对象不是一个实例,而是一个结构体类型。语法是,编译时指示某个对象是实现TraitName的类型,其具体类型未知。
2024-08-02 16:51:22
456
原创 Windows下安装Mujoco1.50
最近看了很多在Windows上安装Mujoco1.50的教程,大多数过于繁杂,下面根据官方文档,写一个相对简化的安装方法,主要是其实很简单,总共就三句话,并没有说1.50版本要设置环境变量啥的,不知道其他博主在哪看的。
2024-07-17 01:17:48
1145
原创 DDPG算法
确定性策略梯度理论,在DPG算法中被提出,原论文,推导过程相当复杂,我也不大能看懂,总之用就完事了😂训练流程:参考了DQN,因此属于Off Policy算法,使用了经验回放缓存,引入了actor target和critic target。
2023-09-06 13:45:17
307
原创 深度强化学习算法的参数更新时机
深度强化学习中往往涉及到多个神经网络来拟合策略函数、值函数等,什么时候更新参数因算法而异,与具体算法架构/算法思想紧密相关。
2023-09-05 22:41:52
413
原创 PPO算法
全称Proximal Policy Optimization,是TRPO(Trust Region Policy Optimization)算法的继承与简化,大大降低了实现难度。
2023-09-05 21:29:32
192
原创 Windows系统下MMDeploy预编译包的使用
MMDeploy步入v1版本后安装/使用难度大幅下降,这里以部署MMDetection项目的Faster R-CNN模型为例,将PyTorch模型转换为ONNX进而转换为Engine模型,部署到TensorRT后端,实现高效推理,主要参考了。每调用一次就会加载一次模型,效率很低,只是用来测试模型可用性,不能用在生产环境。要高效使用模型,可以集成Detector到自己的应用程序里面,一次加载,多次推理。
2023-08-30 18:42:30
954
1
原创 Windows下向mmdetection注册新的组件
mmdetection借助mmclassification才能使用最先的sota网络ConvNeXt,本文记录了一次将mmclassification下的ConvNeXt迁移到mmdetection的经验。
2022-11-02 18:54:06
632
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人