- 博客(8)
- 资源 (1)
- 收藏
- 关注
原创 Github学生认证教程-2025.09.07版
1. 不要开vpn,打开GitHub网站,点击头像-setting界面,点击 Start an Application。如果不开vpn打不开github的话,就使用手机热点连接,或者换一个浏览器。2. 点击之后会出现如下的界面,按照图示进行操作,会直接出现关联邮箱的学校,再点击分享位置。3. 完善账单信息(账单付款地址填写真实姓名和学校地址)2. 完善个人信息,账号关联学校邮箱。3. 提交完成,等待通过即可。1. 注册了一段时间的账号。4. 记事本如下,截图保存。
2025-09-07 14:38:18
372
原创 Set Cover 问题介绍及与ATO问题的关联
给定一组集合,每个集合都有其cost值。要求找到能够覆盖其中所有元素的一组集合,使得总成本最小。资源选择问题、设施选址问题(移动基站的选址、物流中心的选址)等都是经典的Set Cover问题。:Set Cover是经典的NP-Hard问题。更甚者,已证明不存在优于O(log n)的近似算法(除非P=NP),这意味着任何多项式时间算法在最坏情况下的解都可能比最优解差log n倍。
2025-09-01 15:21:16
339
原创 StableBaselines3强化学习框架简明教程
Stable Baselines3 (SB3) 是基于 PyTorch 的强化学习库,提供多种经典强化学习算法(如 PPO、DQN、A2C 等)。
2025-03-29 14:26:02
1748
原创 【论文阅读】Research Handbook on Inventory ManagemenT --- Chap.1 Lost-sales inventory systems
如果可用的库存不足以满足需求,则假定丢失了过剩的需求。这个定义与backordered的定义是相悖的。
2025-03-27 11:56:10
1521
1
原创 Numpy的数组拼接函数——hstack, vstack, stack 及concatenate的操作指南
np.hstack:沿列方向拼接数组,要求行数相同。np.vstack:沿行方向拼接数组,要求列数相同。:更通用的拼接函数,可以沿指定轴拼接。np.stack:沿新轴堆叠数组,创建更高维度的数组。
2025-03-20 19:51:04
499
原创 【论文笔记】Deep Policy Iteration with Integer Programming for Inventory Management
提出了一种结合整数规划和深度强化学习的算法(PARL),用于解决库存管理中的复杂问题。该算法通过求解一个整数规划问题来寻找最优的动作值,这个整数规划问题的目标函数是价值函数,约束条件包括库存问题的实际约束和神经网络中权重(W)和偏置(b)的约束。在更新策略网络时,使用这个求解器找到的最优动作值来优化策略。同时,价值网络仍然使用均值误差(MSE)来更新,通过最小化预测价值和实际价值之间的误差来训练神经网络。
2025-03-16 15:59:28
1312
1
原创 【论文笔记】Deep reinforcement learning for inventory control: A roadmap
神经网络的原型:multi-layer perceptron (MLP),有层,参数为, 其中A表示权重矩阵 (weight matrix),b表示偏离向量(bias vector),每层都有一个激活函数active function,
2025-03-13 20:03:55
866
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅