自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 资源 (1)
  • 收藏
  • 关注

原创 Github学生认证教程-2025.09.07版

1. 不要开vpn,打开GitHub网站,点击头像-setting界面,点击 Start an Application。如果不开vpn打不开github的话,就使用手机热点连接,或者换一个浏览器。2. 点击之后会出现如下的界面,按照图示进行操作,会直接出现关联邮箱的学校,再点击分享位置。3. 完善账单信息(账单付款地址填写真实姓名和学校地址)2. 完善个人信息,账号关联学校邮箱。3. 提交完成,等待通过即可。1. 注册了一段时间的账号。4. 记事本如下,截图保存。

2025-09-07 14:38:18 372

原创 Set Cover 问题介绍及与ATO问题的关联

给定一组集合,每个集合都有其cost值。要求找到能够覆盖其中所有元素的一组集合,使得总成本最小。资源选择问题、设施选址问题(移动基站的选址、物流中心的选址)等都是经典的Set Cover问题。:Set Cover是经典的NP-Hard问题。更甚者,已证明不存在优于O(log n)的近似算法(除非P=NP),这意味着任何多项式时间算法在最坏情况下的解都可能比最优解差log n倍。

2025-09-01 15:21:16 339

原创 StableBaselines3强化学习框架简明教程

Stable Baselines3 (SB3) 是基于 PyTorch 的强化学习库,提供多种经典强化学习算法(如 PPO、DQN、A2C 等)。

2025-03-29 14:26:02 1748

原创 写代码时用到的常用函数记录(常更)

写代码时候的一些记录

2025-03-27 11:56:38 367

原创 【论文阅读】Research Handbook on Inventory ManagemenT --- Chap.1 Lost-sales inventory systems

如果可用的库存不足以满足需求,则假定丢失了过剩的需求。这个定义与backordered的定义是相悖的。

2025-03-27 11:56:10 1521 1

原创 Numpy的数组拼接函数——hstack, vstack, stack 及concatenate的操作指南

np.hstack:沿列方向拼接数组,要求行数相同。np.vstack:沿行方向拼接数组,要求列数相同。:更通用的拼接函数,可以沿指定轴拼接。np.stack:沿新轴堆叠数组,创建更高维度的数组。

2025-03-20 19:51:04 499

原创 【论文笔记】Deep Policy Iteration with Integer Programming for Inventory Management

提出了一种结合整数规划和深度强化学习的算法(PARL),用于解决库存管理中的复杂问题。该算法通过求解一个整数规划问题来寻找最优的动作值,这个整数规划问题的目标函数是价值函数,约束条件包括库存问题的实际约束和神经网络中权重(W)和偏置(b)的约束。在更新策略网络时,使用这个求解器找到的最优动作值来优化策略。同时,价值网络仍然使用均值误差(MSE)来更新,通过最小化预测价值和实际价值之间的误差来训练神经网络。

2025-03-16 15:59:28 1312 1

原创 【论文笔记】Deep reinforcement learning for inventory control: A roadmap

神经网络的原型:multi-layer perceptron (MLP),有层,参数为, 其中A表示权重矩阵 (weight matrix),b表示偏离向量(bias vector),每层都有一个激活函数active function,

2025-03-13 20:03:55 866 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除