穿书之恶毒女配-优快云博客

原创 Github学生认证教程-2025.09.07版

1. 不要开vpn,打开GitHub网站，点击头像-setting界面，点击 Start an Application。如果不开vpn打不开github的话，就使用手机热点连接，或者换一个浏览器。2. 点击之后会出现如下的界面，按照图示进行操作，会直接出现关联邮箱的学校，再点击分享位置。3. 完善账单信息（账单付款地址填写真实姓名和学校地址）2. 完善个人信息，账号关联学校邮箱。3. 提交完成，等待通过即可。1. 注册了一段时间的账号。4. 记事本如下，截图保存。

2025-09-07 14:38:18 372

原创 Set Cover 问题介绍及与ATO问题的关联

给定一组集合，每个集合都有其cost值。要求找到能够覆盖其中所有元素的一组集合，使得总成本最小。资源选择问题、设施选址问题（移动基站的选址、物流中心的选址）等都是经典的Set Cover问题。：Set Cover是经典的NP-Hard问题。更甚者，已证明不存在优于O(log n)的近似算法（除非P=NP），这意味着任何多项式时间算法在最坏情况下的解都可能比最优解差log n倍。

2025-09-01 15:21:16 339

原创 StableBaselines3强化学习框架简明教程

Stable Baselines3 (SB3) 是基于 PyTorch 的强化学习库，提供多种经典强化学习算法（如 PPO、DQN、A2C 等）。

2025-03-29 14:26:02 1748

原创写代码时用到的常用函数记录（常更）

写代码时候的一些记录

2025-03-27 11:56:38 367

原创【论文阅读】Research Handbook on Inventory ManagemenT --- Chap.1 Lost-sales inventory systems

如果可用的库存不足以满足需求，则假定丢失了过剩的需求。这个定义与backordered的定义是相悖的。

2025-03-27 11:56:10 1521 1

原创 Numpy的数组拼接函数——hstack, vstack, stack 及concatenate的操作指南

np.hstack：沿列方向拼接数组，要求行数相同。np.vstack：沿行方向拼接数组，要求列数相同。：更通用的拼接函数，可以沿指定轴拼接。np.stack：沿新轴堆叠数组，创建更高维度的数组。

2025-03-20 19:51:04 499

原创【论文笔记】Deep Policy Iteration with Integer Programming for Inventory Management

提出了一种结合整数规划和深度强化学习的算法（PARL），用于解决库存管理中的复杂问题。该算法通过求解一个整数规划问题来寻找最优的动作值，这个整数规划问题的目标函数是价值函数，约束条件包括库存问题的实际约束和神经网络中权重（W）和偏置（b）的约束。在更新策略网络时，使用这个求解器找到的最优动作值来优化策略。同时，价值网络仍然使用均值误差（MSE）来更新，通过最小化预测价值和实际价值之间的误差来训练神经网络。

2025-03-16 15:59:28 1312 1

原创【论文笔记】Deep reinforcement learning for inventory control: A roadmap

神经网络的原型：multi-layer perceptron (MLP)，有层，参数为，其中A表示权重矩阵 (weight matrix)，b表示偏离向量（bias vector），每层都有一个激活函数active function，

2025-03-13 20:03:55 866 1

weixin_48002746的博客