- 博客(62)
- 收藏
- 关注
原创 神经网络激活函数--Sigmoid、Tanh、Relu、Softmax
文主要总结了Sigmoid、Tanh、Relu、Softmax 四种函数;给出了函数的形式,优缺点和图像。
2024-01-18 14:58:58
3544
1
原创 一个简单的KNN实现方法
对于许多离散问题,经过神经网络解决再通过softmax之后每一个值在[0,1]之间的连续变量,想要将其离散化,即离散化到每个元素都是 binary-variable,即 0-1 ,这时可以用KNN方法,其实就是找到与这个向量的方差最小的K个临近向量。
2024-01-07 16:19:27
414
原创 visdom 使用以及 localhost拒绝连接
win10 ping localhost显示[::1]_netsh interface ipv6 show prefixpolicies-优快云博客。visdom 使用出错,其问题1是未打开 visdom,2是 localhost需要设置。肯定和visdom有关,去github找 visdom相关的tutorial。,可用来对于 实时,富数据的 创建,组织和共享。发现在程序运行之前,必须先启动visdom。和Numpy还有pytorch。问题在于,我的浏览器打不开。Visdom:一个灵活的。
2024-01-02 18:28:07
1670
原创 Pycharm 切换interpreter---python的环境和第三方库问题
这篇回答两个问题:1.为什么在 pycharm中打开新的project,切换interpreter 之后发现自己之前装的库消失了?2.为什么interpreter 切换到python'3.8了, terminal 还是在 3.9??
2023-12-29 15:41:31
3568
原创 Deep Reinforcement Learning in Large Discrete Action Spaces--Wolpertinger Architecture
自己在使用DDPG解决问题时,会遇到action space很大的情况,会导致算法不收敛或者收敛得很慢。如何解决这种Large Discrete Action Spaces,即大规模离散动作空间得问题。
2023-12-28 23:17:15
895
1
原创 GNN+RL:Flexible Job-Shop Scheduling via Graph Neural Network and Deep Reinforcement Learning
看懂GNN 如何和 RL 结合的方法。 本文的GNN是HGNN,RL用的PPO算法。主要是看懂GNN和RL如何连接起来以及如何训练的。
2023-12-27 22:08:30
2546
2
原创 惨案后续之---重装python 3.8版本的一系列操作
接上昨日惨案,大意就是 为了解决一个错误,要安装gym==0.18.0,经历了乱七八糟得出结论要重装一个
2023-12-26 13:19:33
1761
原创 AssertionError: The environment must specify an action space. 报错 引发的惨案
起因是:从github上下载了一个代码,运行出错。整体流程:报错,解决方案是 降级gym到 gym==0.18.02.为了降级gym gym==0.18.0 报错,发现需要降级 setuptools ==65.5.03.降级setuptools ==65.5.0 之后报错 failed build wheel for Pillow。4.最终发现 要想安装 gym==0.18.0,得让pilow < 7.2.0版本。
2023-12-26 00:00:25
2614
原创 图傅里叶变换
图信号定义:给定图G=(VE),V为节点集合,长度为N,图信号是一种描述V→R的映射,向量表示每个x代表对应下标的节点上的信号强度。与普通信号不同的是:图信号定义在节点上,节点存在固有的关联结构。
2023-11-01 16:04:17
376
原创 torch_geometric,scatter,sparse, cluster的安装失败
torch_geometric,scatter,sparse, cluster的安装失败
2023-10-31 14:27:27
404
1
原创 MPNN 模型:GNN 传递规则的实现
首先,假如我们定义一个极简的传递规则A是邻接矩阵,X是特征矩阵, 其物理意义就是 通过矩阵乘法操作,批量把图中的相邻节点汇聚到当前节点。但是由于A的对角线都是 0.因此自身的节点特征会被过滤掉。图神经网络的核心是 吸周围之精华,再叠加自身,因而需要改进来保留自身特征。如何做?方法是给每个节点添加一个自环,即将邻接矩阵对角线值各加1,此时用表示,做到了聚合邻居节点并保留自身信息。但是当图过于复杂时,聚合邻居信息会不断执行矩阵乘法或加法,可能导致特征值太大而溢出。如何做?方法是邻接矩阵归一化。
2023-10-15 23:38:50
462
原创 GNN+RA 文献阅读
[1]X. Wang et al., ‘Scalable Resource Management for Dynamic MEC: An Unsupervised Link-Output Graph Neural Network Approach’.paper code:GitHub - UNIC-Lab/LOGNN: This is the code for paper "Scalable Resource Management for Dynamic MEC: An Unsupervised Link-
2023-10-10 22:33:24
313
2
原创 如何理解功率谱/能量谱密度?它与自相关函数的关系?
一个能量信号自相关函数的傅里叶变换等价于它的能量谱密度,一个功率信号自相关函数的傅里叶变换等价于它的功率谱密度。
2023-09-20 22:48:08
14327
2
原创 文献阅读 GNN -How to Build a Graph-Based Deep Learning Architecture in Traffic Domain: A Survey
这是一篇关于GNN在交通领域的应用的survey。
2023-09-10 17:31:07
141
原创 【无标题】
决策变量: assignment (binary)and partial offloading【0,1】每一个 VN (Vehicle Node)可以由多个EN(edge Node)覆盖,选择最优的EN。定义了多种训练场景,对于每个训练场景,Q-table的维度是不同的。Mobility 考虑的是停留时间。
2023-08-17 20:08:29
118
原创 RL+RA 文献阅读 CO and RA in MEC-Enabled Integrated Aerial-Terrestrial Vehicular Networks: A RL approach
所提出的基于DDQL的解决方案的计算复杂度取决于神经网络的大小,包括输入、输出和隐藏层,以及系统中的智能体数量。此外,由于系统中的每个车辆都充当智能体,在线训练过程中系统的计算复杂度可以表示为O( K · W · J · t · | A | · | S | · e),其中K表示车辆数量,W表示训练集数量,J为批次大小,e为隐含层神经元个数,A为动作集合,S为状态空间。因此,我们还包括η和,作为一个低维的指纹,来跟踪智能体的策略变化的轨迹,以减轻由于多智能体RL导致的非平稳环境的影响。
2023-08-17 15:30:44
182
原创 RL+RA 文献阅读 Computation offloading optimization for UAV-assisted mobile edge computing
考虑时隙无人机辅助MEC系统中的时变信道状态,联合优化用户调度、无人机移动性和资源分配,将非凸计算卸载问题建模为马尔科夫决策过程( Markov Decision Process,MDP )问题,最小化处理时延。
2023-08-15 17:55:01
206
原创 RL+RA 文献Multi-Agent Deep Reinforcement Learning for Enhancement of Distributed Resource Allocation
在C - V2X网络中,一个频段被划分为若干个子信道,每个子信道在1 ms的子帧中表示一组无线资源块( Radio Resource Block,RB ),如图1所示。在LBT中,每个车辆在接入信道前都会进行明确的信道评估和潜在的随机退避。在模式- 1中,资源分配由蜂窝网络基础设施管理,而在模式- 2中,每个车辆自主地选择自己的资源,如图2 ( b )所示。为了保持极低的延迟(例如, 3ms的端到端延迟)和高可靠性的(例如, 99.999 %的PRR),需要建立快速的重复传输和预配置资源的即时访问。
2023-08-15 17:49:32
195
原创 RL+RA 文献阅读 survey: RL/DRL Meets Vehicular Task Offloading Using Edge and Vehicular Cloudlet
本文主要总结了基于现有的关于基于RL / DRL的车辆任务卸载的文献。
2023-08-11 14:12:55
232
原创 GNN的一篇入门 :A Gentle Introduction to Graph Neural Networks
本文是“A Gentle Introduction to Graph Neural Networks”的阅读笔记
2023-07-27 20:54:19
542
原创 RL+RA 文献阅读 Resource Allocation for Delay-Sensitive Vehicle-to-Multi-Edges (V2Es) Communications in V
总体来说,有两种任务,计算型任务和服务请求,计算型按照task offloading的思路 ,在edge或者cloud计算,有相应的时延;3 )异构性,即任务/服务的重要性和边缘节点能力的异构性。提出了多Agent深度确定性策略梯度算法( MADDPG ),该算法采用集中式训练和分布式执行的模式,通过学习获得最优策略。3.根据应用的不同,移动服务或内容对用户的重要性是不同的,从而表现出不同的延迟/质量需求。edge node有一个队列存储任务请求,任务有三类0,1,2,同类型FIFO原则。
2023-07-25 21:40:30
196
原创 RL+CO survey :Reinforcement Learning for Combinatorial Optimization: A Survey
这篇paper主要讲的是将RL应用于解决组合优化问题(combinatorial optimization,CO)的一些基本思想和对于几个 经典问题的RL解决算法的进展。此篇Blog旨在总结前半部分的思想,对于后文经典问题进展部分暂时忽略。
2023-07-20 11:03:47
326
原创 《网络是怎样连接的》(一)
本文主要取材于 《网络是怎样连接的》 第一章。简述:在浏览器输入一个网址,,但是直接使用域名无法找到Web服务器。需要使用,然后客户端可以创建套接字,延伸出管道根据IP地址和端口号,去。套接字连接之后相当于客户端和服务端之间生成了管道,就可以收发数据了。本章共四个章节,(1)生成HTTP请求消息 (2)向DNS服务器查询Web服务器的IP地址(3)全世界DNS服务器的大接力 (4)委托协议栈发送消息。
2023-07-19 15:21:55
390
1
原创 MEC V2X业务解析(二)(ETSI GS MEC 030 V3.1.1 (2023-03))
简述:V2X业务信息服务可以预测QoS来帮助车辆决策,一种是针对特性路线的,即journey-specific predictive QoS;另一种是多域的端到端预测,可预测车车间,车到设施之间QoS。
2023-07-16 10:41:55
222
4*3 grid world问题Q-learnig 代码,附带每行代码的汉语解析
2024-01-07
判定反馈均衡器 Decision Feedback Equalization 的matlab实现
2024-01-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人