- 博客(20)
- 收藏
- 关注
原创 HPCC论文阅读笔记
利用INT获取精确的链路负载信息,精确控制流量解决了INT信息在拥塞时延迟,对INT信息过度反应的问题,利用空闲队列,维持接近0的网内队列HPCC公平,易部署数据中心网络对高带宽、低延迟的要求较高,但是这面临着挑战。本文列举了两个具有代表性的案例。case1:PFCstormRDMA云存储集群曾因为一次大规模incast,加上厂商交换机持续发送PFC pause帧,而导致全网范围的大规模流量下降。在这类集群中,大规模incast和拥塞是常态。
2024-06-19 16:18:29
1263
1
原创 Elasticity Detection阅读笔记
一个新的定义:弹性,定义弹性尺度公式检测交叉流是否为弹性的方法叫NimbusNimbus方法:将发送速率调制为非对称正弦脉冲,诱发交叉流发生变化,通过变化的幅度代入弹性公式,来判定是否为弹性流NimbusCC:以Nimbus作为模式转换器的拥塞控制算法,分为两个模式:TCP竞争模式和延迟控制模式,具体模式中可以使用已存在的各种算法。当Nimbus检测到弹性流时使用TCP竞争模式,否则使用延迟控制模式。本文定义了交叉流的属性,弹性,在此发现的基础上建立了相关的系统。
2024-06-19 16:15:20
1001
原创 copa论文阅读笔记
Copa是一种基于延迟的端到端的拥塞控制算法,采用三个idea组合实现:通过优化一个效用函数(与吞吐量和延迟相关),求得其最优速率为$$1/(\delta d_q)$$,作为target rate通过窗口更新规则(window update rule)调整拥塞窗口往target rate的方向变化这两个idea构成了一个delay-based的CC算法,能够实现高利用率、低延时的目标。但是delay-based的CC算法有一个通病,就是与loss-based的CC算法竞争时,争抢不到带宽。
2024-06-19 16:10:27
1264
1
原创 C语言实现手动封装数据包发送并解析
本文章的学习旨在完成手动封装以太网头部,外层IP头部,GRE头部,内层IP头部以及TCP头部的内容,并将数据发送给服务端,服务端接收后手动解析数据包的内容并打印出来。
2024-06-19 13:10:33
1224
原创 解决ubuntu新虚拟机下apt update报错和git clone失败的问题
新的虚拟机,安装git发现apt不能正常使用,报错如下第一反应是考虑到apt源配置可能有问题,用vi /etc/apt/source.list打开源发现没有问题,用ping测试网络,ping百度报错unkown host,ping 8.8.8.8可以通,应该是域名解析错误,vi /etc/resolv.conf更改nameserver,输入两个8.8.8.8和8.8.4.4,然后apt update可以成功了。
2023-05-18 20:40:58
1716
原创 解决openMPI报错
原因是MPI不建议在root下使用,解决方法是加参数强制允许或使用进入用户执行命令,后面尝试了添加用户并在用户下执行命令,发现这样会出现ssh连接的问题,所以此报错的解决办法是在root加--allow-run-as-root强制执行。执行mpirun的命令后发现报错如下。
2023-05-18 20:37:22
3745
2
原创 设置ssh服务器免密连接
完成以上操作后就实现了主机免密登录服务器,在实现多机通信前,需要手动进行一次通信(ssh +ip地址),原因是第一次进行连接时SSH会要求确认该主机的身份,以确保正在连接到正确的主机。
2023-05-18 20:34:29
245
1
原创 NCCL相关笔记
NCCL是NVIDIA集合通信库(NVIDIA Collective Communications Library)的简称,是用于加速多GPU之间通信的库,能够实现集合通信和点对点通信。
2023-05-18 20:18:00
9987
2
原创 ubuntu20.04解决域名无法解析
初步判断是无法解析域名的问题,为解决这一问题,首先需要确保网络的连通性,使用ping 8.8.8.8命令测试网络连通性,然后使用以下命令配置DNS服务器。退出保存,然后发现apt update可以运行成功了。
2023-04-24 15:09:35
3350
4
原创 ubuntu18.04解决apt --fixed-broken install
ubuntu18.04解决apt --fixed-broken install
2023-03-22 11:16:24
2336
原创 rdma_bench环境搭建
近期本人在学习rdma相关的基础知识,其中想使用rdma_bench仓库中相关的代码,但是由于这个仓库的代码已经比较老,所以需要修改,在网上进行一番搜索之后发现已经有大佬将修改好的代码上传到了Github仓库中,详情参考。原仓库作者是对CX-3网卡(早年的网卡)进行实验,目前我所使用的网卡是CX-6,修改后的代码也是对应的CX-6网卡,下面附上我环境搭建的过程。由于我是在root下操作,需要把sudo删掉,然后还会有-E的报错,通过查询相关解决方案,只需要将-E替换成set -e即可。
2023-03-19 17:22:40
242
转载 RDMA学习笔记
RDMA软件层在内存中规划一片区域,用于存放和收发数据,这个区域将主机内存和RDMA关联,确保RDMA在进行数据传输时能够正确高效地访问内存区域,这个内存区域就是MR,注册MR 可以使用verbs提供的接口ibv_reg_mr(),在注册这一过程中,内存会创建一个VA和PA之间的映射表,当RDMA网卡需要获取PA时通过查表即可获取PA。注册PD:调用ibv_alloc_pd函数分配一个PD对象,该函数会返回一个struct ibv_pd* 类型的指针,指向分配的 PD 对象。
2023-03-16 23:08:57
437
原创 python报错range() takes no keyword arguments
pythpn初学者解决报错:range() takes no keyword arguments
2022-12-05 22:20:07
3297
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人