- 博客(16)
- 资源 (1)
- 收藏
- 关注
转载 算力运算单位
1P=1024T 1T=1024G 1G=1024M 1M=1024K 这里的TFLOPS就是每秒运算能力为1T=10的12次方。TFlops/s,可以简单写为T/s, 是数据流量的计数单位,意思是”1万亿次浮点指令每秒”,它是衡量一个电脑计算能力的标准。在某些情况下,还使用 TOPS/W 来作为评价处理器运算能力的一个性能指标,TOPS/W 用于度量在1W功耗的情况下,处理器能进行多少万亿次操作。一个 TFLOPS (teraFLOPS) 等于每秒1万亿 (=10^12) 次的浮点运算,
2023-08-24 16:40:56
9060
转载 FP16、FP32、INT8、混合精度
INT8,八位整型占用1个字节,INT8是一种定点计算方式,代表整数运算,一般是由浮点运算量化而来。因此,虽然INT8比FP16精度低,但是数据量小、能耗低,计算速度相对更快,更符合端侧运算的特点;在数据表示范围上,FP32和FP16 表示的整数范围是一样的,小数部分表示不一样,存在舍入误差;FP32 是单精度浮点数,用8bit 表示指数,23bit 表示小数,占用4字节;FP16半精度浮点数,用5bit 表示指数,10bit 表示小数,占用2字节;最高位代表符号位(0 - 正,1 - 负)
2023-08-07 15:04:36
8103
转载 GPU浮点计算能力
对于浮点计算来说,CPU可以同时支持不同精度的浮点运算,但在GPU里针对单精度和双精度就需要各自独立的计算单元,一般在GPU里支持单精度运算的单精度ALU(算术逻辑单元)称之为FP32 core,而把用作双精度运算的双精度ALU称之为DP unit或者FP64 core。单精度的浮点数中采用4个字节也就是32位二进制来表达一个数字,1位符号,8位指数,23位小数,有效位数为7位。双精度浮点数采用8个字节也就是64位二进制来表达一个数字,1位符号,11位指数,52位小数,有效位数为16位。
2023-08-07 14:50:13
711
原创 PCIe LTSSM状态机
Link Width协商只存在Configuration阶段,Recovery/L0无法改变Link Speed在Polling阶段都是2.5G,只会在Recovery阶段发生变化切速度只会在recovery阶段,切宽度只会在configuration阶段LinkUp状态位在首次进入Configuration状态为0,之后Recovery/L0以及再次进入Configuration都是1。
2023-08-02 14:31:59
3696
原创 PCIe中断机制
PCIe有三种中断,分别为I,其中INTx是可选的,MSI/MSI-X是必须实现的。MSI, message signal interrupt, 是PCI设备通过写一个特定消息到特定地址,从而触发一个CPU中断。特定消息指的是PCIe总线中的Memory Write TLP, 特定地址一般存放在MSI capability中。
2023-07-28 15:23:01
2758
原创 PCIe复位机制
PCI总线中定义了四种复位名称:冷复位(Cold Reset)、暖复位(Warm Reset)、热复位(Hot Reset)和功能层复位(Function-Level Reset,FLR)。其中FLR是PCIe Spec V2.0加入的功能,因此一般把另外三种复位统称为传统的复位方式(Conventional Reset)。其中冷复位和暖复位是基于边带信号PERST#的,又被统称为基本的复位方式(Fundamental Reset)。
2023-07-28 15:14:40
2284
原创 TLP的用途、格式、定义
与并行总线不同,像PCIe这样的串行传输总线不使用控制信号来识别给定时间链路上发生的事情。相反,它们发送的数据流必须具有预期的大小和可识别的格式,以便接收方能够理解内容。此外,PCIe在传输数据包时不使用任何立即握手。除了Logical Idle symbols(逻辑空闲符号) 和Ordered Sets(有序集)外,信息以由符号组成的数据包的基本块在活动PCIe链路上移动。两大类数据包是TLPs和DLLPs。信息包及其流在下图中进行了说明。
2023-07-18 17:17:41
3791
转载 基本概述PCI、PCI-X与PCIe的最大区别
是一种高速串行计算机扩展总线标准,它原来的名称为“3GIO”,是由英特尔在2001年提出的,旨在替代旧的PCI,PCI-X和AGP总线标准。PCI-Express是用来互联诸如计算和通信平台应用中外围设备的第三代高性能I/O总线。第一代包括ISA、EISA、VESA和微通道(Micro Channel)总线,而第二代总线则包括了PCI、AGP和PCI-X。PCIe是一种能够应用与移动设备、台式电脑、工作站、服务器、嵌入式计算和通信平台等所有周边的I/O设备互联的总线。
2023-07-18 16:08:00
4973
原创 PCIe分层结构简介
PCIe定义了以下三层结构:事务层(Transaction Layer)数据链路层(Data Link Layer)和物理层(Physical Layer)(Transaction Layer):主要职责是创建(发送)或者解析(接收)TLP (Transaction Layer packet),流量控制,QoS,事务排序等。
2023-07-18 15:16:21
1865
原创 PCIe 错误检测和处理
规范使用了四个关于错误的通用术语,定义如下:1.——确定存在错误的过程。错误是由代理发现的,这是由于本地问题,例如接收到坏数据包,或者因为它从另一个设备接收到了发出错误信号的数据包(如中毒数据包)。2.-根据检测到的错误在体系结构寄存器中设置适当的位,作为错误处理软件的辅助。3.—通知系统存在错误情况。这可以采取将错误消息传递到根复合体的形式,假设设备能够发送错误消息。反过来,当根收到错误消息时,它可以向系统发送中断。4.-一个代理通过发送错误消息通知另一个代理错误情况的过程,
2023-07-14 11:55:06
11582
原创 PCIe错误分类
PCI Express错误可分为两类:不可纠正错误(Uncorrectable errors)和可纠正错误(Correctable errors)。这种分类将导致功能故障的错误与导致性能下降的错误区分开来。无法纠正的错误(Uncorrectable errors)可进一步分为致命错误(Fatal)或非致命错误(Non-Fatal)错误严重性分类为致命、不可纠正和可纠正,为平台提供了将错误映射到适当处理机制的机制。例如,平台可能会选择使用低优先级的性能监控软件来响应可纠正的错误。
2023-07-13 14:46:33
1443
原创 Redfish介绍和Postman工具使用
的诞生是为了替代IPMI ,由于IPMI自身的局限性和安全性缺陷,IPMI 在2015年公布2.0 v1.1标准后,不再更新,被RedFish永久代替Redfish 可扩展平台管理 API(The Redfish Scalable Platforms Management API(“Redfish”))是一种新的规范,其使用 RESTful 接口语义来访问定义在模型格式中的数据用于执行带外系统管理 (out-of-band systems management)。
2023-07-12 18:04:54
5158
原创 内存映射技术-MMIO
(Memory mapping I/O)即内存映射I/O,它是PCI规范的一部分,I/O设备被放置在内存空间而不是I/O空间。从处理器的角度看,内存映射I/O后系统设备访问起来和内存一样。这样访问AGP/PCI-E显卡上的帧缓存,BIOS,PCI设备就可以使用读写内存一样的汇编指令完成,简化了程序设计的难度和接口的复杂性。MMIO就是通过将外围设备映射到内存空间,便于CPU的访问。I/O作为CPU和外设交流的一个渠道,主要分为两种,一种是,一种是。
2023-07-11 16:59:01
9785
4
原创 Setpci 命令使用
setpci命令 是一个查询和配置PCI设备的使用工具在使用 setpci修改 PCI设备的配置空间内容时1)需要指定设备信息,也就是设备号,与 lspci类似,使用 -s xx:xx.x2)还需要指定待修改的寄存器的地址,范围是 0x00 ~ 0xFF,并且通过 ‘w’, ‘b’后缀指定数据宽度,其中,‘w’表示 2字节,‘b’表示 1字节,‘l’表示4字节3)还需要为寄存器指定修改后的值,例如:100+14.w=0xffff。
2023-07-11 10:31:04
2894
转载 PCIe热插拔:通知试热插拔&暴力热插拔
某些特殊的应用场合可能要求PCIe设备能够以高可靠性持续不间断运行,为此,PCIe总线采用热插拔(Hot Plug)和热切换(Hot Swap)技术,来实现不关闭系统电源的情况下更换PCIe卡设备。热切换和热插拔的主要区别是应用领域不同,热插拔主要应用于PC以及服务器的主板上的板卡连接,而热切换主要针对的是CPCI(CompactPCI ,一种常用于仪器仪表的接口)应用的。热插拔分为两种,一是通知式热插拔,一个是暴力热插拔,
2023-07-10 16:44:57
13611
1
原创 PCIe Capability结构寻址
在PCI 总线的基本配置空间中,包含一个Capabilities Pointer 寄存器,该寄存器存放Capabilities 结构链表的头指针。在一个PCIe 设备中,可能含有多个Capability 结构,这些寄存器组成一个链表。这些内容存储在PCIe配置空间,它们描述的是PCIe本身的特性。其中每一个Capability 结构都有唯一的ID 号,每一个Capability 寄存器都有一个指针,这个指针指向下一个Capability 结构,这个链表的最后一个Capability。链表开始的指针地址为。
2023-07-10 14:52:34
2452
3
PCI Express_Base SPEC
2018-10-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人