- 博客(13)
- 收藏
- 关注
原创 浮点数的快速记忆
即:S=1 M=110 E=9,所以得到1 1001 110,0xce。原尾数 = 1.100110101010101010101010101。S = 第27位后面所有位的或(逻辑“或”)FP8的E5M2格式,E=5,bias=2。格式:E5M2 E4M3。前24位 → G R S。指数全1,尾数不全为0。
2025-05-28 16:28:56
254
原创 AI框架类型
定义: 用于部署和实时运行模型,为在线系统(如 Web 服务、实时推荐系统)提供 AI 推理支持。通常开发者先在离线框架中完成模型的训练和调优,然后通过在线框架将训练好的模型部署到生产环境。代表: OpenVINO(Intel)、TVM、NVIDIA CUDA(底层库)。代表: TensorFlow、PyTorch、Caffe、Keras。定义: 用于离线训练和批量推理,通常支持分布式训练和高效数据处理。面向传统机器学习模型(如回归、分类、聚类等)。(一)AI 框架分类:在线框架与离线框架。
2025-01-13 09:37:42
533
原创 卷积的基本操作学习(二)
如果第一步转化成列向量,则这里应该转化成行向量,这是由矩阵乘法的计算特性决定的,即一个矩阵的每一行和另一个矩阵的每一列做内积,所以特征图和卷积核只能一个展开为行,一个展开为列。以蓝色的特征图为例,它是一个 3 x 3 的矩阵,而卷积核是一个 2 x 2 的矩阵,当卷积核的滑动步长为 1 时,那么传统的直接卷积计算一共需要进行 4 次卷积核与对应特征子矩阵之间的点积运算。将卷积过程中用到的所有特征子矩阵整合成一个大型矩阵存放在连续的内存中,虽然增加了存储成本,但是减少了内存访问的次数,从而缩短了计算时间。
2025-01-01 17:18:59
427
原创 线程中的锁
是指分布在不同任务之间的若干程序片断,它们的运行必须严格按照规定的某种先后次序来运行,这种先后次序依赖于要完成的特定的任务。最基本的场景就是:两个或两个以上的进程或线程在运行过程中协同步调,按预定的先后次序运行。是指分步在不同任务之间的若干程序片断,当某个任务运行其中一个程序片段时,其它任务就不能运行它们之中的任一程序片段,只能等到该任务运行完这个程序片段后才可以运行。最基本的场景就是:一个公共资源同一时刻只能被一个进程或线程使用,多个进程或线程不能同时使用公共资源。信号量(同步与互斥)
2024-11-26 11:23:05
784
1
原创 IR Drop
这个IR drop也是会有相应spec要求的,一般会按照供电电压的百分比来定,如果定了10%,对于5V的输入来说,就要求IR drop不能大于0.5V。 即电压降,就是指从芯片源头供电到instance所消耗的电压,对于flipchip封装形式,就是从bump到instance PG pin的电压降。接的外界输入电压Vdd 5V,Vss 0V,这个bump的电压到某一个instance后,可能Vdd只剩4V,Vss变为1V,那么这个instance得到的电压就只有3V,电压降就是2V。
2024-11-13 15:30:46
1456
原创 AI模型的学习
MobileNet 的设计目的是在计算资源有限的环境中实现高效的图像分类、目标检测、语义分割等任务。MobileNet 在许多实际应用中表现出色,尤其是在计算资源受限的设备上,比如手机、嵌入式系统、物联网设备等,常用于人脸识别、物体检测、手势识别等任务。可调整的模型复杂度:MobileNet 使用了两个超参数(宽度乘子和分辨率乘子)来平衡模型的精度与效率,可以根据需要调节模型的计算量和精度。轻量级网络结构:MobileNet 的结构非常轻量化,适合资源有限的设备。
2024-10-29 11:00:20
279
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅