
深度学习
文章平均质量分 56
为啥全要学
在下小白
展开
-
大模型中常见的精度类型及区别
• 指数位:BF16的指数位(8位)与FP32对齐,数值范围达±3.4×10³⁸,远超FP16的±65504。实际应用中需根据硬件支持、任务需求和模型规模综合权衡。• 尾数位:FP16尾数位(10位)比BF16(7位)多,精度更高,适合小数值运算(如图像处理),但对大模型训练中的梯度爆炸敏感。• BF16:专为大规模模型设计(如GPT、BERT),在TPU和NVIDIA A100等硬件上优化,支持更大批量训练。• FP16:适合资源受限场景(如移动端)、中小模型训练,需搭配梯度缩放技术防止数值溢出。原创 2025-05-03 15:18:44 · 115 阅读 · 0 评论 -
langchain使用向量数据库进行检索时,使用重排序模型
【代码】langchain使用向量数据库进行检索时,使用重排序模型。原创 2025-05-02 20:58:52 · 45 阅读 · 0 评论 -
PyTorch:从零实现一个双向循环神经网络
从零实现一个双向循环神经网络(Bi-directional Recurrent Neural Network, Bi-RNN)。原创 2024-08-12 20:59:13 · 845 阅读 · 0 评论 -
pytorch : 从零开始实现深度 RNN
从零实现一个深度循环神经网络(Deep RNN)原创 2024-08-12 20:57:34 · 319 阅读 · 0 评论 -
深度学习:池化(Pooling)
池化原创 2024-07-31 21:33:53 · 1337 阅读 · 0 评论 -
深度学习:转置卷积
转置卷积原创 2024-07-31 21:10:06 · 785 阅读 · 0 评论 -
深度学习:如何计算感受野
8×88×8。原创 2024-07-29 23:06:07 · 1468 阅读 · 0 评论 -
目标检测:如何计算计算两个边界框集合(boxes1和boxes2)之间的交并比(IoU)
如何计算计算两个边界框集合(boxes1和boxes2)之间的交并比(IoU)原创 2024-07-28 15:37:40 · 375 阅读 · 0 评论 -
目标检测:将锚点移动到像素的中心,需要设置偏移量
目标检测 求偏移量原创 2024-07-28 15:09:23 · 595 阅读 · 0 评论 -
目标检测:锚框的大小为什么宽乘以根号r
目标检测 锚框原创 2024-07-28 15:01:35 · 652 阅读 · 0 评论 -
pytorch学习--使用m1 进行训练
【代码】pytorch学习--使用m1 进行训练。原创 2024-07-13 23:30:42 · 368 阅读 · 0 评论 -
mxnet安装
mxnet安装网址:https://mxnet.incubator.apache.org/get_started?version=v1.6.0&platform=windows&language=python&processor=cpu&environ=pip&进入之后是:选择你要安装的版本,然后下面会出现安装语句:复制安装即可...原创 2021-06-26 13:20:58 · 581 阅读 · 0 评论 -
tf.keras.layers.Flatten
tf.keras.layers.Flatten使输入展平,不会影响批处理的大小。如果输入形状为(batch,),没有特征轴,则展平会增加额外的通道尺寸,输出形状为(batch,1)。tf.keras.layers.Flatten( data_format=None, **kwargs)data_format:一个字符串,是channels _ last(默认)还是channels _ first。输入中尺寸的顺序。channels_last对应于具有形状的输入(batch, ..., ch原创 2021-06-23 19:32:22 · 2913 阅读 · 0 评论 -
PyTorch入门学习(一)
PyTorch 是一个基于 Python 的科学计算包,主要定位两类人群:NumPy 的替代品,可以利用 GPU 的性能进行计算。深度学习研究平台拥有足够的灵活性和速度#导入pytorchimport torchimport torchvisionimport numpy as npTensors 类似于 NumPy 的 ndarrays ,同时 Tensors 可以使用 GPU 进行计算。1.张量tensora:各种数值数据称为张量b:常数 scaler 0阶张量c:向量 v原创 2021-05-10 22:48:07 · 137 阅读 · 0 评论