自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 词索引与词嵌入:从整数到语义向量的进化

【代码】词索引与词嵌入:从整数到语义向量的进化。

2025-05-09 10:06:34 242

原创 为什么这两个代码就差个tqdm/print,速度能差10倍多

【代码】为什么这两个代码就差个tqdm/print,速度能差10倍多。

2025-04-23 19:51:22 230

原创 解决报错UserWarning: Failed to initialize NumPy: DLL load failed while importing _multiarray_umath: 找不到指

E:\anaconda\envs\envcat\lib\site-packages\torch\_subclasses\functional_tensor.py:275: UserWarning: Failed to initialize NumPy: DLL load failed while importing _multiarray_umath: 找不到指定的模块。卸载numpy用conda重新安装,不要用pip安装。

2025-04-13 20:04:59 1691

原创 CLIP是什么

CLIP (Contrastive Language-Image Pre-training) 是OpenAI提出的一个重要的多模态学习模型。- 通过对比学习方法将图像和文本映射到同一个语义空间。- 图像编码器:通常使用ResNet等视觉模型。- 目标是最大化相关图像-文本对的相似性。- 最小化不相关图像-文本对的相似性。- 可以直接进行图像分类、检索等任务。- 使用大规模网络图像-文本对。- Zero-shot学习能力。- 学习图像和文本的联合表示。- 学习通用的视觉-语言表示。- 文本引导的图像生成。

2025-03-29 18:41:54 311

原创 空间分辨率

空间分辨率学习通常是指在计算机视觉和图像处理任务中,如何有效地处理和理解不同分辨率的图像数据,以提升图像的分析能力与分类精度。这一过程涉及到多个方面,包括图像采集、特征提取、模型训练和评估等。

2025-03-11 17:24:48 790

原创 预训练权重是否加载的区别

从头训练模型,参数是随机初始化的。:加载 ImageNet 上训练好的权重,适合迁移学习或直接使用预训练模型的能力。

2025-02-22 18:36:23 458

原创 python中输入路径前面的r

我们看到有些路径前面有r,但有的直接输入路径,这有什么区别呢在 Python 中,路径前面加r是为了表示原始字符串(Raw String)。这会告诉 Python 不要对字符串中的转义字符(如\n,\t等)进行特殊处理,而是直接将它们作为普通字符对待。有r和没有r的区别1.带r的字符串(原始字符串)当在路径前加r时,所有的反斜杠\都会直接被当作普通的文本,包括转义字符。例如:path = r"C:\Users\ABC\Desktop\project

2024-12-05 21:02:41 946

原创 NetAdapt 算法

NetAdapt(Network Adaptation)是一种。

2024-12-03 19:26:51 869

原创 深度可分离卷积

(Depthwise Separable Convolution)是一种优化卷积操作的方法,用来减少和,同时还能保持相对较高的性能表现。和:深度可分离卷积的核心思想是分而治之,先按通道逐一处理(Depthwise),再通过 1x1 卷积结合各个通道的信息(Pointwise),以实现卷积的高效性。普通卷积好比多个厨师同时合作制作一整道菜,而深度可分离卷积则将任务分解为两部分:每个厨师负责切配一种食材(逐通道卷积)。最后,主厨收集所有切好的食材并完成装盘(点卷积)。

2024-11-25 16:21:20 1040

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除