自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(35)
  • 收藏
  • 关注

原创 算法练习:19.JZ29 顺时针打印矩阵

【代码】算法练习:19.JZ29 顺时针打印矩阵。

2025-05-16 14:00:49 482

原创 算法练习:16.JZ25 合并两个排序的链表

【代码】算法练习:16.JZ25 合并两个排序的链表。

2025-05-16 14:00:05 394

原创 SDWebUI参数(自用留档)

batch count`与`batch size`模型推理会按 `batch_size=n` 来生成n张图像,再重复这一过程 `batch_count` 次。若`batch_siz。

2025-05-12 14:16:59 119

原创 手把手搭建SDWebUI:从源码到运行,完整指南

SDWebUI是一个**基于StableDiffusion扩散模型**的**开源WebUI**,旨在**简化和增强**使用Stable Diffusion模型进行图像生成的体验..

2025-05-12 14:14:41 2303

原创 快速上手 Docker:从入门到安装的简易指南(Mac、Windows、Ubuntu)

Docker是一个开源软件(平台),通过**容器技术**能够**自动化应用程序的部署、扩展和管理**。

2025-05-07 09:29:11 1157

原创 定格的瞬间会成为给未来自己的礼物——by 2025.4

2025.4的月度总结,希望我在下个月不会忘记哈哈~~

2025-05-06 05:04:28 380

原创 预训练到微调:深入理解AI的上下游任务

上下游任务是先后关系,上游任务先让模型学习到通用特征..

2025-05-05 20:12:54 2318

原创 探索Agent与MCP:推动AI应用的新动力

Agent可以是一段程序、一个机器人,甚至一个生物实体..

2025-05-03 06:04:21 214

原创 开启图像生成之旅:ComfyUI在Ubuntu上的安装全攻略

ComfyUI作为一个开源的、基于节点的文生图Web应用..

2025-04-30 07:11:49 1431

原创 探索目标检测:边界框与锚框的奥秘

为了方便模型训练,我们人为地将图片中物体的位置与种类标注出来,这就是真实边界框Ground Truth。「Ground Truth」等价于「Ground Truth Bounding Box(GT BBox)」边界框Bounding Box则更多的是一种泛指,它可以指代各个类型的框。

2025-04-29 14:16:42 1538

原创 解密分类模型的核心:Sigmoid与SoftMax的应用与奥秘

不止图片分类,目标检测也用到了,毕竟检测包括定位与分类嘛。

2025-04-28 07:25:07 1223

原创 一个目标检测新手的LabelImg入门指南:安装与使用技巧

咱们搞目标检测的,肯定得用过labelImg标定数据集吧。这里展示了快速安装方式与正常安装方式,还有基本的快捷键。

2025-04-28 07:14:12 355

原创 快速掌握WandB和YOLOv5集成WandB的指南

包括官网创建账号和本地安装wandb

2025-04-27 09:22:49 177

原创 从像素到实例:揭示图像分割如何改变视觉世界

语义分割仅关心某个像素属于哪个类,实例分割则关心每个像素属于哪个类的哪个实例。

2025-04-26 12:03:24 230

原创 从FP32到BF16,再到混合精度的全景解析

单精度(FP32)、半精度(FP16)和混合精度(FP32+FP16)是常见的浮点数计算格式,在深度学习模型的训练与推理中都有涉及。

2025-04-25 18:10:10 467

原创 Sora:开启文本到视频(图像)的全新篇章——OpenAI的创新之作

Sora是OpenAI开发的AI视频(图片)生成工具,结合了Transformer模型和扩散模型。

2025-04-24 09:55:45 456

原创 解码SDXL:从网络结构到模型细化,全面对比StableDiffusion

SDXL将「U-Net主干部分」扩大了三倍,并添加了更多的注意力。并引入了一个细化模型Refiner,以进一步提高生成图像的视觉逼真度。

2025-04-24 09:51:13 1281

原创 Bug处理:`error: unrecognized arguments: --local-rank=0`

笔者在2025.4.23使用vscode调试ComfyUI的代码时,出现了`error: unrecognized arguments: --local-rank=0`,完成了解决

2025-04-23 10:52:45 214

原创 初探Stable Diffusion:开启AI图像生成的新纪元

Stable Diffusion是由Stability AI开源发布与维护的创新图像生成技术,是一种支持文本到图像生成(Txt2Img)的模型。

2025-04-23 10:14:18 1264

原创 解锁快速AI生图:SDWebUI和ComfyUI谁是你的最佳拍档?

对于设计师等创作者来说,SDWebUI与ComfyUI肯定是不陌生了,两者正是当前火热的AI图像生成工具。笔者也在2025.4在Ubungu上部署了SDWebUI与ComfyUI。

2025-04-23 10:06:22 520

原创 LLaMA-Factory的概念与搭建

LLaMA-Factory是一个适合小白使用的训练平台。提供了基于Gradio的网页版工作台。

2025-03-31 16:40:36 303

原创 StableDiffusion的概念与搭建

Stable Diffusion是基于一个潜在扩散模型LDMs的生成模型。

2025-03-31 08:30:45 495

原创 多模态目标检测

3. 跨模态融合:将「图像特征 Image Feature」和「文本嵌入 Text Embedding」融合起来增强「文本和图像表示 Text and Image Represention」,以便模型更全面地理解目标。2. 文本描述输入:「文本编码器 Text Encoder」接收与图像关联的「文本 Text」并进行编码,得到「文本嵌入 Text Embedding」。1. 视觉信息输入:「图像编码器 Image Encoder」接收图像并提取特征,得到「图像特征 Image Feature」;

2024-05-01 11:09:15 1498 2

原创 多模态中的交叉注意力Cross Attentionon

CA作为多模态融合的一个重要组成部分,它通过注意力机制在不同模块之间建立联系,促进信息的交流和整合,从而提升了模型处理复杂任务的能力。

2024-05-01 11:00:34 4543 6

原创 Bug处理:YoloWorld的训练过程中进行验证出现IndexError: list index out of range

多模态模型YoloWorld的训练过程中进行验证出现IndexError: list index out of range

2024-04-28 10:04:49 625 6

原创 RuntimeError: cuDNN error: CUDNN_STATUS_INTERNAL_ERROR

遇到此问题时,先尝试减小batchsize,不行则再试试运行报错中提供的代码片段。

2024-04-26 19:00:24 492 1

原创 CV中token、Patch Embedding、positional encoding的概念(多模态、ViT、Transformer)

在不同的语境下,术语token等有不同的解释。笔者这里的概念解释基于Google的ViT原文。NLP中,token指的是一个单词word。而CV中,token的概念包含:token、class token、patch token等。

2024-04-26 09:20:17 3173 1

原创 conda命令与pip命令如何使用代理下载安装资源

conda和pip使用代理

2023-08-07 11:41:28 665 1

原创 Ubuntu忘记root密码后如何修改

Ubuntu忘记root密码后的修改方法

2023-08-07 11:36:52 1793 1

原创 在家庭局域网内无延迟观看电脑上的4K视频音乐(SMB文件共享)

本案例通过共享Windows上的文件夹,让处于同一局域网内的手机、平板、电脑能够无延迟地观看视频(速度上限取决于局域网速度)。PS:这个方法我从2022年开始用,今年开始推荐给自己的朋友用了。虽然很多人想弄家庭数据中心,但SMB这种服务更适合我们这种小白把~

2023-08-05 10:55:35 4290 2

原创 Torch的Bug处理:CUDA error:No kernel image is available..

在使用Torch时is_available()显示True,但使用起来就报错RuntimeError: CUDA error: no kernel image is available for execution on the device

2023-08-05 10:13:18 349 1

原创 Linux简易防火墙UFW的安装&使用

当自己的设备连入Internet后,总觉得没有防火墙就不放心,UFW是一个Linux自带的轻量级防火墙,安装简单,使用简单,非常适合我这种Linux新手使用。

2023-02-21 09:58:23 1187 1

原创 Linux下使用百度网盘下载与上传

在Linux系统下使用百度网盘,方便地上传与下载

2023-02-13 21:37:41 1145 3

原创 家庭数据中心:在Centos上搭建个人云盘NextCloud

NextCloud是一个不错的个人云盘方案。同步速度取决于服务器的地理位置和网络情况;空间可以低成本地自行增加;数据是保存在自己的服务器上的,这挺“浪漫”的;支持多用户使用云盘,与朋友一起使用互不干扰。............

2022-08-09 16:05:34 3776

原创 集成开发环境:Anaconda的安装与使用

Anaconda能够便捷地获取包并且对包进行管理,同时对环境进行统一管理的发行版本软件。它包含了conda,Python在内的超过180个科学包(numpy,scipy,ipythonnotebook)及其依赖项由专门公司维护,方便安装整理Py库可以创建虚拟环境,项目间互相不影响(Python本来就有虚拟环境的功能的)......

2022-07-26 09:58:15 3519

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除