- 博客(35)
- 收藏
- 关注
原创 SDWebUI参数(自用留档)
batch count`与`batch size`模型推理会按 `batch_size=n` 来生成n张图像,再重复这一过程 `batch_count` 次。若`batch_siz。
2025-05-12 14:16:59
119
原创 手把手搭建SDWebUI:从源码到运行,完整指南
SDWebUI是一个**基于StableDiffusion扩散模型**的**开源WebUI**,旨在**简化和增强**使用Stable Diffusion模型进行图像生成的体验..
2025-05-12 14:14:41
2303
原创 快速上手 Docker:从入门到安装的简易指南(Mac、Windows、Ubuntu)
Docker是一个开源软件(平台),通过**容器技术**能够**自动化应用程序的部署、扩展和管理**。
2025-05-07 09:29:11
1157
原创 探索目标检测:边界框与锚框的奥秘
为了方便模型训练,我们人为地将图片中物体的位置与种类标注出来,这就是真实边界框Ground Truth。「Ground Truth」等价于「Ground Truth Bounding Box(GT BBox)」边界框Bounding Box则更多的是一种泛指,它可以指代各个类型的框。
2025-04-29 14:16:42
1538
原创 一个目标检测新手的LabelImg入门指南:安装与使用技巧
咱们搞目标检测的,肯定得用过labelImg标定数据集吧。这里展示了快速安装方式与正常安装方式,还有基本的快捷键。
2025-04-28 07:14:12
355
原创 从FP32到BF16,再到混合精度的全景解析
单精度(FP32)、半精度(FP16)和混合精度(FP32+FP16)是常见的浮点数计算格式,在深度学习模型的训练与推理中都有涉及。
2025-04-25 18:10:10
467
原创 Sora:开启文本到视频(图像)的全新篇章——OpenAI的创新之作
Sora是OpenAI开发的AI视频(图片)生成工具,结合了Transformer模型和扩散模型。
2025-04-24 09:55:45
456
原创 解码SDXL:从网络结构到模型细化,全面对比StableDiffusion
SDXL将「U-Net主干部分」扩大了三倍,并添加了更多的注意力。并引入了一个细化模型Refiner,以进一步提高生成图像的视觉逼真度。
2025-04-24 09:51:13
1281
原创 Bug处理:`error: unrecognized arguments: --local-rank=0`
笔者在2025.4.23使用vscode调试ComfyUI的代码时,出现了`error: unrecognized arguments: --local-rank=0`,完成了解决
2025-04-23 10:52:45
214
原创 初探Stable Diffusion:开启AI图像生成的新纪元
Stable Diffusion是由Stability AI开源发布与维护的创新图像生成技术,是一种支持文本到图像生成(Txt2Img)的模型。
2025-04-23 10:14:18
1264
原创 解锁快速AI生图:SDWebUI和ComfyUI谁是你的最佳拍档?
对于设计师等创作者来说,SDWebUI与ComfyUI肯定是不陌生了,两者正是当前火热的AI图像生成工具。笔者也在2025.4在Ubungu上部署了SDWebUI与ComfyUI。
2025-04-23 10:06:22
520
原创 多模态目标检测
3. 跨模态融合:将「图像特征 Image Feature」和「文本嵌入 Text Embedding」融合起来增强「文本和图像表示 Text and Image Represention」,以便模型更全面地理解目标。2. 文本描述输入:「文本编码器 Text Encoder」接收与图像关联的「文本 Text」并进行编码,得到「文本嵌入 Text Embedding」。1. 视觉信息输入:「图像编码器 Image Encoder」接收图像并提取特征,得到「图像特征 Image Feature」;
2024-05-01 11:09:15
1498
2
原创 多模态中的交叉注意力Cross Attentionon
CA作为多模态融合的一个重要组成部分,它通过注意力机制在不同模块之间建立联系,促进信息的交流和整合,从而提升了模型处理复杂任务的能力。
2024-05-01 11:00:34
4543
6
原创 Bug处理:YoloWorld的训练过程中进行验证出现IndexError: list index out of range
多模态模型YoloWorld的训练过程中进行验证出现IndexError: list index out of range
2024-04-28 10:04:49
625
6
原创 RuntimeError: cuDNN error: CUDNN_STATUS_INTERNAL_ERROR
遇到此问题时,先尝试减小batchsize,不行则再试试运行报错中提供的代码片段。
2024-04-26 19:00:24
492
1
原创 CV中token、Patch Embedding、positional encoding的概念(多模态、ViT、Transformer)
在不同的语境下,术语token等有不同的解释。笔者这里的概念解释基于Google的ViT原文。NLP中,token指的是一个单词word。而CV中,token的概念包含:token、class token、patch token等。
2024-04-26 09:20:17
3173
1
原创 在家庭局域网内无延迟观看电脑上的4K视频音乐(SMB文件共享)
本案例通过共享Windows上的文件夹,让处于同一局域网内的手机、平板、电脑能够无延迟地观看视频(速度上限取决于局域网速度)。PS:这个方法我从2022年开始用,今年开始推荐给自己的朋友用了。虽然很多人想弄家庭数据中心,但SMB这种服务更适合我们这种小白把~
2023-08-05 10:55:35
4290
2
原创 Torch的Bug处理:CUDA error:No kernel image is available..
在使用Torch时is_available()显示True,但使用起来就报错RuntimeError: CUDA error: no kernel image is available for execution on the device
2023-08-05 10:13:18
349
1
原创 Linux简易防火墙UFW的安装&使用
当自己的设备连入Internet后,总觉得没有防火墙就不放心,UFW是一个Linux自带的轻量级防火墙,安装简单,使用简单,非常适合我这种Linux新手使用。
2023-02-21 09:58:23
1187
1
原创 家庭数据中心:在Centos上搭建个人云盘NextCloud
NextCloud是一个不错的个人云盘方案。同步速度取决于服务器的地理位置和网络情况;空间可以低成本地自行增加;数据是保存在自己的服务器上的,这挺“浪漫”的;支持多用户使用云盘,与朋友一起使用互不干扰。............
2022-08-09 16:05:34
3776
原创 集成开发环境:Anaconda的安装与使用
Anaconda能够便捷地获取包并且对包进行管理,同时对环境进行统一管理的发行版本软件。它包含了conda,Python在内的超过180个科学包(numpy,scipy,ipythonnotebook)及其依赖项由专门公司维护,方便安装整理Py库可以创建虚拟环境,项目间互相不影响(Python本来就有虚拟环境的功能的)......
2022-07-26 09:58:15
3519
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人