自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(41)
  • 收藏
  • 关注

原创 (自用)curl命令

是一个用于在命令行传输数据的开源工具。它支持多种网络协议,包括 HTTP、HTTPS、FTP、SMTP 等,广泛用于从服务器获取数据或向服务器发送数据。: 支持各种 HTTP 请求方法,如。: 从互联网服务器下载文件是。

2025-08-14 10:34:27 279

原创 (自用)text/event-stream与application/json的区别

【代码】(自用)text/event-stream与application/json的区别。

2025-08-14 09:34:26 173

原创 (自用)Mongo-Express的基础查询命令

【代码】(自用)Mongo-Express的基础查询命令。

2025-08-13 08:55:25 462

原创 深入理解智能体:规划执行与直接行动类 Agent 的比较分析

Agent作为当今人工智能的核心,本部分从笔者的实际使用案例来介绍,并用图例来解释说明。

2025-08-13 08:52:40 1972

原创 Bug处理:MongoDB容器报错“Read security file failed. error opening file: /data/mongodb.key: bad file“

MongoDB 对 keyFile 有严格的安全校验:文件必须仅对所属者可读(一般 400 或 600),且文件所属者必须与运行 mongod 的用户相同。在 mongo 容器里,mongod 默认以 uid 999 运行。当把主机上的文件挂载进容器时,文件的属主还是宿主机的 uid(默认为。执行后,文件属主变成了 uid 999,和容器内的 mongod 一致,加上 400 权限就通过了 MongoDB 的安全检查。由于属主不匹配,MongoDB 判定这个 keyfile 不安全,报。

2025-08-11 14:28:55 399

原创 后端访问OSS资源时,STS临时密钥与永久密钥的区别

【代码】后端访问OSS资源时,STS临时密钥与永久密钥的区别。

2025-08-07 09:25:19 440

原创 STS临时凭证需要RAM角色,而非RAM用户

而不是直接绑定到RAM用户(RAM User)。

2025-08-07 09:24:22 313

原创 OpenAI重磅推出开源模型!gpt-oss-120b与20b全面解析

OpenAI于2025年8月5日推出开源模型GPT-OSS-120B和GPT-OSS-20B,支持微调训练和128k上下文长度。120B模型在推理能力上接近O4-mini..

2025-08-06 10:19:04 2576

原创 深入解读Flux.1-Kontext:多模态AI图像生成与编辑的革新之作

Flux.1-Kontext作为多模态模型,支持"文本+图像"双输入,具备上下文感知、局部编辑和风格迁移能力,可保持角色一致性..

2025-07-29 10:32:04 3031

原创 手把手搭建SDWebUI:从源码到运行,完整指南

SDWebUI是一个**基于StableDiffusion扩散模型**的**开源WebUI**,旨在**简化和增强**使用Stable Diffusion模型进行图像生成的体验..

2025-05-12 14:14:41 3420 2

原创 快速上手 Docker:从入门到安装的简易指南(Mac、Windows、Ubuntu)

Docker是一个开源软件(平台),通过**容器技术**能够**自动化应用程序的部署、扩展和管理**。

2025-05-07 09:29:11 1381

原创 定格的瞬间会成为给未来自己的礼物——by 2025.4

2025.4的月度总结,希望我在下个月不会忘记哈哈~~

2025-05-06 05:04:28 473

原创 预训练到微调:深入理解AI的上下游任务

上下游任务是先后关系,上游任务先让模型学习到通用特征..

2025-05-05 20:12:54 2489

原创 探索Agent与MCP:推动AI应用的新动力

Agent可以是一段程序、一个机器人,甚至一个生物实体..

2025-05-03 06:04:21 270

原创 开启图像生成之旅:ComfyUI在Ubuntu上的安装全攻略

ComfyUI作为一个开源的、基于节点的文生图Web应用..

2025-04-30 07:11:49 3504

原创 探索目标检测:边界框与锚框的奥秘

为了方便模型训练,我们人为地将图片中物体的位置与种类标注出来,这就是真实边界框Ground Truth。「Ground Truth」等价于「Ground Truth Bounding Box(GT BBox)」边界框Bounding Box则更多的是一种泛指,它可以指代各个类型的框。

2025-04-29 14:16:42 1990

原创 解密分类模型的核心:Sigmoid与SoftMax的应用与奥秘

不止图片分类,目标检测也用到了,毕竟检测包括定位与分类嘛。

2025-04-28 07:25:07 1344

原创 一个目标检测新手的LabelImg入门指南:安装与使用技巧

咱们搞目标检测的,肯定得用过labelImg标定数据集吧。这里展示了快速安装方式与正常安装方式,还有基本的快捷键。

2025-04-28 07:14:12 642

原创 快速掌握WandB和YOLOv5集成WandB的指南

包括官网创建账号和本地安装wandb

2025-04-27 09:22:49 262

原创 从像素到实例:揭示图像分割如何改变视觉世界

语义分割仅关心某个像素属于哪个类,实例分割则关心每个像素属于哪个类的哪个实例。

2025-04-26 12:03:24 267

原创 从FP32到BF16,再到混合精度的全景解析

单精度(FP32)、半精度(FP16)和混合精度(FP32+FP16)是常见的浮点数计算格式,在深度学习模型的训练与推理中都有涉及。

2025-04-25 18:10:10 734

原创 Sora:开启文本到视频(图像)的全新篇章——OpenAI的创新之作

Sora是OpenAI开发的AI视频(图片)生成工具,结合了Transformer模型和扩散模型。

2025-04-24 09:55:45 799

原创 解码SDXL:从网络结构到模型细化,全面对比StableDiffusion

SDXL将「U-Net主干部分」扩大了三倍,并添加了更多的注意力。并引入了一个细化模型Refiner,以进一步提高生成图像的视觉逼真度。

2025-04-24 09:51:13 1697

原创 Bug处理:`error: unrecognized arguments: --local-rank=0`

笔者在2025.4.23使用vscode调试ComfyUI的代码时,出现了`error: unrecognized arguments: --local-rank=0`,完成了解决

2025-04-23 10:52:45 388

原创 初探Stable Diffusion:开启AI图像生成的新纪元

Stable Diffusion是由Stability AI开源发布与维护的创新图像生成技术,是一种支持文本到图像生成(Txt2Img)的模型。

2025-04-23 10:14:18 1456

原创 解锁快速AI生图:SDWebUI和ComfyUI谁是你的最佳拍档?

对于设计师等创作者来说,SDWebUI与ComfyUI肯定是不陌生了,两者正是当前火热的AI图像生成工具。笔者也在2025.4在Ubungu上部署了SDWebUI与ComfyUI。

2025-04-23 10:06:22 830

原创 LLaMA-Factory的概念与搭建

LLaMA-Factory是一个适合小白使用的训练平台。提供了基于Gradio的网页版工作台。

2025-03-31 16:40:36 428

原创 StableDiffusion的概念与搭建

Stable Diffusion是基于一个潜在扩散模型LDMs的生成模型。

2025-03-31 08:30:45 574

原创 多模态目标检测

3. 跨模态融合:将「图像特征 Image Feature」和「文本嵌入 Text Embedding」融合起来增强「文本和图像表示 Text and Image Represention」,以便模型更全面地理解目标。2. 文本描述输入:「文本编码器 Text Encoder」接收与图像关联的「文本 Text」并进行编码,得到「文本嵌入 Text Embedding」。1. 视觉信息输入:「图像编码器 Image Encoder」接收图像并提取特征,得到「图像特征 Image Feature」;

2024-05-01 11:09:15 1828 2

原创 多模态中的交叉注意力Cross Attentionon

CA作为多模态融合的一个重要组成部分,它通过注意力机制在不同模块之间建立联系,促进信息的交流和整合,从而提升了模型处理复杂任务的能力。

2024-05-01 11:00:34 5606 6

原创 Bug处理:YoloWorld的训练过程中进行验证出现IndexError: list index out of range

多模态模型YoloWorld的训练过程中进行验证出现IndexError: list index out of range

2024-04-28 10:04:49 743 7

原创 RuntimeError: cuDNN error: CUDNN_STATUS_INTERNAL_ERROR

遇到此问题时,先尝试减小batchsize,不行则再试试运行报错中提供的代码片段。

2024-04-26 19:00:24 563 1

原创 CV中token、Patch Embedding、positional encoding的概念(多模态、ViT、Transformer)

在不同的语境下,术语token等有不同的解释。笔者这里的概念解释基于Google的ViT原文。NLP中,token指的是一个单词word。而CV中,token的概念包含:token、class token、patch token等。

2024-04-26 09:20:17 4147 1

原创 conda命令与pip命令如何使用代理下载安装资源

conda和pip使用代理

2023-08-07 11:41:28 814 1

原创 Ubuntu忘记root密码后如何修改

Ubuntu忘记root密码后的修改方法

2023-08-07 11:36:52 1959 1

原创 在家庭局域网内无延迟观看电脑上的4K视频音乐(SMB文件共享)

本案例通过共享Windows上的文件夹,让处于同一局域网内的手机、平板、电脑能够无延迟地观看视频(速度上限取决于局域网速度)。PS:这个方法我从2022年开始用,今年开始推荐给自己的朋友用了。虽然很多人想弄家庭数据中心,但SMB这种服务更适合我们这种小白把~

2023-08-05 10:55:35 5596 2

原创 Torch的Bug处理:CUDA error:No kernel image is available..

在使用Torch时is_available()显示True,但使用起来就报错RuntimeError: CUDA error: no kernel image is available for execution on the device

2023-08-05 10:13:18 462 1

原创 Linux简易防火墙UFW的安装&使用

当自己的设备连入Internet后,总觉得没有防火墙就不放心,UFW是一个Linux自带的轻量级防火墙,安装简单,使用简单,非常适合我这种Linux新手使用。

2023-02-21 09:58:23 1348 1

原创 Linux下使用百度网盘下载与上传

在Linux系统下使用百度网盘,方便地上传与下载

2023-02-13 21:37:41 1325 3

原创 家庭数据中心:在Centos上搭建个人云盘NextCloud

NextCloud是一个不错的个人云盘方案。同步速度取决于服务器的地理位置和网络情况;空间可以低成本地自行增加;数据是保存在自己的服务器上的,这挺“浪漫”的;支持多用户使用云盘,与朋友一起使用互不干扰。............

2022-08-09 16:05:34 3939

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除