北上ing-优快云博客

原创（自用）curl命令

是一个用于在命令行传输数据的开源工具。它支持多种网络协议，包括 HTTP、HTTPS、FTP、SMTP 等，广泛用于从服务器获取数据或向服务器发送数据。: 支持各种 HTTP 请求方法，如。: 从互联网服务器下载文件是。

2025-08-14 10:34:27 279

原创（自用）text/event-stream与application/json的区别

【代码】（自用）text/event-stream与application/json的区别。

2025-08-14 09:34:26 173

原创（自用）Mongo-Express的基础查询命令

【代码】（自用）Mongo-Express的基础查询命令。

2025-08-13 08:55:25 462

原创深入理解智能体：规划执行与直接行动类 Agent 的比较分析

Agent作为当今人工智能的核心，本部分从笔者的实际使用案例来介绍，并用图例来解释说明。

2025-08-13 08:52:40 1972

原创 Bug处理：MongoDB容器报错“Read security file failed. error opening file: /data/mongodb.key: bad file“

MongoDB 对 keyFile 有严格的安全校验：文件必须仅对所属者可读（一般 400 或 600），且文件所属者必须与运行 mongod 的用户相同。在 mongo 容器里，mongod 默认以 uid 999 运行。当把主机上的文件挂载进容器时，文件的属主还是宿主机的 uid（默认为。执行后，文件属主变成了 uid 999，和容器内的 mongod 一致，加上 400 权限就通过了 MongoDB 的安全检查。由于属主不匹配，MongoDB 判定这个 keyfile 不安全，报。

2025-08-11 14:28:55 399

原创后端访问OSS资源时，STS临时密钥与永久密钥的区别

【代码】后端访问OSS资源时，STS临时密钥与永久密钥的区别。

2025-08-07 09:25:19 440

原创 STS临时凭证需要RAM角色，而非RAM用户

而不是直接绑定到RAM用户（RAM User）。

2025-08-07 09:24:22 313

原创 OpenAI重磅推出开源模型！gpt-oss-120b与20b全面解析

OpenAI于2025年8月5日推出开源模型GPT-OSS-120B和GPT-OSS-20B，支持微调训练和128k上下文长度。120B模型在推理能力上接近O4-mini..

2025-08-06 10:19:04 2576

原创深入解读Flux.1-Kontext：多模态AI图像生成与编辑的革新之作

Flux.1-Kontext作为多模态模型，支持"文本+图像"双输入，具备上下文感知、局部编辑和风格迁移能力，可保持角色一致性..

2025-07-29 10:32:04 3031

原创手把手搭建SDWebUI：从源码到运行，完整指南

SDWebUI是一个**基于StableDiffusion扩散模型**的**开源WebUI**，旨在**简化和增强**使用Stable Diffusion模型进行图像生成的体验..

2025-05-12 14:14:41 3420 2

原创快速上手 Docker：从入门到安装的简易指南（Mac、Windows、Ubuntu）

Docker是一个开源软件（平台），通过**容器技术**能够**自动化应用程序的部署、扩展和管理**。

2025-05-07 09:29:11 1381

原创定格的瞬间会成为给未来自己的礼物——by 2025.4

2025.4的月度总结，希望我在下个月不会忘记哈哈～～

2025-05-06 05:04:28 473

原创预训练到微调：深入理解AI的上下游任务

上下游任务是先后关系，上游任务先让模型学习到通用特征..

2025-05-05 20:12:54 2489

原创探索Agent与MCP：推动AI应用的新动力

Agent可以是一段程序、一个机器人，甚至一个生物实体..

2025-05-03 06:04:21 270

原创开启图像生成之旅：ComfyUI在Ubuntu上的安装全攻略

ComfyUI作为一个开源的、基于节点的文生图Web应用..

2025-04-30 07:11:49 3504

原创探索目标检测：边界框与锚框的奥秘

为了方便模型训练，我们人为地将图片中物体的位置与种类标注出来，这就是真实边界框Ground Truth。「Ground Truth」等价于「Ground Truth Bounding Box（GT BBox）」边界框Bounding Box则更多的是一种泛指，它可以指代各个类型的框。

2025-04-29 14:16:42 1990

原创解密分类模型的核心：Sigmoid与SoftMax的应用与奥秘

不止图片分类，目标检测也用到了，毕竟检测包括定位与分类嘛。

2025-04-28 07:25:07 1344

原创一个目标检测新手的LabelImg入门指南：安装与使用技巧

咱们搞目标检测的，肯定得用过labelImg标定数据集吧。这里展示了快速安装方式与正常安装方式，还有基本的快捷键。

2025-04-28 07:14:12 642

原创快速掌握WandB和YOLOv5集成WandB的指南

包括官网创建账号和本地安装wandb

2025-04-27 09:22:49 262

原创从像素到实例：揭示图像分割如何改变视觉世界

语义分割仅关心某个像素属于哪个类，实例分割则关心每个像素属于哪个类的哪个实例。

2025-04-26 12:03:24 267

原创从FP32到BF16，再到混合精度的全景解析

单精度（FP32）、半精度（FP16）和混合精度（FP32+FP16）是常见的浮点数计算格式，在深度学习模型的训练与推理中都有涉及。

2025-04-25 18:10:10 734

原创 Sora：开启文本到视频(图像)的全新篇章——OpenAI的创新之作

Sora是OpenAI开发的AI视频（图片）生成工具，结合了Transformer模型和扩散模型。

2025-04-24 09:55:45 799

原创解码SDXL：从网络结构到模型细化，全面对比StableDiffusion

SDXL将「U-Net主干部分」扩大了三倍，并添加了更多的注意力。并引入了一个细化模型Refiner，以进一步提高生成图像的视觉逼真度。

2025-04-24 09:51:13 1697

原创 Bug处理：`error: unrecognized arguments: --local-rank=0`

笔者在2025.4.23使用vscode调试ComfyUI的代码时，出现了`error: unrecognized arguments: --local-rank=0`，完成了解决

2025-04-23 10:52:45 388

原创初探Stable Diffusion：开启AI图像生成的新纪元

Stable Diffusion是由Stability AI开源发布与维护的创新图像生成技术，是一种支持文本到图像生成（Txt2Img）的模型。

2025-04-23 10:14:18 1456

原创解锁快速AI生图：SDWebUI和ComfyUI谁是你的最佳拍档？

对于设计师等创作者来说，SDWebUI与ComfyUI肯定是不陌生了，两者正是当前火热的AI图像生成工具。笔者也在2025.4在Ubungu上部署了SDWebUI与ComfyUI。

2025-04-23 10:06:22 830

原创 LLaMA-Factory的概念与搭建

LLaMA-Factory是一个适合小白使用的训练平台。提供了基于Gradio的网页版工作台。

2025-03-31 16:40:36 428

原创 StableDiffusion的概念与搭建

Stable Diffusion是基于一个潜在扩散模型LDMs的生成模型。

2025-03-31 08:30:45 574

原创多模态目标检测

3. 跨模态融合：将「图像特征 Image Feature」和「文本嵌入 Text Embedding」融合起来增强「文本和图像表示 Text and Image Represention」，以便模型更全面地理解目标。2. 文本描述输入：「文本编码器 Text Encoder」接收与图像关联的「文本 Text」并进行编码，得到「文本嵌入 Text Embedding」。1. 视觉信息输入：「图像编码器 Image Encoder」接收图像并提取特征，得到「图像特征 Image Feature」；

2024-05-01 11:09:15 1828 2