- 博客(41)
- 收藏
- 关注
原创 (自用)curl命令
是一个用于在命令行传输数据的开源工具。它支持多种网络协议,包括 HTTP、HTTPS、FTP、SMTP 等,广泛用于从服务器获取数据或向服务器发送数据。: 支持各种 HTTP 请求方法,如。: 从互联网服务器下载文件是。
2025-08-14 10:34:27
279
原创 (自用)text/event-stream与application/json的区别
【代码】(自用)text/event-stream与application/json的区别。
2025-08-14 09:34:26
173
原创 深入理解智能体:规划执行与直接行动类 Agent 的比较分析
Agent作为当今人工智能的核心,本部分从笔者的实际使用案例来介绍,并用图例来解释说明。
2025-08-13 08:52:40
1972
原创 Bug处理:MongoDB容器报错“Read security file failed. error opening file: /data/mongodb.key: bad file“
MongoDB 对 keyFile 有严格的安全校验:文件必须仅对所属者可读(一般 400 或 600),且文件所属者必须与运行 mongod 的用户相同。在 mongo 容器里,mongod 默认以 uid 999 运行。当把主机上的文件挂载进容器时,文件的属主还是宿主机的 uid(默认为。执行后,文件属主变成了 uid 999,和容器内的 mongod 一致,加上 400 权限就通过了 MongoDB 的安全检查。由于属主不匹配,MongoDB 判定这个 keyfile 不安全,报。
2025-08-11 14:28:55
399
原创 OpenAI重磅推出开源模型!gpt-oss-120b与20b全面解析
OpenAI于2025年8月5日推出开源模型GPT-OSS-120B和GPT-OSS-20B,支持微调训练和128k上下文长度。120B模型在推理能力上接近O4-mini..
2025-08-06 10:19:04
2576
原创 深入解读Flux.1-Kontext:多模态AI图像生成与编辑的革新之作
Flux.1-Kontext作为多模态模型,支持"文本+图像"双输入,具备上下文感知、局部编辑和风格迁移能力,可保持角色一致性..
2025-07-29 10:32:04
3031
原创 手把手搭建SDWebUI:从源码到运行,完整指南
SDWebUI是一个**基于StableDiffusion扩散模型**的**开源WebUI**,旨在**简化和增强**使用Stable Diffusion模型进行图像生成的体验..
2025-05-12 14:14:41
3420
2
原创 快速上手 Docker:从入门到安装的简易指南(Mac、Windows、Ubuntu)
Docker是一个开源软件(平台),通过**容器技术**能够**自动化应用程序的部署、扩展和管理**。
2025-05-07 09:29:11
1381
原创 探索目标检测:边界框与锚框的奥秘
为了方便模型训练,我们人为地将图片中物体的位置与种类标注出来,这就是真实边界框Ground Truth。「Ground Truth」等价于「Ground Truth Bounding Box(GT BBox)」边界框Bounding Box则更多的是一种泛指,它可以指代各个类型的框。
2025-04-29 14:16:42
1990
原创 一个目标检测新手的LabelImg入门指南:安装与使用技巧
咱们搞目标检测的,肯定得用过labelImg标定数据集吧。这里展示了快速安装方式与正常安装方式,还有基本的快捷键。
2025-04-28 07:14:12
642
原创 从FP32到BF16,再到混合精度的全景解析
单精度(FP32)、半精度(FP16)和混合精度(FP32+FP16)是常见的浮点数计算格式,在深度学习模型的训练与推理中都有涉及。
2025-04-25 18:10:10
734
原创 Sora:开启文本到视频(图像)的全新篇章——OpenAI的创新之作
Sora是OpenAI开发的AI视频(图片)生成工具,结合了Transformer模型和扩散模型。
2025-04-24 09:55:45
799
原创 解码SDXL:从网络结构到模型细化,全面对比StableDiffusion
SDXL将「U-Net主干部分」扩大了三倍,并添加了更多的注意力。并引入了一个细化模型Refiner,以进一步提高生成图像的视觉逼真度。
2025-04-24 09:51:13
1697
原创 Bug处理:`error: unrecognized arguments: --local-rank=0`
笔者在2025.4.23使用vscode调试ComfyUI的代码时,出现了`error: unrecognized arguments: --local-rank=0`,完成了解决
2025-04-23 10:52:45
388
原创 初探Stable Diffusion:开启AI图像生成的新纪元
Stable Diffusion是由Stability AI开源发布与维护的创新图像生成技术,是一种支持文本到图像生成(Txt2Img)的模型。
2025-04-23 10:14:18
1456
原创 解锁快速AI生图:SDWebUI和ComfyUI谁是你的最佳拍档?
对于设计师等创作者来说,SDWebUI与ComfyUI肯定是不陌生了,两者正是当前火热的AI图像生成工具。笔者也在2025.4在Ubungu上部署了SDWebUI与ComfyUI。
2025-04-23 10:06:22
830
原创 多模态目标检测
3. 跨模态融合:将「图像特征 Image Feature」和「文本嵌入 Text Embedding」融合起来增强「文本和图像表示 Text and Image Represention」,以便模型更全面地理解目标。2. 文本描述输入:「文本编码器 Text Encoder」接收与图像关联的「文本 Text」并进行编码,得到「文本嵌入 Text Embedding」。1. 视觉信息输入:「图像编码器 Image Encoder」接收图像并提取特征,得到「图像特征 Image Feature」;
2024-05-01 11:09:15
1828
2
原创 多模态中的交叉注意力Cross Attentionon
CA作为多模态融合的一个重要组成部分,它通过注意力机制在不同模块之间建立联系,促进信息的交流和整合,从而提升了模型处理复杂任务的能力。
2024-05-01 11:00:34
5606
6
原创 Bug处理:YoloWorld的训练过程中进行验证出现IndexError: list index out of range
多模态模型YoloWorld的训练过程中进行验证出现IndexError: list index out of range
2024-04-28 10:04:49
743
7
原创 RuntimeError: cuDNN error: CUDNN_STATUS_INTERNAL_ERROR
遇到此问题时,先尝试减小batchsize,不行则再试试运行报错中提供的代码片段。
2024-04-26 19:00:24
563
1
原创 CV中token、Patch Embedding、positional encoding的概念(多模态、ViT、Transformer)
在不同的语境下,术语token等有不同的解释。笔者这里的概念解释基于Google的ViT原文。NLP中,token指的是一个单词word。而CV中,token的概念包含:token、class token、patch token等。
2024-04-26 09:20:17
4147
1
原创 在家庭局域网内无延迟观看电脑上的4K视频音乐(SMB文件共享)
本案例通过共享Windows上的文件夹,让处于同一局域网内的手机、平板、电脑能够无延迟地观看视频(速度上限取决于局域网速度)。PS:这个方法我从2022年开始用,今年开始推荐给自己的朋友用了。虽然很多人想弄家庭数据中心,但SMB这种服务更适合我们这种小白把~
2023-08-05 10:55:35
5596
2
原创 Torch的Bug处理:CUDA error:No kernel image is available..
在使用Torch时is_available()显示True,但使用起来就报错RuntimeError: CUDA error: no kernel image is available for execution on the device
2023-08-05 10:13:18
462
1
原创 Linux简易防火墙UFW的安装&使用
当自己的设备连入Internet后,总觉得没有防火墙就不放心,UFW是一个Linux自带的轻量级防火墙,安装简单,使用简单,非常适合我这种Linux新手使用。
2023-02-21 09:58:23
1348
1
原创 家庭数据中心:在Centos上搭建个人云盘NextCloud
NextCloud是一个不错的个人云盘方案。同步速度取决于服务器的地理位置和网络情况;空间可以低成本地自行增加;数据是保存在自己的服务器上的,这挺“浪漫”的;支持多用户使用云盘,与朋友一起使用互不干扰。............
2022-08-09 16:05:34
3939
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅