自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 大模型实战 - ‘OmniParser-V2本地部署安装‘

微软发布视觉Agent解析框架**OmniParser最新版本V2**,可将OpenAI(4o/o1/o3-mini)、DeepSeek(R1)、Qwen(2.5VL)、Anthropic(Sonnet)等大模型,转化为“计算机使用智能体”(Computer Use Agent)。本篇文章将介绍如何在本地linux部署安装OmniParser-V2。

2025-03-12 18:08:08 2653 3

原创 大语言模型基础之‘显存优化‘

零冗余优化器(Zero Redundancy Optimizer, Zero),该技术由DeepSpeed代码库提出,主要用于解决数据并行中的模型冗余技术,即在数据并行训练中,每个GPU上都会存储一份完整的模型参数,这会占用大量的显存。下面将介绍三种逐步细化模型参数和优化器参数的方案。

2025-03-11 23:28:19 1016 2

原创 Docker基础入门(五) - Docker Compose

Docker Compose是一个用于定义和运行多容器Docker应用程序的工具。使用Compose,您可以使用YAML文件来配置您的应用程序服务,然后使用一个命令即可创建并启动所有服务。Docker Compose允许您将应用程序的不同组件(如数据库、缓存、前端等)打包在一起,并确保它们在相同的网络和存储环境中运行。这使得管理和扩展应用程序变得更加容易。Docker Compose是一个强大的工具,可以帮助轻松地定义和运行多容器Docker应用程序。

2025-03-10 15:51:22 688

原创 Docker基础入门(四) - Docker仓库管理

Docker仓库是集中存放镜像文件的场所。有时候把仓库和仓库注册服务器(Registry)混为一谈,并不严格区分。实际上,仓库注册服务器上往往存放着多个仓库,每个仓库中又包含了多个镜像,每个镜像有不同的标签(tag)。仓库分为公开仓库(Public)和私有仓库(Private)两种形式。本篇将讲解Docker仓库管理,包括Docker Hub、阿里云镜像仓库、私有仓库等。

2025-03-06 16:45:25 925

原创 Docker基础入门(三) - 构建Dockerfile详解

相信大家已经对Docker的整体构建和使用流程,已经有了较为全面的了解。接下来我们将详细介绍以下如何构建功能更加丰富的Dockerfile文件。俗话说:“工欲善其事,必先利其器”,只有熟练掌握了Dockerfile的构建,才能更好地使用Docker来构建和管理我们的应用。

2025-03-05 17:12:41 1115

原创 Docker基础入门(二) — Docker指令(最详细)

Docker 容器将应用程序及其所有依赖项(包括库、配置文件、系统工具等)封装在一个标准化的包中,使得应用能够在任何地方一致地运行。本篇文章是Docker的常用操作教程。

2025-03-04 17:21:38 1199 2

原创 Docker基础入门(一)

容器化技术:以Docker为代表的容器技术,彻底改变了软件交付与部署的范式。当Kubernetes成为集群操作系统的今天,Docker作为容器生态的奠基者,仍在持续推动着云计算范式的演进。本篇将以docker基础入门为引导,探索容器化技术的核心价值。

2025-03-03 17:31:41 793

原创 大语言模型基础之‘训练时间估计’

书接上回,相信上篇模型参数量的计算对于大家来说小菜一碟,那本篇将继续介绍大模型的训练时间如何估计。

2025-03-02 20:26:13 536

原创 大语言模型基础之‘模型参数量计算‘

本篇中,将介绍如何计算基于transformer架构的大语言模型参数量计算。本篇计算量略大,建议耐心看完,相信会对大模型参数量计算有更深的理解。

2025-02-28 16:31:44 539

原创 大语言模型基础之‘可扩展的训练技术‘(二)

📌上篇介绍了3D并行训练,本篇主要介绍三块内容:零冗余优化器、激活重计算、混合精度训练。那么开始吧!🔅🔅🔅。

2025-02-27 17:37:06 804

原创 大语言模型基础之‘可扩展的训练技术’(一)

随着模型参数规模与数据规模的持续扩展,如何“优雅的”在有限计算资源下实现高效模型训练?

2025-02-26 17:24:16 1018

多模态大语言模型-DeepSeek-VL2以VLLM为后端进行部署的聊天模板(chat-template)bug修复

DeepSeek-VL2 tokenizer_config.json文件兼容vllm多模态接口修复。 用于解决该Bug: ValueError: As of transformers v4.44, default chat template is no longer allowed, so you must provide a chat template if the tokenizer does not define one. 涉及文件https://huggingface.co/deepseek-ai/deepseek-vl2/blob/main/tokenizer_config.json 建议tokenizer_config.json文件补充增加资源内容。

2025-02-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除