自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(81)
  • 收藏
  • 关注

原创 SwanLab x EasyR1:多模态大模型强化学习可视化训练

EasyR1是基于veRL的一个高效、可扩展、多模态强化学习LLM训练框架,由LLaMA Factory作者hiyouga打造,很很短的时间内获得了1.8k Star。EasyR1 受益于 veRL 的 HybridEngine 和 vLLM 0.7 的 SPMD mode,并适配了 Qwen2.5-VL 模型,在多模态几何题任务 Geometry3k 上通过 30 个 batch 的 GRPO 训练,即可提升 5% 验证集准确率。EasyR1 目前已经被很多优秀的项目采用,如等。

2025-04-02 15:41:18 715

原创 SwanLab Slack通知插件:让AI训练状态同步更及时

在AI模型训练的过程中,开发者常常面临一个难题:如何及时跟踪训练状态?无论是实验超参数的调整、关键指标的变化,还是意外中断的告警,传统的监控方式往往依赖手动刷新日志或反复检查终端,这不仅效率低下,还可能因信息滞后导致资源浪费和决策延迟。团队推出的Slack通知插件正是为了解决这一问题而生。通过将训练状态实时同步至团队协作工具Slack,开发者可以摆脱“被动等待”的束缚,让关键信息主动触达。无论是训练完成的通知、指标波动的预警,还是硬件资源的异常提醒,只需简单配置,即可实现自动化推送。

2025-04-01 20:36:16 674

原创 SwanLab更新|寒武纪硬件监控、Slack、Discord通知插件更新、swanlab.Settings支持精细化实验行为控制等

1. 新增swanlab.Settings方法,支持更精细化的实验行为控制,进一步增强开放性2. 修复了sync_wandb的一些问题3. 修复了Obejct3D类的一些问题## 🔌插件1. 官方插件增加Slack通知、Discord通知,进一步打通海外生态## 💻硬件模块1. 支持了寒武纪MLU的硬件记录和资源监控,国产卡支持+12. 昇腾NPU的硬件记录,支持记录CANN版本3. 英伟达GPU的硬件记录,支持记录GPU架构和cuda核心数4. 英伟达GPU的硬件监控,支持记

2025-03-31 18:52:55 139

原创 SwanLab硬件监控:英伟达、昇腾、寒武纪

SwanLab在跟踪实验的过程中,会机器的硬件资源情况,并记录到当中。目前SwanLab已支持监控3款)的硬件资源情况,涵盖显卡利用率、显存占用率、显卡温度、显卡功率等指标。除此之外,SwanLab还支持监控等硬件资源情况。很开心,我们与昇腾计算团队合作,为训练师提供更多的国产算力使用体验。

2025-03-31 18:49:03 939

原创 Transformers x SwanLab:可视化NLP模型训练(2025最新版)

探索如何将HuggingFace的Transformers框架与SwanLab无缝结合,实现高效的模型训练与实验管理!Transformers是当前最流行的深度学习框架之一,广泛应用于大语言模型(如LLaMa、Qwen、ChatGLM)和自然语言处理模型(如Bert)的预训练、微调和推理。而SwanLab则是一款强大的实验管理与可视化工具,结合了Weights & Biases和TensorBoard的优点,支持训练可视化、多实验对比、超参数记录和团队协作。

2025-03-22 21:18:15 823

原创 使用SwanLab记录3D点云:swanlab.Obejct3D使用指引

SwanLab 3D点云图表使用教程,可用于自动驾驶、机器人、具身智能等场景

2025-03-22 21:04:25 473

原创 SwanLab飞书通知插件:训练完成收到飞书消息,掌握训练进度更及时

如果你希望在训练完成/发生错误时,第一时间发送飞书信息通知你,那么非常推荐你使用飞书通知插件。SwanLab插件均为开源代码,你可以在中查看,欢迎提交你的建议和PR!

2025-03-17 21:54:29 448

原创 SwanLab邮件通知插件:训练完成收到邮件,掌握训练进度更及时

如果你希望在训练完成/发生错误时,第一时间发送邮件通知你,那么非常推荐你使用邮件通知插件。SwanLab插件均为开源代码,你可以在中查看,欢迎提交你的建议和PR!

2025-03-17 21:52:31 551

原创 SwanLab私有化部署教程!

SwanLab 是一个开源、现代化设计的深度学习训练跟踪与可视化工具,常被称为"中国版 Weights & Biases + Tensorboard"。SwanLab同时支持云端和离线使用,并适配了从PyTorch、Transformers、Lightning再到LLaMA Factory、veRL等30多种主流AI训练框架,Python API设计也简洁易上手,能轻松嵌入你的训练代码。

2025-03-15 16:37:17 811

原创 SwanLab简明教程:从萌新到高手

SwanLab是一个开源、现代化设计的深度学习训练跟踪与可视化工具,常被称为"中国版 Weights & Biases + Tensorboard"。SwanLab同时支持云端和离线使用,并适配了从再到等30多种主流AI训练框架,Python API设计也简洁易上手,能轻松嵌入你的训练代码。面向人工智能研究者,SwanLab设计了友好的Python API 和漂亮的UI界面,并提供训练可视化、自动日志记录、超参数记录、实验版本管理与对比、多人协同。

2025-03-08 20:10:26 1605

原创 DiffSynth-Studio文生图+文生视频模型训练:使用SwanLab超参数记录与可视化

DiffSynth Studio是推出的一个开源的扩散模型引擎,专注于图像与视频的风格迁移与生成任务。它通过优化架构设计(如文本编码器、UNet、VAE 等组件),在保持与开源社区模型兼容性的同时,显著提升计算性能,为用户提供高效、灵活的创作工具。DiffSynth Studio 支持多种扩散模型,包括 Wan-Video、StepVideo、HunyuanVideo、CogVideoX、FLUX、ExVideo、Kolors、Stable Diffusion 3 等。

2025-03-06 16:32:17 347

原创 Swift训练大模型可视化教程:使用SwanLab

Ms-swift的是一个集模型训练、微调、推理、部署于一体的框架。🍲是 ModelScope 社区提供的官方框架,用于微调和部署大型语言模型和多模态大型模型。它目前支持大型模型和多模态大型模型的训练(预训练、微调、人工对齐)、推理、评估、量化和部署。🍔 此外,ms-swift 还采用了,包括,以及等人工对齐训练方法。ms-swift 支持使用 vLLM 和 LMDeploy 加速推理、评估和部署模块,并支持使用 GPTQ、AWQ 和 BNB 等技术进行模型量化。

2025-03-03 01:09:48 1108

原创 如何将SwanLab集成到Unsloth与TRL?

Unsloth是最近AI圈特别火的Python库,起因是DeepSeek R1带火了用GRPO(一种强化学习方法)来训练大模型,HuggingFace的TRL框架也在第一时间更新了GRPOTrainer。但在大家兴冲冲地启动训练时却发现,这显存占用也太高了,一般的显卡完全finetune不动呀!这个时候,Unsloth进入了大家的视野。它能够将Llama 3.3、Mistral、Phi-4、Qwen 2.5和Gemma的微调速度提高2倍,同时内存减少80%,足以在一张单卡进行GRPO训练。

2025-02-25 00:57:11 707

原创 SwanLab x Swift:一站式大模型训练工具链,让模型进化更轻松(附教程)

探索如何利用 Modelscope Swift 和 SwanLab 进行高效的模型训练与实验跟踪!Swift 是 ModelScope 社区推出的强大框架,支持 450+ 大型语言模型和 150+ 多模态模型的训练、微调、推理与部署。无论是轻量级技术如 LoRA、QLoRA、LongLoRA,还是人工对齐方法如 DPO、PPO、ORPO,Swift 都能轻松应对。

2025-02-18 17:13:38 1055

原创 GDC2025 | DeepSeek-Qwen 模型蒸馏极限挑战赛,来了!(预赛报名)

2025全球开发者先锋大会(GDC)| 魔乐社区与SwanLab平台联合举办的 DeepSeek-Qwen 模型蒸馏极限挑战赛!本赛事将作为2025全球开发者先锋大会(GDC)的活动之一,欢迎具备大模型训练/微调实战经验的独立开发者前来挑战!详细报名规则见后文。报名时间:2025年2月16日~20日12时。

2025-02-16 17:26:20 490

原创 集成SwanLab与HuggingFace TRL:跟踪与优化强化学习实验

TRL是一个领先的Python库,旨在通过监督微调(SFT)、近端策略优化(PPO)和直接偏好优化(DPO)等先进技术,对基础模型进行训练后优化。TRL 建立在 🤗 Transformers 生态系统之上,支持多种模型架构和模态,并且能够在各种硬件配置上进行扩展。你可以使用Trl快速进行模型训练,同时使用SwanLab进行实验跟踪与可视化。是适配于Transformers的日志记录类。

2025-02-08 20:32:24 386

原创 SwanLab x verl:可视化LLM强化学习后训练教程

verl是一个灵活、高效且可用于生产环境的强化学习(RL)训练框架,专为大型语言模型(LLMs)的后训练设计。它由字节跳动火山引擎团队开源,是HybridFlow论文的开源实现。verl目前已经被很多优秀的项目采用,如TinyZeroRAGENLogic R1等。verl 具有以下特点,使其灵活且易于使用:易于扩展的多样化 RL 算法:Hybrid 编程模型结合了单控制器和多控制器范式的优点,能够灵活表示并高效执行复杂的后训练数据流。用户只需几行代码即可构建 RL 数据流。

2025-02-08 16:01:23 1739

原创 DQN深度强化学习:CartPole倒立摆任务(完整代码)

🚀 DQN实战:3分钟极速训练倒立摆控制模型 | 附完整代码+可视化训练;📌 核心技术亮点:DQN双剑合璧:融合深度神经网络与Q-Learning,通过经验回放打破数据关联性,目标网络稳定训练过程,解决高维状态空间难题;CartPole极简环境:4维状态空间+2个离散动作,完美契合入门级深度强化学习实战(附环境配置指南)

2025-02-07 15:30:50 1555

原创 SmolAgents快速上手:最优雅的Agent构建工具

smolagents是HuggingFace官方推出的Agent开发库,HF出品的库,往往的设计理念是“低门槛,高天花板,可拓展”,所以知道HF出了Agent相关的框架后,也是很快体验了一下。首先来介绍一下smolagents吧,smol是small的俏皮用法,故smolagents的含义是“轻量的agent工具”。smolagents库提供:✨:Agent逻辑仅需约千行代码即可实现。在原生代码之上,我们将抽象保持至最简形态!🌐。

2025-01-25 16:48:29 1400

原创 MiniCPM-o-2.6 多模态大模型微调实战(完整代码)

MiniCPM-O-2.6 多模态大模型微调实战。本文我们将简要介绍基于 transformers、peft 等框架,使用 MiniCPM-O-2.6 模型在上进行Lora微调训练,同时使用监控训练过程与评估模型效果。

2025-01-25 14:14:23 1758

原创 Qwen2.5大模型微调实战:医疗命名实体识别(NER)任务(完整代码)

带你从零开始,手把手教你如何通过指令微调Qwen2.5大语言模型,完成医学命名实体识别(NER)任务。本文详细介绍了如何使用transformers、peft等框架,结合SwanLab可视化工具,在医学数据集上进行Lora微调训练。无论你是AI新手还是进阶开发者,这篇教程都能帮助你快速上手大模型微调,掌握NER任务的核心技术。立即跟随教程,开启你的AI训练之旅!

2025-01-21 17:52:43 2133 1

原创 如何命令行退出swanlab账号

SwanLab命令行退出登录教程。

2025-01-17 23:25:57 141

原创 SwanLab环境变量列表

SwanLab环境变量列表,包含SWANLAB_SAVE_DIR、SWANLAB_LOG_DIR、SWANLAB_MODE等常用的环境变量

2025-01-17 23:22:06 333

原创 SwanLab使用技巧:与PyTorch Lightning集成使用

PyTorch Lightning与SwanLab配合训练。是一个开源的机器学习库,它建立在 PyTorch 之上,旨在帮助研究人员和开发者更加方便地进行深度学习模型的研发。Lightning 的设计理念是将模型训练中的繁琐代码与研究代码分离,从而使研究人员可以专注于研究本身,而不是底层的工程细节。SwanLabLogger是适配于PyTorch Lightning的日志记录类。你可以使用PyTorch Lightning快速进行模型训练,同时使用。进行实验跟踪与可视化。

2025-01-17 19:17:54 318

原创 SwanLab使用技巧:一行代码同步Wandb

SwanLab与Wandb类似,专为国内用户设计,支持实验跟踪和模型优化。通过swanlab.sync_wandb()命令,可同步Wandb指标至SwanLab,或使用swanlab convert将Wandb项目迁移至SwanLab,实现无缝过渡和高效管理。

2025-01-17 19:10:18 1012

原创 SwanLab x LLaMA Factory:国产开源AI训练工具组合拳(含教程)

我们非常高兴地宣布SwanLab与LLaMA Factory建立合作伙伴关系,致力于为中国训练者提供优质、高效的大模型训练体验。现在你使用新版本的LLaMA Factory启动训练前,可以在WebUI的「SwanLab configurations」(中文:SwanLab参数设置)卡片中勾选「Use SwanLab」,就可以通过SwanLab强大的训练看板进行这一次大模型微调的跟踪、记录与可视化。

2024-12-31 13:43:40 1497

原创 如何在手机上看AI训练(基于SwanLab)

你一定遇到过,实验正在training,但你不在电脑旁边 —— 也许在运动、在通勤、或者刚刚起床,十分想瞄一眼实验的进展和结果。这个时候,,会是绝佳组合。下面将介绍如何将SwanLab添加到你的手机主屏幕,以接近APP的体验,快速访问SwanLab。

2024-12-25 21:37:04 302

原创 Qwen2-VL多模态大模型微调实战教程

Qwen2-VL是通义千问团队最近开源的大语言模型,由阿里云通义实验室研发。以Qwen2-VL作为基座多模态大模型,通过的方式实现特定场景下的OCR,是学习的入门任务。本文我们将简要介绍基于 transformers、peft 等框架,使用 Qwen2-VL-2B-Instruct 模型在上进行Lora微调训练,同时使用监控训练过程与评估模型效果。

2024-12-04 20:21:35 5395 4

原创 Qwen2-VL视觉大模型微调实战:LaTex公式OCR识别任务(完整代码)

SwanLab机器学习实战教程是一个主打「开箱即用」的AI训练系列教程,我们致力于提供手把手帮助你跑起训练。Qwen2-VL是通义千问团队最近开源的大语言模型,由阿里云通义实验室研发。以Qwen2-VL作为基座多模态大模型,通过的方式实现特定场景下的OCR,是学习的入门任务。本文我们将简要介绍基于 transformers、peft 等框架,使用 Qwen2-VL-2B-Instruct 模型在上进行Lora微调训练,同时使用监控训练过程与评估模型效果。

2024-12-04 16:01:38 1465 2

原创 Qwen2-VL-2B模型微调实战-COCO2014数据集-SwanLab可视化记录

本文我们将简要介绍基于 transformers、peft 等框架,使用 Qwen2-VL-2B-Instruct 模型在上进行Lora微调训练,同时使用监控训练过程与评估模型效果。

2024-11-16 19:41:44 1556 5

原创 SwanLab安装教程

其提供了友好的API和漂亮的界面,结合了超参数跟踪、指标记录、在线协作、实验链接分享、实时消息通知等功能,让您可以快速跟踪ML实验、可视化过程、分享给同伴。SwanLab是一款开源、轻量级的AI实验跟踪工具,提供了一个跟踪、比较、和协作实验的平台,旨在加速AI研发团队100倍的研发效率。借助SwanLab,科研人员可以沉淀自己的每一次训练经验,与合作者无缝地交流和协作,机器学习工程师可以更快地开发可用于生产的模型。

2024-11-16 19:38:51 511

原创 Qwen2-VL多模态大模型微调实战(完整代码)

Qwen2-VL多模态大模型微调实战。本文我们将简要介绍基于 transformers、peft 等框架,使用 Qwen2-VL-2B-Instruct 模型在上进行Lora微调训练,同时使用监控训练过程与评估模型效果。

2024-11-15 21:23:54 12508 17

原创 PyTorch音频分类实战(完整代码)

PyTorch音频分类实战,完整代码+数据集+实验日志。音频分类任务是指将音频信号按照其内容的类别归属进行划分。例如,区分一段音频是音乐、语音、环境声音(如鸟鸣、雨声、机器运转声)还是动物叫声等。其目的是通过自动分类的方式,高效地对大量音频数据进行组织、检索和理解。

2024-11-11 16:51:48 3108 1

原创 swanlab api key粘贴不上解决方法

粘贴不了”这个现象,是因为命令行在输入密码的时候,会不显示出来,但实际上已经输入了。的时候,粘贴一次API Key后,直接按下回车,就可以登录完成。运行这个python脚本,就可以完成登录。登录完成后,下次运行就不用再次登录了。

2024-11-11 00:06:02 400 1

原创 PaddleYOLO目标检测训练(集成SwanLab可视化全过程)

PaddleYolo 是飞桨(PaddlePaddle)框架下的一个目标检测库,主要用于图像和视频中的物体检测。PaddleYOLO包含YOLO系列模型的相关代码,支持YOLOv3、PP-YOLO、PP-YOLOv2、PP-YOLOE、PP-YOLOE+、RT-DETR、YOLOX、YOLOv5、YOLOv6、YOLOv7、YOLOv8、YOLOv5u、YOLOv7u、YOLOv6Lite、RTMDet等模型。

2024-11-09 14:30:38 1070

原创 如何从Wandb迁移到SwanLab

SwanLab 是一个开源的模型训练记录工具,面向AI研究者,提供了训练可视化、自动日志记录、超参数记录、实验对比、多人协同等功能。在SwanLab上,研究者能基于直观的可视化图表发现训练问题,对比多个实验找到研究灵感,并通过在线链接的分享与基于组织的多人协同训练,打破团队沟通的壁垒。为什么要记录训练相较于软件开发,模型训练更像一个实验科学。一个品质优秀的模型背后,往往是成千上万次实验。研究者需要不断尝试、记录、对比,积累经验,才能找到最佳的模型结构、超参数与数据配比。

2024-10-27 16:28:42 372

原创 将Tensorboard日志转换为SwanLab项目

SwanLab 是一个开源的模型训练记录工具,面向AI研究者,提供了训练可视化、自动日志记录、超参数记录、实验对比、多人协同等功能。在SwanLab上,研究者能基于直观的可视化图表发现训练问题,对比多个实验找到研究灵感,并通过在线链接的分享与基于组织的多人协同训练,打破团队沟通的壁垒。为什么要记录训练相较于软件开发,模型训练更像一个实验科学。一个品质优秀的模型背后,往往是成千上万次实验。研究者需要不断尝试、记录、对比,积累经验,才能找到最佳的模型结构、超参数与数据配比。

2024-10-27 16:24:24 937

原创 SwanLab VSCode插件已发布,附使用教程

SwanLab 提供了友好的 API 和漂亮的界面,结合了超参数跟踪、指标记录、在线协作、实验链接分享等功能,让您可以快速跟踪 AI 实验、可视化过程、记录超参数,并分享给伙伴。SwanLab 是一款开源、轻量的 AI 实验跟踪工具,提供了一个跟踪、比较、和协作实验的平台。在VSCode中使用。

2024-10-19 15:00:22 298

原创 GLM4大模型微调入门实战-命名实体识别(NER)任务

基于GLM4-7B大模型,实现命名实体识别(NER)任务,是学习LLM微调非常好的入门任务之一,本文将提供完整的代码、模型、数据以及SwanLab实验过程,来帮助你学习如何进行微调。

2024-06-21 17:18:48 5152 11

原创 Qwen2大模型微调入门实战-命名实体识别(NER)任务(完整代码)

基于Qwen2-1.5B大模型,实现命名实体识别(NER)任务,是学习LLM微调非常好的入门任务之一,本文将提供完整的代码、模型、数据以及SwanLab实验过程,来帮助你学习如何进行微调。

2024-06-20 14:29:05 4396 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除