大模型训练与推理完整版

置顶智能体格

已于 2024-09-23 18:57:00 修改

阅读量415

点赞数

CC 4.0 BY-SA版权

分类专栏： AIGC-ChatGPT VIP 跟老王学AI 文章标签： python 机器学习

于 2024-09-23 18:56:09 首次发布

本文链接：https://blog.youkuaiyun.com/wzygis/article/details/142465710

VIP 同时被 3 个专栏收录

41 篇文章 ¥19.90 ¥99.00

订阅专栏

AIGC-ChatGPT

9 篇文章 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

跟老王学AI

12 篇文章

订阅专栏

下面是一个完整的 Python 脚本，用于实现基于 BERT 模型的训练和推理。我们将使用 transformers 库来加载预训练的 BERT 模型，并使用 ChnSentiCorp.txt 数据文件进行训练和推理。

首先，确保你已经安装了必要的库：

pip install transformers torch pandas

数据准备

ChnSentiCorp.txt 见文章顶部下载区域

格式如下：

1,"距离川沙公路较近,但是公交指示不对,如果是""蔡陆线""的话,会非常麻烦.建议用别的路线.房间较为简单."
1,"酒店设施齐全,服务态度好,性价比高,推荐入住."
0,"酒店的设施太差了，估计连1星级都没有，房间空调都不开的，简直就是一塌糊涂。建议大家不要去预订该酒店"
...

示例代码

import torch
from torch.utils.data import Dataset, DataLoader
from transformers import BertTokenizer, BertForSequenceClassification, AdamW, get_linear_schedule_with_warmup
import pandas as pd

# 定义数据集类
class ChnSentiCorpDataset(Data

了解本专栏

订阅专栏解锁全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

智能体格

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

订阅专栏

大语言模型推理代码构建（基于llama3模型）

weixin_38252409的博客

10-28

641

之前文章也已给出了自己构建llama3源码，本节给出如何构建推理代码，并给出完整源码。

详谈大模型训练和推理优化技术

热门推荐

夏栀的博客

05-19

2万+

本文介绍大模型的训练和推理优化技术，包括混合精度训练、分布式训练DeepSpeed、INT8模型量化、参数有效性学习、混合专家训练、梯度检查点、梯度累积、Flash Attention等。

参与评论您还未登录，请先登录后发表或查看评论

用通俗易懂的方式讲解大模型：HugggingFace 推理 API、推理端点和推理空间使用详解

2301_78285120的博客

12-30

4075

本文介绍了 HuggingFace 的推理 API、推理端点和推理空间的使用方法，推理 API 是免费的，使用 HuggingFace 自建的 API 服务，推理端点是部署自己专属的 API 服务，但需要收取一定的费用。推理空间是部署模型的 Web 页面，可以直接在浏览器中使用模型的功能，可以用于演示和分享模型，有一定的免费额度。关注我，一起学习各种人工智能和 AIGC 新技术，欢迎交流，如果你有什么想问想说的，欢迎在评论区留言。

AI大模型的模型训练

2301_81888214的博客

12-27

1732

当然以上的缩放方案依旧存在精度损失，以及当矩阵中存在outlier时，这个精度损失会被放大，例如当tensor中绝大部分取值在1以下，有几个值在100+，则缩放后，所有1以下的tensor信息都会被round抹去。因为use_cache是对解码速度的优化，在解码器解码时，存储每一步输出的hidden-state用于下一步的输入，而因为开启了gradient checkpoint，中间激活值不会存储，因此use_cahe=False。以下8bit量化优化的是静态显存，而梯度检查优化的是动态显存。

大模型融入推荐系统

2201_75600005的博客

02-10

614

大模型训练和推理

weixin_45325331的博客

02-27

5533

大模型训练moe是指混合专家（Mixture-of-experts，简称MoE）的，这是一种用于提高大型神经网络性能的技术，它可以将模型的一部分替换为多个专家，每个专家只负责处理一部分输入数据，从而增加模型的参数量和表达能力，同时减少计算量和训练时间。指令可以作为模型的输入的一部分，也可以作为模型的输出的一部分，具体取决于任务的类型。上下文扩展技术的，这是一种用于提高大型语言模型（LLM）对长文本的处理能力的技术，它可以让模型在不增加参数量的情况下，扩展其注意力范围，从而提高模型的语言理解和生成能力。

精选资源

大模型训练+推理完整版数据集合

09-23

大模型训练和推理完整版数据集合是一个综合了多种信息的数据集，特别适用于酒店行业的标签数据训练。它包含了诸多用户关于不同酒店的详尽评价信息，这些信息不仅涉及酒店的位置、交通便利性、房间设施、餐饮服务、...

大模型的开发训练与推理部署白皮书 2024

lhx17673139267的博客

07-25

1945

随着参数规模和网络结构复杂性的不断提升，大模型开发、训练和推理部署所面临的挑战愈发严峻，其研发依赖算法、算力和数据的综合支撑。**深度学习框架及配套工具为大模型的生产和应用提供了基础支撑，涉及开发、训练、压缩、推理和服务等多个环节。**此外，通过深度学习框架还可以实现与硬件的适配和协同优化，进一步提升硬件的计算和推理性能，降低大模型开发和应用的成本。由于大模型参数规模大，计算和存储的需求显著增加，与辨别式AI 模型相比，非常依赖分布式技术提升效率。

大模型推理服务vLLM 0.9.2版本tag包

最新发布

07-27

工具可能包括但不限于数据预处理工具、模型训练脚本、评估指标计算方法等。库的使用则为模型的构建提供了基础，例如常见的深度学习框架TensorFlow或PyTorch。此外，文档和指南是理解如何使用该服务的关键。这个...

MindSporeTransformers套件的目标是构建一个大模型训练、推理、部署的全流程套件：提供业内主流的Transformer类预训练模型，涵盖丰富的并行特性期望用户轻松实现大模型训练

05-25

在当前人工智能领域，大模型训练、推理和部署已经成为重要的技术趋势，这些技术推动了从自然语言处理到图像识别等众多应用的飞速发展。MindSpore Transformers套件正是针对这一需求而设计，它是一个旨在为用户提供从...

大模型预训练记录

qq_55773484的博客

10-10

796

遇到的问题：训练崩掉了（模型不讲人话）。因为学习率太高需要调低点，lr=1e-5就可以，同时要修改loss更新的频率，不能没chunk都更新，大概4chunk一次更新差不多。前提：任务要求3w篇pdf文献用来预训练，采用MinerU转换为markdown格式，对markdown格式初步清洗用来预训练测试。选用qwen为基座模型，采用lora预训练。加载测试代码采用qwen官方的。

项目实训8-模型下载和训练脚本编写

qq_44778250的博客

06-17

557

编写Python脚本下载模型：使用库提供的接口来下载并保存模型。

模型训练中的常用脚本

说文科技，做有态度的研究。

01-10

1025

删除模型的脚本

大模型调教全流程：实战经验分享

AI心易行者

06-06

1302

大模型调教（Fine-Tuning）是指在预训练模型的基础上，利用特定任务的数据进一步训练模型，以提升其在该任务上的表现。这个过程可以显著提高模型的准确性和适用性，使其更好地满足特定应用场景的需求。

llama-factory 系列教程 (六)，linux shell 脚本自动实现批量大模型的训练、部署与评估

jieshenai的博客

07-31

2362

使用linux shell 脚本，自动化批量处理大模型的微调、部署与评估。无需人工逐个交互处理，减少人工的精力和时间。

七天入门大模型 ：大模型量化及低成本部署最佳实践

2201_75499313的博客

02-17

2746

七天入门大模型已完成了5篇，

从零预训练一个自己的大模型（完整代码）

IT从业者的成长历程

03-12

2090

本文从零开始训练一个大模型

大模型创建脚本

wwwace的博客

06-20

134

MODELINAME 具体的模型名字，可以改可以不改，不是很重要，但是要改名字话最好做到见名知义。DOCKERNAME为为docker起的名字。--model 为vllm serve的参数。MODELIFIE为真实的文件名字。

从零指令微调一个大模型：从数据清洗到模型训练实操（附代码和测试脚本）

Python单行客的博客

04-14

1435

本教程使用🤗HuggingFace TRL框架来完成微调代码的实现。TRL是一个强大且便于使用的微调框架，除了支持SFT外，也能轻松的通过接口调用DPO、PPO、GRPO等流行的强化微调算法。此外也完美兼容Transformers架构。

大模型训练与推理

04-03

### 大规模机器学习模型的训练与推理技术 #### 分布式训练的技术细节大规模机器学习模型的训练通常依赖于分布式训练技术，其中数据并行是一种常用的方法[^1]。在这种模式下，整个数据集被分割成若干部分，每台计算设备负责一部分数据的前向传播和反向传播操作。通过这种方式，可以显著减少单个设备上的内存占用，并利用多台设备的计算能力加速整体训练过程。除了数据并行外，还有其他形式的分布式策略，比如模型并行。当模型参数量过大以至于无法完全加载到单一GPU上时，可采用模型并行的方式将不同层分配给不同的设备进行计算[^3]。然而需要注意的是，无论是哪种方式都需要解决梯度同步问题以及通信开销带来的额外负担。 #### 推理阶段的关键考量因素对于已经完成训练的大规模机器学习模型而言，在部署至生产环境后的推断环节同样存在诸多挑战。首要考虑的就是延迟控制——即如何快速响应用户的请求而不会因为复杂的网络结构而导致过高的等待时间；其次则是成本效益分析，包括硬件资源消耗情况评估等方面内容。一种有效的手段是在不影响最终预测质量的前提下压缩原始版本中的冗余信息从而获得更轻量化的替代方案。例如剪枝(pruning)，量化(quantization)等都是目前较为流行的模型优化技巧之一[^2]。这些方法不仅可以降低存储需求还能提升运行效率使之更适合边缘端或者移动端设备执行任务的需求。另外值得注意的一点在于跨平台兼容性的保障方面也需要特别关注起来。由于目标受众可能分布在各种异构环境中因此确保无论在哪种操作系统之上都能够顺利运作变得尤为重要了。 ```python import torch from torchvision import models # 加载预训练ResNet50模型作为例子展示 model = models.resnet50(pretrained=True) # 剪枝示例代码片段 def prune_model(model, amount=0.2): for name, module in model.named_modules(): if isinstance(module, torch.nn.Conv2d): prune.ln_structured(module, 'weight', amount=amount, n=2, dim=0) prune_model(model) ```