Day26上 - 大模型的处理流程

数据的处理流程

1. 用户进行提问 query

2. 套模板,格式化输入

  • system
  • user
  • 把你的输入,变成模型真正需要的输入文本

3. 使用分词器

  • 分词
  • input_ids
  • attention_mask

4. 向量化 embedding

5. 位置编码 encoding

6. 循环过程:

  • 自注意力特征抽取:masked attention
  • 前馈网络层 FF, MLP, 先升再降,做特征的后处理

7. 输出层,输出结果

  • linear
    • d_model
    • dict_len

模型地址:https://modelscope.cn/models/ZhipuAI/glm-4-9b-chat

前置操作:打开ModelScope GPU环境,下载模型文件。

"""
    1. 引入依赖
"""
# PyTorch 框架
import torch
# 模型加载器
from transformers import AutoModelForCausalLM
# 分词器加载器
from transformers import AutoTokenizer

# 模型地址
# chat = instruct
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值