IBM Granite Code Models 使用教程

最新推荐文章于 2025-04-16 10:00:30 发布

毛彤影

最新推荐文章于 2025-04-16 10:00:30 发布

阅读量925

点赞数 20

本文链接：https://blog.youkuaiyun.com/gitblog_00094/article/details/146933856

版权

IBM Granite Code Models 使用教程

granite-code-models Granite Code Models: A Family of Open Foundation Models for Code Intelligence 项目地址: https://gitcode.com/gh_mirrors/gr/granite-code-models

1. 项目介绍

IBM Granite Code Models 是一组面向代码智能的开源基础模型，专为代码生成任务（如修复错误、解释代码、生成代码）而设计。这些模型在116种编程语言编写的代码上进行训练，经过全面评估，在多种任务中表现出优于其他开源代码语言模型的性能。Granite Code Models 包括基础模型（Base Models）和指令跟随模型（Instruct Models），旨在提供全面的代码相关任务解决方案。

2. 项目快速启动

以下是快速启动IBM Granite Code Models的步骤：

首先，确保你已经安装了transformers库。如果尚未安装，请使用以下命令安装：

pip install transformers

然后，你可以选择一个模型路径，以下是一个例子：

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

# 选择模型路径
model_path = "ibm-granite/granite-3b-code-base-2k"

# 初始化分词器
tokenizer = AutoTokenizer.from_pretrained(model_path)

# 初始化模型
model = AutoModelForCausalLM.from_pretrained(model_path, device_map="cuda" if torch.cuda.is_available() else "cpu")
model.eval()

# 输入文本
input_text = "def generate():"

# 编码输入文本
input_tokens = tokenizer(input_text, return_tensors="pt")

# 将编码后的输入传输到指定设备
input_tokens = {k: v.to(model.device) for k, v in input_tokens.items()}

# 生成输出令牌
output = model.generate(**input_tokens)

# 解码输出令牌为文本
output_text = tokenizer.batch_decode(output)

# 打印输出
for i in output_text:
    print(i)