CodeGeeX4 使用与启动教程

虞宜来

于 2025-03-30 10:00:34 发布

阅读量228

点赞数 3

本文链接：https://blog.youkuaiyun.com/gitblog_00721/article/details/146722221

版权

CodeGeeX4 使用与启动教程

CodeGeeX4 CodeGeeX4-ALL-9B, a versatile model for all AI software development scenarios, including code completion, code interpreter, web search, function calling, repository-level Q&A and much more. 项目地址: https://gitcode.com/gh_mirrors/co/CodeGeeX4

1. 项目介绍

CodeGeeX4 是一个开源的多语言代码生成模型，基于 GLM-4-9B 持续训练，具备代码补全、代码解释、网页搜索、函数调用、仓库级别的代码问答等多种功能。它在公开的基准测试中表现优异，例如 BigCodeBench 和 NaturalCodeBench，是目前参数少于 10B 的最强代码生成模型。

2. 项目快速启动

以下是快速启动 CodeGeeX4 的步骤：

首先，确保您的环境中已安装了必要的依赖项。以下是一个示例的安装命令：

pip install torch transformers vllm

接下来，可以使用以下代码启动 CodeGeeX4：

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

# 检查是否有可用的CUDA环境
device = "cuda" if torch.cuda.is_available() else "cpu"

# 加载模型和分词器
tokenizer = AutoTokenizer.from_pretrained("THUDM/codegeex4-all-9b", trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("THUDM/codegeex4-all-9b", torch_dtype=torch.bfloat16, low_cpu_mem_usage=True, trust_remote_code=True).to(device).eval()

# 编写代码补全的提示
prompt = [{"role": "user", "content": "快速排序算法的实现"}]

# 转换提示为模型所需的格式
inputs = tokenizer.apply_chat_template(prompt, add_generation_prompt=True, return_tensors="pt", return_dict=True).to(device)

# 生成代码
with torch.no_grad():
    outputs = model.generate(**inputs)
    # 输出解码后的代码
    print(tokenizer.decode(outputs[0], skip_special_tokens=True))

确保在执行上述代码前，您的环境中有正确版本的 transformers 库。