文章目录
前言
大语言模型基本使用huggingface的generate方法进行推理。而我最近也在使用llama3代码,于是我写下一份huggingface的generate方法,帮助读者了解huggingface如何对大语言模型进行推理。同样,我和其它博客不太一样,我是按照源码来解读huggingface的generate方法。
一、huggingface的generate函数
比如llama3对huggingface的generate调用代码如下:
inputs = tokenizer(input_text,return_tensors="pt") #add_special_tokens=False ?
generation_output