ollama也支持导入运行量化后的GGUF模型,用法很简单:
创建一个名为Modelfile的文件,并在其中添加FROM指令,指定要导入的模型的本地文件路径。
FROM ./vicuna-33b.Q4_0.gguf
在Ollama中创建模型
ollama create example -f Modelfile
运行模型
ollama run example
ollama也支持导入运行量化后的GGUF模型,用法很简单:
创建一个名为Modelfile的文件,并在其中添加FROM指令,指定要导入的模型的本地文件路径。
FROM ./vicuna-33b.Q4_0.gguf
在Ollama中创建模型
ollama create example -f Modelfile
运行模型
ollama run example