调用Ollama接口上传文件及交互教程

原创已于 2025-07-26 23:31:55 修改 · 3.6k 阅读

32 ·

CC 4.0 BY-SA版权

文章标签：

#交互 #windows #microsoft #Ollama #调用Ollama接口 #上传文件及交互教程

于 2025-03-02 08:44:56 首次发布

一、启动 Ollama 服务

二、Ollama API 端点

1. 生成文本（Generate Text）

2. 多轮对话（Chat）

3. 多模态输入（上传文件）

4. 列出本地模型（List Models）

Ollama 是一个轻量级的框架，用于在本地运行和管理语言模型。它提供了丰富的 REST API 接口，支持文本生成、多模态输入（如图片）等功能。本文将详细介绍如何通过 Ollama API 上传文件并进行交互。

一、启动 Ollama 服务

在调用 Ollama API 之前，需要确保 Ollama 服务正在运行。可以通过以下命令启动服务：

ollama serve

默认情况下，服务会运行在 http://localhost:11434。

二、Ollama API 端点

Ollama 提供了多个 API 端点，用于实现不同的功能。以下是主要的 API 端点及其使用方法。

1. 生成文本（Generate Text）

端点：POST /api/generate
功能：向模型发送提示词（prompt），并获取生成的文本。

请求格式：

{
  "model": "llama3.2",
  "prompt": "Why is the sky blue?",
  "stream": false,
  "options": {
    "temperature": 0.7,
    "max_tokens": 100
  }
}

响应格式：

{
  "response": "The sky is blue because...",
  "done": true
}

2. 多轮对话（Chat）

端点：POST /api/chat
功能：支持多轮对话，模型会记住上下文。

请求格式：

{
  "model": "llama3.2",
  "messages": [
    { "role": "user", "content": "Why is the sky blue?" }
  ],
  "stream": false
}

响应格式：

{
  "message": {
    "role": "assistant",
    "content": "The sky is blue because..."
  },
  "done": true
}

3. 多模态输入（上传文件）

Ollama 支持处理多模态输入，例如上传图片并生成描述。

端点：POST /api/run
功能：运行模型并处理多模态输入（如图片）。

请求格式：

ollama run llava "What's in this image? /path/to/image.png"

响应格式：

{
  "response": "The image features a yellow smiley face..."
}

4. 列出本地模型（List Models）

端点：GET /api/tags
功能：列出本地已下载的模型。

响应格式：

{
  "models": [
    {
      "name": "llama3.2:latest",
      "size": "9126135808",
      "modified_at": "2024-08-04T09:38:03.925108804+08:00"
    }
  ]
}

三、调用示例

1. 生成文本

使用 curl 发送请求：

curl http://localhost:11434/api/generate -d '{
  "model": "llama3.2",
  "prompt": "Why is the sky blue?",
  "stream": false
}'

2. 多轮对话

使用 curl 发送请求：

curl http://localhost:11434/api/chat -d '{
  "model": "llama3.2",
  "messages": [
    { "role": "user", "content": "Why is the sky blue?" }
  ],
  "stream": false
}'

3. 多模态输入（上传图片）

通过命令行调用：

ollama run llava "What's in this image? /path/to/image.png"

四、总结

Ollama 提供了强大的 API 接口，支持文本生成、多轮对话和多模态输入等功能。通过简单的 HTTP 请求，开发者可以轻松地与 Ollama 模型进行交互，实现丰富的应用场景。希望本文能帮助你更好地使用 Ollama API。