Ollama 如何排除故障

最新推荐文章于 2025-06-25 10:17:50 发布

原创最新推荐文章于 2025-06-25 10:17:50 发布 · 5.6k 阅读

18 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #llm #语言模型 #ai #大模型 #ollama

Ollama 日志

Mac

有时，Ollama 可能无法如你所愿运行。解决问题的一个好方法是查看日志。在 Mac 上，你可以通过运行以下命令来查看日志：

cat ~/.ollama/logs/server.log

Linux

在使用 systemd 的 Linux 系统上，可以用这个命令查看日志：

journalctl -u ollama

Docker

在容器中运行 Ollama 时，日志会直接输出到容器的标准输出和标准错误输出中：

docker logs <container-name>

（使用 docker ps 可以找到容器的名字）

如果你是在终端里手动运行 ollama serve，那么日志会显示在该终端上。

Windows

在 Windows 上运行 Ollama 时，日志的存放位置有一些不同。你可以通过按下 +R 并输入下面的命令，在资源管理器窗口中查看日志：

explorer %LOCALAPPDATA%\Ollama 查看日志
explorer %LOCALAPPDATA%\Programs\Ollama浏览二进制文件（安装程序会添加到你的用户路径中）
explorer %HOMEPATH%.ollama 浏览存储模型和配置的位置
explorer %TEMP% 浏览存储在一个或多个 ollama* 目录中的临时可执行文件

为了更好地排查问题，启用额外的调试日志，首先从系统托盘菜单退出应用，然后在 PowerShell 终端中执行：

$env:OLLAMA_DEBUG="1"& "ollama app.exe"

LLM 库

Ollama 内置了多个为不同 GPU 和 CPU 向量特性编译的大语言模型（LLM）库。Ollama 会尝试根据你的系统能力选择最合适的库。如果自动检测功能出现问题，或者你遇到了其他问题（如 GPU 崩溃），可以通过指定特定的 LLM 库来解决。cpu_avx2 的性能最佳，其次是 cpu_avx，最慢但兼容性最强的是 cpu。MacOS 下的 Rosetta 模拟可以使用 cpu 库。

在服务器日志中，你会看到类似下面这样的消息（具体内容可能因版本而异）：

Dynamic LLM libraries [rocm_v6 cpu cpu_avx cpu_avx2 cuda_v11 rocm_v5]

LLM 库替换（实验性）

你可以通过设置 OLLAMA_LLM_LIBRARY 来指定使用哪个 LLM 库，从而绕过自动检测。例如，如果你有一张 CUDA 显卡，但想要强制使用支持 AVX2 向量的 CPU LLM 库，可以使用：

OLLAMA_LLM_LIBRARY="cpu_avx2" ollama serve

你可以通过以下命令查看你的 CPU 支持哪些特性：

cat /proc/cpuinfo| grep flags | head -1

在 Linux 上安装旧版本或预发布版本

如果你在 Linux 上遇到问题想要安装一个旧版本，或者想要在正式发布前尝试预发布版本，你可以通过指定版本号来告诉安装脚本安装哪个版本：

curl -fsSL <https://ollama.com/install.sh> | OLLAMA_VERSION="0.1.29" sh

Linux 的 tmp 目录设置为 noexec

如果你的系统将 Ollama 存储临时可执行文件的 tmp 目录设置为了 “noexec”，你可以通过设置 OLLAMA_TMPDIR 来指定一个用户可写的替代位置。例如 OLLAMA_TMPDIR=/usr/share/ollama/

在 NVIDIA GPU 上运行容器失败

确保你已按照 docker.md 描述的步骤设置好了容器运行时环境。

有时，容器运行时可能在初始化 GPU 时遇到问题。查看服务器日志时，你可能会看到各种错误代码，如 “3”（未初始化）、“46”（设备不可用）、“100”（无设备）、“999”（未知）等。以下是一些可能帮助解决问题的排查方法：

容器运行时是否正常工作？尝试运行 docker run --gpus all ubuntu nvidia-smi，如果这不起作用，Ollama 将无法识别你的 NVIDIA GPU。
UVM 驱动是否未加载？运行 sudo nvidia-modprobe -u
尝试重新加载 nvidia_uvm 驱动 - 先运行 sudo rmmod nvidia_uvm 然后运行 sudo modprobe nvidia_uvm
尝试重启电脑
确保你使用的是最新的 nvidia 驱动
如果这些方法都无法解决问题，请收集更多信息并提交问题报告：
设置 CUDA_ERROR_LEVEL=50 并尝试再次运行，以获得更多诊断日志
检查 dmesg 是否有任何相关错误，运行 sudo dmesg | grep -i nvrm 和 sudo dmesg | grep -i nvidia

如何学习大模型

现在社会上大模型越来越普及了，已经有很多人都想往这里面扎，但是却找不到适合的方法去学习。

作为一名资深码农，初入大模型时也吃了很多亏，踩了无数坑。现在我想把我的经验和知识分享给你们，帮助你们学习AI大模型，能够解决你们学习中的困难。

我已将重要的AI大模型资料包括市面上AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习，等录播视频免费分享出来，需要的小伙伴可以扫取。

一、AGI大模型系统学习路线

很多人学习大模型的时候没有方向，东学一点西学一点，像只无头苍蝇乱撞，我下面分享的这个学习路线希望能够帮助到你们学习AI大模型。

在这里插入图片描述

二、AI大模型视频教程

在这里插入图片描述

三、AI大模型各大学习书籍

在这里插入图片描述

四、AI大模型各大场景实战案例

在这里插入图片描述

五、结束语

学习AI大模型是当前科技发展的趋势，它不仅能够为我们提供更多的机会和挑战，还能够让我们更好地理解和应用人工智能技术。通过学习AI大模型，我们可以深入了解深度学习、神经网络等核心概念，并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时，掌握AI大模型还能够为我们的职业发展增添竞争力，成为未来技术领域的领导者。

再者，学习AI大模型也能为我们自己创造更多的价值，提供更多的岗位以及副业创收，让自己的生活更上一层楼。

因此，学习AI大模型是一项有前景且值得投入的时间和精力的重要选择。