【AI大模型部署】2000+多种开源大模型随意部署!一键搭建本地大模型,不挑环境、不挑配置(ollama 安装部署教程)

一、Ollama介绍

1 基本介绍

Ollama是一个支持在WindowsLinuxMacOS上本地运行大语言模型的工具。它允许用户非常方便地运行和使用各种大语言模型,比如Qwen模型等。用户只需一行命令就可以启动模型。

主要特点包括:

  1. 跨平台支持WindowsLinuxMacOS系统。

  2. 提供了丰富的模型库,包括QwenLlama等1700+大语言模型,可以在官网model library中直接下载使用。

  3. 支持用户上传自己的模型。用户可以将huggingface等地方的ggml格式模型导入到ollama中使用。也可以将基于pytorch等格式的模型转换为ggml格式后导入。

  4. 允许用户通过编写modelfile配置文件来自定义模型的推理参数,如temperaturetop_p等,从而调节模型生成效果。

  5. 支持多GPU并行推理加速。在多卡环境下,可以设置环境变量来指定特定GPU

  6. 强大的技术团队支持,很多模型开源不到24小时就能获得支持。

总的来说,Ollama降低了普通开发者使用大语言模型的门槛,使得本地部署体验大模型变得简单易行。对于想要搭建自己的AI应用,或者针对特定任务调优模型的开发者来说,是一个非常有用的工具。它的一些特性,如允许用户自定义模型参数,对模型进行个性化适配提供了支持。

2 官网

  • Ollama 下载:https://ollama.com/download

  • Ollama 官方主页:https://ollama.com

  • Ollama 官方 GitHub 源代码仓库:https://github.com/ollama/ollama/

二、window 安装

直接从下载页面下载相对应系统的安装程序,Windows安装程序选择Windows的安装包,点击“Download for Windows(Preview)

下载好以后一路install 安装即可。

安装完成之后,打开一个cmd命令窗口,输入“ollama”命令,如果显示ollama相关的信息就证明安装已经成功了!



三、Mac 安装

直接从下载页面下载相对应系统的安装程序,Windows安装程序选择Windows的安装包,点击“Download for Mac

下载好后打开安装命令行

四、 Linux 安装

在Linux系统上,可以通过脚本安装或源码编译的方式来安装Ollama。下面分别介绍这两种安装方法。

4.1 脚本安装

Ollama提供了一键安装脚本,可以快速在Linux系统上安装Ollama。安装步骤如下:

  1. 打开终端,执行以下命令下载安装脚本:

    curl -fsSL https://ollama.com/install.sh | sh   
    
  2. 等待安装完成。安装脚本会自动下载所需的组件,并完成Ollama的安装与配置。

  3. 安装完成后,可以通过以下命令启动Ollama:

    ollama serve   
    

4.2 二进制安装

  1. 将 Ollama 的二进制文件下载到 PATH 中的目录:

    sudo curl -L https://ollama.com/download/ollama-linux-amd64 -o /usr/bin/ollama   sudo chmod +x /usr/bin/ollama   
    
  2. 将 Ollama 添加为自启动服务,首先,为 Ollama 创建用户:

sudo useradd -r -s /bin/false -m -d /usr/share/ollama ollama   
  1. 然后在该位置:/etc/systemd/system/ollama.service 创建服务文件
   [[Unit]
Description=Ollama Service
After=network-online.target

[Service]
ExecStart=/usr/bin/ollama serve
User=ollama
Group=ollama
Restart=always
RestartSec=3

[Install]
WantedBy=default.target 
  1. 设置开机自启动

    sudo systemctl daemon-reload   sudo systemctl enable ollama   
    
  2. 启动 Ollama,使用以下命令启动 Ollama:systemd

    sudo systemctl start ollama   
    

4.3 安装特定版本

设置 OLLAMA_VERSION字段,,可以安装对应的版本

curl -fsSL https://ollama.com/install.sh | OLLAMA_VERSION=0.3.13 sh   

4.4 查看日志

查看作为启动服务运行的 Ollama 的日志:

journalctl -e -u ollama   

4.5 更新

通过shell 脚本更新 Ollama:

curl -fsSL https://ollama.com/install.sh | sh   

或者下载 Ollama 二进制文件:

sudo curl -L https://ollama.com/download/ollama-linux-amd64 -o /usr/bin/ollama   sudo chmod +x /usr/bin/ollama   

4.6 卸载

  • 删除 Ollama 服务:
sudo systemctl stop ollama   sudo systemctl disable ollama   sudo rm /etc/systemd/system/ollama.service   
  • 从 bin 目录中删除 Ollama 二进制文件:/usr/local/bin ,/usr/bin ,/bin
sudo rm $(which ollama)   
  • 删除下载的模型和 Ollama 服务用户和组:
sudo rm -r /usr/share/ollama   sudo userdel ollama   sudo groupdel ollama   

unsetunset三、命令参数unsetunset

以下是 Ollama 使用常见的指令:

ollama serve         #启动ollama
ollama create        #从模型文件创建模型
ollama show          #显示模型信息
ollama run           #运行模型
ollama pull          #从注册表中拉取模型
ollama push          #将模型推送到注册表
ollama list          #列出模型
ollama cp            #复制模型
ollama rm            #删除模型
ollama help          #获取有关任何命令的帮助信息 

unsetunset四、设置自定义模型下载路径unsetunset

默认情况下,ollama模型的存储目录如下:

  • macOS: ~/.ollama/models

  • Linux: /usr/share/ollama/.ollama/models

  • Windows: C:\Users\<username>\.ollama\models

4.1 Windows 更改 Ollama 模型存放位置

在Windows系统中,若要更改Ollama模型的存放位置,可以按照以下步骤操作:

  1. 打开环境变量编辑界面。可以通过以下方式:
  • 右键点击“此电脑”或“我的电脑”,选择“属性”。

  • 在系统窗口中选择“高级系统设置”。

  • 在系统属性窗口中点击“环境变量”按钮。

  1. 在环境变量窗口中,点击“新建”创建一个新的系统变量或用户变量。
  • 变量名:OLLAMA_MODELS

  • 变量值:输入你希望设置的新模型存放路径,例如:D:\Ollama\Models

  1. 点击“确定”保存设置。

  2. 重启任何已经打开的Ollama相关应用程序,以便新的路径生效。

4.2 Linux/Mac 更改 Ollama 模型存放位置

在Linux或Mac系统中,更改Ollama模型存放位置的步骤如下:

  1. 打开终端。

  2. 创建一个新的目录作为模型存放位置,例如:

    mkdir -p /path/to/your/new/ollama/models   
    
  3. 设置环境变量。在Linux系统中,可以通过编辑~/.bashrc~/.bash_profile文件(对于bash shell)或~/.zshrc文件(对于zsh shell)。在Mac系统中,可以通过编辑~/.bash_profile~/.zshrc文件。使用以下命令编辑文件:

    nano ~/.bashrc  # 或者使用其他的文本编辑器,如vim   
    
  4. 在文件末尾添加以下行来设置OLLAMA_MODELS环境变量:

    export OLLAMA_MODELS="/path/to/your/new/ollama/models"   
    
  5. 保存并关闭文件。如果你使用的是nano编辑器,可以按Ctrl + X,然后按Y确认保存,最后按Enter键。

  6. 使环境变量生效。在终端中运行以下命令:

    source ~/.bashrc  # 或者source ~/.bash_profile,取决于你编辑的文件   
    
  7. 重启任何已经打开的Ollama相关应用程序,以便新的路径生效。

五、导入 huggingface 模型

Ollama 从最新版0.3.13开始支持从 Huggingface Hub 上直接拉取各种模型,包括社区创建的 GGUF 量化模型。用户可以通过简单的命令行指令快速运行这些模型。

可以使用如下命令:

ollama run hf.co/{username}/{repository}   

请注意,您可以使用 hf.cohuggingface.co 作为域名。

cover

要选择不同的量化方案,只需在命令中添加一个标签:

ollama run hf.co/{username}/{repository}:{quantization}   

例如:

ollama run hf.co/bartowski/Llama-3.2-3B-Instruct-GGUF:IQ3_M   ollama run hf.co/bartowski/Llama-3.2-3B-Instruct-GGUF:Q8_0   

量化名称不区分大小写,因此以下命令同样有效:

ollama run hf.co/bartowski/Llama-3.2-3B-Instruct-GGUF:iq3_m   

您还可以直接使用完整的文件名作为标签:

ollama run hf.co/bartowski/Llama-3.2-3B-Instruct-GGUF:Llama-3.2-3B-Instruct-IQ3_M.gguf   

最后的最后

感谢你们的阅读和喜欢,作为一位在一线互联网行业奋斗多年的老兵,我深知在这个瞬息万变的技术领域中,持续学习和进步的重要性。

为了帮助更多热爱技术、渴望成长的朋友,我特别整理了一份涵盖大模型领域的宝贵资料集。

这些资料不仅是我多年积累的心血结晶,也是我在行业一线实战经验的总结。

这些学习资料不仅深入浅出,而且非常实用,让大家系统而高效地掌握AI大模型的各个知识点。如果你愿意花时间沉下心来学习,相信它们一定能为你提供实质性的帮助。

这份完整版的大模型 AI 学习资料已经上传优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费

大模型知识脑图

为了成为更好的 AI大模型 开发者,这里为大家提供了总的路线图。它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
在这里插入图片描述

经典书籍阅读

阅读AI大模型经典书籍可以帮助读者提高技术水平,开拓视野,掌握核心技术,提高解决问题的能力,同时也可以借鉴他人的经验。对于想要深入学习AI大模型开发的读者来说,阅读经典书籍是非常有必要的。

在这里插入图片描述

实战案例

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

在这里插入图片描述

面试资料

我们学习AI大模型必然是想找到高薪的工作,下面这些面试题都是总结当前最新、最热、最高频的面试题,并且每道题都有详细的答案,面试前刷完这套面试题资料,小小offer,不在话下

在这里插入图片描述

640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

在这里插入图片描述

这份完整版的大模型 AI 学习资料已经上传优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费

<think>嗯,用户想了解本地部署大模型工具,类似Ollama。首先,我需要回忆一下Ollama是什么,以及它的主要特点。Ollama是一个支持在本地运行大型语言模型开源工具,允许用户无需依赖云服务就能使用模型,比如Llama 2、Mistral等。接下来,用户可能想知道其他类似的工具,所以得列举几个,比如LM Studio、GPT4All、Hugging Face的Transformers库,还有LocalAI。 然后,我需要考虑用户为什么会关心本地部署。可能的原因包括数据隐私、离线使用、定制化需求,或者是想避免云服务费用。所以在介绍每个工具时,应该突出这些方面,比如强调数据隐私保护、离线功能、支持的模型类型等。 接下来,用户可能想知道如何选择适合自己的工具。这就需要分点说明,比如根据易用性、模型支持、硬件需求、定制化程度来推荐同的工具。例如,LM Studio适合新手,而Transformers库适合开发者。 还要注意使用中文回答,结构清晰,分步骤解释。可能需要先介绍Ollama,再列举其他工具,每个工具的特点、优缺点,最后给出选择建议。同时,确保所有的数学公式和代码都用正确的LaTeX格式,但根据用户的问题,可能这部分内容多,过还是要注意检查。 另外,用户可能对部署的具体步骤或系统要求有疑问,但问题主要是介绍工具,所以可能需要详细步骤,但可以简要提到硬件需求,比如GPU加速、内存要求等。比如LocalAI需要Docker,这可能对某些用户来说是个门槛,而Ollama一键安装更友好。 最后,确保回答真实可靠,提到的工具都是确实存在的,并且特点描述准确。可能需要验证每个工具的最新信息,比如GPT4All是否依然支持跨平台,Hugging Face的库是否需要额外配置等。总之,回答要帮助用户全面了解可选工具,并根据同需求做出决策。</think>以下是对本地部署语言模型工具(如Ollama)的详细介绍及同类工具对比: ### 一、Ollama 核心特性 1. **跨平台支持** - 支持 macOS/Linux/Windows(需WSL2) - 单行命令部署:`curl -fsSL https://ollama.ai/install.sh | sh` 2. **模型生态** - 内置 Llama 2、Code Llama、Mistral 等主流模型 - 自定义模型加载:`ollama create -f Modelfile` 3. **硬件加速** - 自动启用 GPU 加速(需 NVIDIA CUDA 环境) - 内存优化技术降低显存占用 4. **API 集成** - 开放 REST API 接口(默认端口11434) - 兼容 OpenAI 格式的请求封装 $$ \text{推理速度} = \frac{\text{Tokens/sec}}{\text{GPU显存(GB)} \times 0.8 + 12} $$ ### 二、同类工具对比 | 工具名称 | 核心优势 | 模型格式支持 | 学习曲线 | |---------|----------|--------------|----------| | **Ollama** | 部署最简 | GGUF, PyTorch | ★★☆☆☆ | | **LM Studio** | 图形界面 | GGML, GGUF | ★☆☆☆☆ | | **GPT4All** | 低配优化 | GPT4All-J | ★★☆☆☆ | | **LocalAI** | Kubernetes集成 | Safetensors, GGML | ★★★☆☆ | | **llama.cpp** | 极致性能 | 全量化格式 | ★★★★☆ | ### 三、部署实践建议 1. **硬件匹配策略** - 7B模型:GTX 3060(12GB)及以上 - 13B模型:RTX 3090(24GB) - 70B模型:需多卡并行 2. **量化方案选择** - 4-bit量化:推理速度提升40%,精度损失<3% - 8-bit量化:适合知识密集型任务 3. **内存优化技巧** ```bash # 启用内存分页 ollama serve --numa --memory-swap=20G ``` ### 四、典型应用场景 1. **私有知识库问答** - RAG架构搭建:$$P(ans|query) = \sum_{doc}P(doc|query)P(ans|doc)$$ 2. **自动化文档处理** - 支持 Markdown/PDF 结构化解析 3. **代码生成调试** - 结合 Code-Llama 实现上下文感知编程 ### 五、安全注意事项 1. 模型文件完整性验证: `sha256sum ./models/llama-2-7b.gguf` 2. 网络隔离建议: - 使用 iptables 限制本地端口访问 - 启用 TLS 证书加密通信 建议根据具体需求选择工具,若追求极简部署首选Ollama,需要企业级扩展则考虑LocalAI,低配设备可尝试GPT4All。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值