【ollama】一键部署2000多种AI大模型!不挑环境、不吃配置,神了!

前言

在数字化的浪潮中,Ollama如同一位技术界的“魔法师”,挥舞着它的魔杖——一行简单的命令,就能唤醒沉睡的代码巨人,一键本地部署2000+ 大模型!今天,让我们揭开Ollama的神秘面纱,一探究竟。

一、Ollama:AI“魔法师”

Ollama,它是一个轻量级、可扩展的大模型框架,就像是一位能够召唤各种大语言模型的魔法师。它不仅支持Windows、Linux、MacOS这些主流操作系统,还拥有一个庞大的模型库,包括Qwen、Llama等2000+大语言模型。

一键部署2000多种AI大模型!不挑环境、不吃配置,神了!_LLM

你只需轻轻一念咒语(输入命令),就能让这些模型为你所用,是不是很酷?

跨平台支持

Ollama就像是那个传说中的“万能钥匙”,无论你是在Windows的城堡、Linux的森林还是MacOS的岛上,都能轻松打开AI的大门。

丰富的模型库

提供了丰富的模型库,就像是给你一个巨大的“魔法书库”,里面藏有各种强大的魔法书(模型),你可以根据需要随时“借阅”。

自定义模型参数

支持用户上传自己的模型,就像是给你一个“魔杖”,你可以用它来调整魔法的效果,让魔法更符合你的心意。

多GPU并行推理加速

在多卡环境下,可以设置环境变量来指定特定GPU。这就像是给你的魔法书加上“加速咒”,让你的魔法施展得更快。

二、安装:简单到“真·一键搞定”

1、Windows安装

直接从下载页面下载相对应系统的安装程序,Windows安装程序选择Windows的安装包,点击“Download for Windows(Preview)”。

一键部署2000多种AI大模型!不挑环境、不吃配置,神了!_LLM_02

下载好以后,双击安装包,之后一直点击“install”安装即可。安装完成之后,打开一个cmd命令窗口,输入“ollama”命令,如果显示ollama相关的信息就证明安装已经成功了,如下图:

一键部署2000多种AI大模型!不挑环境、不吃配置,神了!_agi_03

2、Mac安装

从下载页面,下载苹果系统相对应的安装程序,即点击“Download for Mac”。

一键部署2000多种AI大模型!不挑环境、不吃配置,神了!_人工智能_04

下载好后,双击安装包,点击“install”,等待Ollama自动安装。

一键部署2000多种AI大模型!不挑环境、不吃配置,神了!_语言模型_05

(鉴于很多朋友无法下载ollama,这里给大家整理好了ollama的安装包,扫描领取即可↓↓↓↓

3、Linux安装

在Linux系统上,可以通过脚本安装或源码编译的方式来安装Ollama,下面介绍主流的脚本安装方法。

脚本安装

Ollama提供了一键安装脚本,可以快速在Linux系统上安装Ollama,打开终端,执行以下命令下载安装脚本:

curl -fsSL https://ollama.com/install.sh  | sh

等待安装完成。安装脚本会自动下载所需的组件,并完成Ollama的安装与配置。安装完成后,可以通过以下命令启动Ollama:

ollama serve

三、命令参数:你的AI助手

以下是Ollama使用常见的指令:

ollama serve         #启动ollama  
ollama create        #从模型文件创建模型  
ollama show          #显示模型信息  
ollama run           #运行模型  
ollama pull          #从注册表中拉取模型  
ollama push          #将模型推送到注册表  
ollama list          #列出模型  
ollama cp            #复制模型  
ollama rm            #删除模型  
ollama help          #获取有关任何命令的帮助信息

四、设置自定义模型下载路径

默认情况下,ollama模型的存储目录如下:

macOS: `~/.ollama/models` 

Linux: `/usr/share/ollama/.ollama/models`  

Windows: `C:\Users\<username>\.ollama\models`

Windows更改Ollama模型存放位置

在Windows系统中,若要更改Ollama模型的存放位置,可以按照以下步骤操作:

  • 右键点击“此电脑”或“我的电脑”,选择“属性”。
  • 在系统窗口中选择“高级系统设置”。
  • 在系统属性窗口中点击“环境变量”按钮。
  • 在环境变量窗口中,点击“新建”创建一个新的系统变量或用户变量。
  • 变量名:OLLAMA_MODELS
  • 变量值:输入你希望设置的新模型存放路径,例如:E:\Ollama\Models
  • 点击“确定”保存设置。
  • 重启Ollama相关服务,使新的路径生效。

Linux/Mac更改Ollama模型存放位置

在Linux或Mac系统中,更改Ollama模型存放位置的步骤如下:

  • 打开终端,创建一个新的目录作为模型存放位置,例如:`mkdir -p /path/to/your/new/ollama/models`
  • 设置环境变量:在Linux系统中,可以通过编辑/.bashrc或/.bash_profile文件(对于bash shell)或~/.zshrc文件(对于zsh shell)。
  • 在Mac系统中,可以通过编辑/.bash_profile或/.zshrc文件。
  • 在终端中运行以下命令:`source ~/.bashrc`(或者source ~/.bash_profile,取决于你编辑的文件)
  • 重启Ollama相关服务,使新的路径生效。

五、导入huggingface模型

最新版Ollama开始支持从Huggingface Hub上直接拉取各种模型,包括社区创建的GGUF量化模型。

用户可以通过简单的命令行指令快速运行这些模型,可以使用如下命令:

ollama run hf.co/{username}/{repository}

一键部署2000多种AI大模型!不挑环境、不吃配置,神了!_agi_06

要选择不同的量化方案,只需在命令中添加一个标签:

ollama run hf.co/{username}/{repository}:{quantization}

例如:量化名称不区分大小写
ollama run hf.co/bartowski/Llama-3.2-3B-Instruct-GGUF:IQ3_M  
ollama run hf.co/bartowski/Llama-3.2-3B-Instruct-GGUF:Q8_0

还可以直接使用完整的文件名作为标签:  
ollama run hf.co/bartowski/Llama-3.2-3B-Instruct-GGUF:Llama-3.2-3B-Instruct-IQ3_M.gguf

程序员为什么要学大模型?

大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业?”“谁的饭碗又将不保了?”等问题热议不断。

事实上,抢你饭碗的不是AI,而是会利用AI的人。

科大讯飞、阿里、华为等巨头公司发布AI产品后,很多中小企业也陆续进场!超高年薪,挖掘AI大模型人才! 如今大厂老板们,也更倾向于会AI的人,普通程序员,还有应对的机会吗?

与其焦虑……

不如成为「掌握AI工具的技术人」,毕竟AI时代,谁先尝试,谁就能占得先机!

但是LLM相关的内容很多,现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学,学习成本和门槛很高。

针对所有自学遇到困难的同学们,我帮大家系统梳理大模型学习脉络,将这份 LLM大模型资料 分享出来:包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓

👉优快云大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)👈

一、LLM大模型经典书籍

AI大模型已经成为了当今科技领域的一大热点,那以下这些大模型书籍就是非常不错的学习资源。

在这里插入图片描述

二、640套LLM大模型报告合集

这套包含640份报告的合集,涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)

在这里插入图片描述

三、LLM大模型系列视频教程

在这里插入图片描述

四、LLM大模型开源教程(LLaLA/Meta/chatglm/chatgpt)

在这里插入图片描述

LLM大模型学习路线

阶段1:AI大模型时代的基础理解

  • 目标:了解AI大模型的基本概念、发展历程和核心原理。

  • 内容

    • L1.1 人工智能简述与大模型起源
    • L1.2 大模型与通用人工智能
    • L1.3 GPT模型的发展历程
    • L1.4 模型工程
    • L1.4.1 知识大模型
    • L1.4.2 生产大模型
    • L1.4.3 模型工程方法论
    • L1.4.4 模型工程实践
    • L1.5 GPT应用案例

阶段2:AI大模型API应用开发工程

  • 目标:掌握AI大模型API的使用和开发,以及相关的编程技能。

  • 内容

    • L2.1 API接口
    • L2.1.1 OpenAI API接口
    • L2.1.2 Python接口接入
    • L2.1.3 BOT工具类框架
    • L2.1.4 代码示例
    • L2.2 Prompt框架
    • L2.3 流水线工程
    • L2.4 总结与展望

阶段3:AI大模型应用架构实践

  • 目标:深入理解AI大模型的应用架构,并能够进行私有化部署。

  • 内容

    • L3.1 Agent模型框架
    • L3.2 MetaGPT
    • L3.3 ChatGLM
    • L3.4 LLAMA
    • L3.5 其他大模型介绍

阶段4:AI大模型私有化部署

  • 目标:掌握多种AI大模型的私有化部署,包括多模态和特定领域模型。

  • 内容

    • L4.1 模型私有化部署概述
    • L4.2 模型私有化部署的关键技术
    • L4.3 模型私有化部署的实施步骤
    • L4.4 模型私有化部署的应用场景

这份 LLM大模型资料 包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓

👉优快云大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)👈

<think>好的,用户想用Ollama在本地部署一个AI模型,用于问答,而且电脑配置高,需要推荐合适的模型。首先,我需要考虑Ollama支持的模型有哪些适合低配置的。Ollama通常支持像Llama、Mistral这些模型,所以得从这些系列里找。 用户提到电脑配置高,可能内存和CPU有限,所以模型大小是关键。较大的模型Llama2-7B可能需要至少8GB内存,但如果是4GB或更低,可能需要更小的模型。这时候应该考虑参数较少的版本,比如Mistral 7B虽然也是7B参数,但可能优化得更好,或者更小的模型如Phi-2,只有2.7B参数,适合低配置。 接下来,用户需要本地检索问答,可能需要模型具备较好的理解和生成能力,尤其是在中文支持方面。虽然很多模型主要用英文训练,但有些如Chinese-Alpaca可能更适合中文任务,但需要确认是否支持Ollama。如果用户主要用中文,可能需要推荐Chinese-Alpaca或者建议他们注意模型的语种支持。 另外,使用场景是本地检索问答,可能涉及RAG(检索增强生成),这时候模型需要处理上下文和准确回答。TinyLlama虽然小,但可能在多轮对话或复杂问答上表现足,需要权衡性能和资源占用。 还要考虑用户的技术背景。如果他们太熟悉模型配置,可能需要推荐容易部署模型,比如Ollama官方文档中明确列出的,或者社区使用较多的,比如Mistral或Phi-2,这些可能有一键安装的命令,比如`ollama run mistral`,简单方便。 最后,可能需要提醒用户如果遇到内存足的情况,调整参数如`num_ctx`减少上下文长度,或者使用量化版本,比如4-bit或5-bit的模型,这些可以在保持一定性能的同时减少内存占用。 总结下来,推荐的模型应该是在低资源下表现良好,支持所需语言,且易于在Ollama部署的。可能包括Phi-2、TinyLlama-1.1B、Mistral-7B(如果配置允许)以及Chinese-Alpaca(如果中文需求强)。同时,给出部署步骤和优化建议,帮助用户顺利使用。</think>根据你的需求(本地部署、低配置电脑、问答场景),以下是几个适合在Ollama上运行的轻量级AI大模型推荐: --- ### **1. Phi-2(微软)** - **模型大小**:2.7B参数 - **特点**:微软开源的小型模型,针对逻辑推理和问答优化,性能接近7B级别模型,支持中英文。 - **硬件要求**:4GB内存即可运行,低配电脑友好。 - **部署命令**: ```bash ollama run phi ``` --- ### **2. TinyLlama-1.1B** - **模型大小**:1.1B参数 - **特点**:超轻量级,适合基础问答和简单文本生成,对硬件要求极低。 - **硬件要求**:2GB内存可运行,适合老旧电脑。 - **部署命令**: ```bash ollama run tinyllama ``` --- ### **3. Mistral-7B(4-bit量化版)** - **模型大小**:7B参数(量化后约4GB) - **特点**:性能强于前两者,支持复杂问答和多语言,量化后内存占用大幅降低。 - **硬件要求**:8GB内存(建议有独立显卡更好)。 - **部署命令**: ```bash ollama run mistral:7b-instruct-q4_0 ``` --- ### **4. Chinese-Alpaca-2-7B(如需中文优先)** - **模型大小**:7B参数 - **特点**:专为中文优化的模型,适合中文问答和对话。 - **硬件要求**:8GB内存,建议搭配CPU推理优化。 - **部署命令**: ```bash ollama run Chinese-Alpaca-2-7B ``` --- ### **选择建议**: - **最低配置(4GB内存以下)**:优先选 **Phi-2** 或 **TinyLlama**,牺牲部分性能保证流畅度。 - **中等配置(8GB内存)**:选 **Mistral-7B量化版**,平衡性能与资源占用。 - **中文场景**:用 **Chinese-Alpaca-2**,但需自行确认Ollama支持性(可能需要手动导入模型)。 --- ### **部署步骤**: 1. 安装Ollama(官网下载对应系统版本)。 2. 命令行执行上述`ollama run <模型名>`自动下载并启动。 3. 通过API或命令行直接与模型交互。 --- ### **优化技巧**: - 调整上下文长度:在运行时添加参数 `--num_ctx 512`(降低数值减少内存占用)。 - 关闭后台服务:用完模型后执行 `ollama serve` 停止服务释放内存。 - 优先选择量化版本(模型名含`q4_0`或`q5`后缀)。 如果有具体配置(如内存大小/是否有显卡),可进一步缩小推荐范围!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值