Ollama入门(windows版本)

本文介绍了如何通过简单的步骤在本地安装开源语言模型Ollama(包括Gemma版本),以及提供两种运行方式:命令行和WebAPI,包括OpenAI工具包的使用和示例调用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、简介

通过简单的安装指令,可以让用户执行一条命令就在本地运行开源大型语言模型,如gemma。
在这里插入图片描述

二、安装方式

1、访问官网,点击【Download】进行下载https://ollama.com/
2、目前支持Linux、Mac和windows
3、github链接:https://github.com/ollama/ollama
在这里插入图片描述

三、下载并运行模型(命令行方式)

1、点击【View logs】进入ollama目录
2、运行gemma:2b模型(如未下载,会自动下载)
3、提问

ollama run gemma:2b

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

四、webapi方式运行

1、webapi方式运行

./ollama serve

2、如需指定端口,可在环境变量中进行配置
在这里插入图片描述
3、安装openai工具包

pip install openai

4、openai格式调用ollama部署的接口

import openai
# 设置api_base
openai.api_key = "111" #不可为空,为空会报错
openai.api_base = "http://127.0.0.1:8000/v1"
# 2. 设置提示词
prompt = """
你是谁?

"""

# 3.调用(可切换模型)
# resp = openai.ChatCompletion.create(model="llama2", messages=[{"role": "user", "content": prompt}], stream = False)
resp = openai.ChatCompletion.create(model="llama2-chinese", messages=[{"role": "user", "content": prompt}], stream = False)
# resp = openai.ChatCompletion.create(model="gemma:7b", messages=[{"role": "user", "content": prompt}], stream = False)

# 4.输出
print(resp.choices[0].message.content)

### Ollama NPU 技术概述 Ollama NPU(神经处理单元)是一种专为加速人工智能工作负载设计的专用硬件组件。该技术旨在优化大型语言模型和其他复杂AI任务的性能,特别是在多GPU环境中[^4]。 对于Ollama NPU的应用场景和技术特性,可以从以下几个方面进行阐述: #### 硬件兼容性和灵活性 Ollama NPU具备广泛的硬件兼容性,不仅限于特定品牌或类型的GPU,而且能够在多种操作系统环境下稳定运行,包括但不限于Apple MacBooks、Windows PC以及Linux服务器环境。这种广泛的支持使得开发者可以根据实际需求灵活选择最适合的工作平台。 #### 高效能计算能力 借助先进的架构设计,Ollama NPU可以在不牺牲精度的前提下显著提升数据处理速度。特别是当涉及到复杂的机器学习算法时,如卷积神经网络(CNNs),循环神经网络(RNNs)等,NPU的表现尤为突出。此外,在面对大规模并发请求的情况下,通过合理的资源调度策略,还可以进一步提高系统的整体吞吐量和响应效率[^3]。 #### 易用性的开发工具链 为了降低用户的入门门槛并加快产品迭代周期,围绕着Ollama NPU构建了一套完整的软件生态系统。这其中包括了轻量化且易于集成的Python库,它允许程序员快速搭建原型;同时也提供了与OpenAI API相匹配的功能接口,方便对接现有的应用程序和服务体系结构。 ```python import ollama_npu as onpu # 初始化OLLAMA NPU实例 npu_instance = onpu.NPU() # 加载预训练模型 model_path = "path/to/pretrained/model" loaded_model = npu_instance.load_model(model_path) # 执行推理任务 input_data = ... # 输入样本数据 output_result = loaded_model.predict(input_data) ```
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值