Jetson Orin NX使用 Ollama 本地部署 deepseek

本文记录在 jetson orin nx 上使用 ollama 部署 deepseek 的过程

有用的网站及工具

  1. NVIDIA Jetson AI Lab
  2. Ollama官网
  3. Jtop 工具 ==> 用以查看jetson GPU/CPU/Memory 等占用情况的工具,安装过程如下:
sudo apt-get install python3-pip
sudo -H pip3 install -U jetson-stats
  1. Nvidia 官网的 Ollama 教程
  2. 安装 Ollama
curl -fsSL https://ollama.com/install.sh | sh

进入Ollama官网,点击 Deepseek-R1 进入 Deepseek 界面:https://ollama.com/library/deepseek-r1:1.5b
在这里插入图片描述
执行指令,会先下载模型库到本地
在这里插入图片描述

### 如何在 Jetson Orin NX部署 DeepSeek DeepSeek部署涉及多个方面,包括环境配置、模型转换以及优化。为了确保最佳性能,在 Jetson Orin NX部署 DeepSeek 需要遵循一系列特定的操作。 #### 环境准备 Jetson Orin NX 提供强大的计算能力,适合运行复杂的神经网络模型。安装必要的软件包和依赖项是第一步: - 安装 NVIDIA CUDA 和 cuDNN 库以支持 GPU 加速。 - 设置 Python 虚拟环境并安装所需的 Python 包,如 PyTorch 或 TensorFlow 及其相关工具[^1]。 ```bash sudo apt-get update && sudo apt-get install -y \ python3-pip \ libopencv-dev \ protobuf-compiler \ libprotoc-dev pip3 install --upgrade pip setuptools wheel ``` #### 模型转换与优化 对于 DeepSeek 这样的复杂模型,建议将其转化为 ONNX 格式以便更好地利用 TensorRT 进行推理加速。具体操作如下: - 使用官方提供的脚本或自定义代码将训练好的模型导出为 ONNX 文件。 - 利用 ONNX Runtime 工具链进一步优化该文件,特别是针对 Jetson 平台做了专门适配的工作。 ```python import torch.onnx as onnx from deepseek import DeepSeekModel # 假设这是 DeepSeek 的模型类 model = DeepSeekModel() dummy_input = torch.randn(1, 3, 224, 224) onnx.export(model, dummy_input, "deepseek_model.onnx", opset_version=11) ``` #### TensorRT 推理引擎集成 TensorRT 是 NVIDIA 开发的一个高性能深度学习推理库,特别适用于嵌入式设备上的高效执行。通过 TensorRT 对 ONNX 模型进行量化处理可以显著提升效率,尤其是在资源受限的情况下[^3]。 - 将 ONNX 模型导入到 TensorRT 中,并应用 INT8 或混合精度技术来减少内存占用同时保持较高的准确性。 - 编译后的 TensorRT 引擎可以直接加载用于实时预测任务。 ```cpp #include <NvInfer.h> // ... 初始化 TensorRT ... nvinfer1::IBuilder* builder = nvinfer1::createInferBuilder(logger); builder->setMaxBatchSize(batch_size); auto network = builder->createNetworkV2(0U); // 导入 ONNX 模型... parser->parseFromFile(onnx_file_path.c_str(), static_cast<int>(verbosity)); // 构建 TensorRT 引擎... ICudaEngine* engine = builder->buildCudaEngine(*network); ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

地球被支点撬走啦

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值