Deepseek-R1 模型快速搭建

原创已于 2025-02-11 12:08:28 修改

· 544 阅读

·

7

·

版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

于 2025-02-11 10:57:51 首次发布

登录 - 腾讯云腾讯云为数百万的企业和开发者提供安全、稳定的云服务器、云主机、CDN、对象存储、域名注册、云存储、云数据库等云服务，帮助用户解决游戏、视频、移动、微信、互联网+等行业的架构难题，是全球领先的云计算服务商。https://buy.cloud.tencent.com/hai?applicationId=app-io484ryb&applicationType=sc-7ramp21e®ionId=15&bundleId=XL&diskSize=80快速使用

步骤一：创建

开箱即用的Deepseek-R1可在 HAI 中快速启动，进行测试并接入业务

步骤二：

chatbotui 是ui 页面

JupyterLab 是命令行

输入以下命令加载默认模型：

ollama run deepseek-r1

进阶使用

切换不同参数量级

若默认的1.5B蒸馏模型无法满足需求，可通过以下命令自定义模型参数量级：

DeepSeek-R1-Distill-7B

ollama run deepseek-r1:7b

DeepSeek-R1-Distill-8B

ollama run deepseek-r1:8b

DeepSeek-R1-Distill-14B

ollama run deepseek-r1:14b

1. Ollama

Ollama 是一个开源的 AI 模型管理工具，旨在简化机器学习模型的使用和部署。它允许用户轻松地下载、运行和管理各种 AI 模型，通常用于自然语言处理、图像处理等任务。

2. DeepSeek

DeepSeek 是一个特定的 AI 模型，通常用于文本生成、对话系统等任务。DeepSeek 的不同版本（如 1.5B、7B、8B、16B 和 32B）通常指的是模型的参数数量，参数数量越多，模型的复杂性和潜在的性能通常也越高。

1.5B：表示模型有 15 亿个参数，通常是较小的版本，适合资源有限的环境。
7B：表示模型有 70 亿个参数，通常在性能和资源消耗之间取得较好的平衡。
8B：表示模型有 80 亿个参数，通常在生成能力上比 7B 更强。
16B：表示模型有 160 亿个参数，适合需要更高生成质量的应用。
32B：表示模型有 320 亿个参数，通常是性能最强的版本，适合复杂的生成任务，但需要更多的计算资源。

模型选择

选择哪个模型通常取决于以下几个因素：

计算资源：更大的模型需要更多的内存和计算能力。如果您的硬件资源有限，可能需要选择较小的模型。
任务需求：如果您需要高质量的文本生成或复杂的对话系统，可能需要选择更大的模型。
响应时间：较大的模型可能会导致更长的响应时间，尤其是在实时应用中。

以上就是快速搭建的demo,如果对deepseek 感兴趣，可以自建一个进行下测试。
【高性能应用服务 HAI 快速使用 Deepseek-R1 模型-实践教程-文档中心-腾讯云】 https://cloud.tencent.com/document/product/1721/115966?from=copy

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。