部署deepseek - r1 模型 14b 32b 70b -- 客户端集成AI生成报告(一)

众所周知,deepseek火了一个月了

自己毕设开发的python客户端中,也要集成LLM

因此,需要先部署deepseek - r1 免费 高效


#### LLM模型选择

deepseek r1 - 14b 32b 70b 均集成。默认32b。平衡性能和效果。

#### 本地部署

参考来源:

[DeepSeek 本地化部署(保姆喂饭级教程) - 知乎 (zhihu.com)](https://zhuanlan.zhihu.com/p/21030210489)

[自定义Ollama安装路径 - 不愿透露姓名的菜鸟 - 博客园 (cnblogs.com)](https://www.cnblogs.com/LaiYun/p/18696931)

1. 下载Ollama

用来快速部署LLM模型

[Download Ollama on Windows](https://ollama.com/download) Ollama

2. 自定义 Ollama安装路径【否则可能自动安装到C盘】

  如在【D:\Software\Artificial Intelligence\Ollama】

  则运行【 OllamaSetup.exe /DIR=D:\Software\Artificial Intelligence\Ollama】

   运行命令安装

### 不同版本的 DeepSeek-R1 模型参数量差异与性能对比 #### 参数规模概述 DeepSeek-R1 系列模型提供了多种不同的参数规模,具体包括 1.5B、7B、8B、14B、32B 和 70B 版本。这些不同大小的模型旨在满足多样化的需求,从小型应用到大型复杂任务均有覆盖[^1]。 #### 性能特点分析 - **小型化高效模型** 对于资源受限环境下的应用场景而言,较小尺寸如 1.5B 或者 7B 的模型能够提供较为理想的效率与效果平衡。这类轻量化设计使得它们可以在较低配置硬件上运行良好,同时保持不错的推理质量。 - **中等规模优化模型** 当涉及到更复杂的自然语言处理任务时,像 8B 及 14B 这样的中间规格则显示出更好的适应性和准确性提升。特别是在特定领域内的专业知识理解方面有着更为出色的表现。 - **高性能旗舰型号** 而对于追求极致性能的研究人员来说,则可以选择更大容量比如 32B 或者最高达 70B 参数级别的顶级配置。此类超大体量网络结构不仅具备更强的数据拟合能力,在多项权威评测指标上的得分也名列前茅,甚至超过了某些知名竞争对手的产品线,例如 OpenAI-o1-mini。 值得注意的是,虽然存在提及 671B 参数量的信息,但在当前提供的参考资料里并没有关于此特别巨大体积的具体描述或验证记录。因此可以推测这可能是误传或者是未来计划中的开发目标之而非现有产品序列的部分。 ```python # Python 示例代码用于展示如何加载不同参数量的预训练模型 from transformers import AutoModelForCausalLM, AutoTokenizer model_names = [ "deepseek-r1-1.5b", "deepseek-r1-7b", "deepseek-r1-8b", "deepseek-r1-14b", "deepseek-r1-32b", "deepseek-r1-70b" ] for name in model_names: tokenizer = AutoTokenizer.from_pretrained(name) model = AutoModelForCausalLM.from_pretrained(name) input_text = "Once upon a time," inputs = tokenizer(input_text, return_tensors="pt") outputs = model.generate(**inputs, max_length=50) generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True) print(f"\nGenerated text by {name}:") print(generated_text) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值