deepseek学习笔记

原计划是基于BERT或者GPT做一些自然语言处理的应用研究,deepseek出来之后,决定使用deepseek来做,相信能够获得更好的效果。

1、deepseek的论文

deepseek的论文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》于2025年1月下旬同步发布在了github和arxiv上。

github地址:https://github.com/deepseek-ai/DeepSeek-R1

arxiv地址:https://arxiv.org/abs/2501.12948

2、deepseek的版本及开源情况

根据论文摘要,deepseek总共开源了deepseek-R1-Zero、DeepSeek-R1,以及6个基于Qwen和LLaMA从DeepSeek-R1中知识蒸馏得到的小模型。

这些模型在HuggingFace上的下载地址

deepseek-ai (DeepSeek)

### 如何在Linux系统上进行DeepSeek笔记本的本地部署 #### 准备工作 为了成功完成DeepSeek R1在Linux环境下的本地部署,需先确认已安装必要的依赖项和工具。这通常包括Python及其开发库、pip包管理器以及其他可能由具体项目需求决定的支持软件。 #### 安装Docker 由于许多机器学习框架和服务都推荐使用容器化解决方案来简化配置过程并提高兼容性和稳定性,因此建议采用Docker作为运行环境的基础平台之一[^2]。对于Linux用户来说,可以通过官方文档指导轻松安装适合各自发行版版本的Docker引擎。 #### 获取DeepSeek镜像 一旦有了可用的Docker环境之后,下一步就是拉取包含预训练模型及相关组件在内的DeepSeek Docker镜像文件。此操作可通过执行`docker pull deepseekai/deepseek:r1-latest`命令实现,其中标签部分指定了特定于R1版本的信息[^1]。 #### 启动服务 拥有正确的镜像后,便可以利用如下所示的指令启动相应的容器实例: ```bash docker run -d \ --name=deepseek-notebook \ -p 8888:8888 \ -v /path/to/local/data:/workspace \ deepseekai/deepseek:r1-latest jupyter notebook --ip='0.0.0.0' --port=8888 --allow-root ``` 上述脚本中的参数解释: - `-d`: 表示以后台模式运行容器; - `--name`: 设置容器名称为`deepseek-notebook`; - `-p`: 将主机端口映射至容器内部的服务监听地址,默认情况下Jupyter Notebook会占用8888号TCP连接; - `-v`: 创建卷挂载点以便持久保存数据资料,此处假设外部路径位于`/path/to/local/data`目录下而目标位置则指向了容器内的`/workspace`区域; - 最后的几个选项用于指定启动时传递给Notebook进程的具体参数集合,确保其能够在适当条件下正常运作。 #### 访问Web界面 当一切准备就绪之后,打开浏览器并通过输入形如`http://localhost:8888`这样的URL即可进入交互式的编程环境中去探索更多有关AI的知识点了!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值