或许是全网最全的 DeepSeek 解析：背景故事、实用技巧与白嫖攻略

码农界赵子龙

已于 2025-02-07 11:40:24 修改

阅读量775

点赞数 4

分类专栏： AI 文章标签：人工智能

于 2025-02-07 11:31:28 首次发布

本文链接：https://blog.youkuaiyun.com/wind1_rain/article/details/145490105

版权

AI 专栏收录该内容

4 篇文章

订阅专栏

或许是全网最全的 DeepSeek 解析：背景故事、实用技巧与白嫖攻略

DeepSeek 宕机了？？？

https://chat.deepseek.com/503/

在这里插入图片描述

这个到底是个什么？这么火爆？

一、春节期间，科技圈最耀眼的“顶流” 非 DeepSeek 莫属！

作为国产 AI 领域的后起之秀，DeepSeek 近期凭借其强大的开源大模型 DeepSeek-V2，成功吸引了大量关注。不仅技术上大幅提升，还在各大社交平台上引发热议，让无数 AI 爱好者纷纷体验、讨论，甚至有人调侃：“春节最忙的不是春运，而是DeepSeek的服务器！”

在 OpenAI、谷歌、Anthropic 等巨头环伺下，DeepSeek 的快速崛起让人期待，它能否成为国产 AI 的“最强黑马”？

二、简单介绍一下：

DeepSeek 是由杭州深度求索人工智能基础技术研究有限公司开发的一款大型语言模型（LLM），其核心功能包括自然语言处理（NLP）、计算机视觉（CV）、强化学习（RL）和多模态融合技术。这款模型旨在通过理解用户意图、上下文和多模态数据，提供高效、精准和个性化的搜索结果及服务，广泛应用于电商、医疗、教育等多个领域。

模型特点与性能

多模态能力：DeepSeek 融合了文本、图像和视频等多种模态数据，利用深度学习模型如BERT和GPT进行语义理解与意图识别，从而实现更全面的智能搜索。
开源策略：DeepSeek 的所有模型均开源，包括通用大语言模型 DeepSeek LLM、MoE 模型 DeepSeek MoE、代码模型 DeepSeek Coder 等。这种开源策略不仅降低了技术门槛，还推动了AI生态系统的普惠发展。
性价比优势：DeepSeek-V2 的性价比极高，其训练成本仅为 GPT-4 的 1/20，推理效率显著提升，使其在长文本处理和复杂任务中表现出色。
推理能力：DeepSeek 推出了 R1 模型，专注于解决复杂问题，如数学和代码推理。该模型通过强化学习训练，能够提供全面、清晰的解答。

应用场景

电商推荐：通过整合图像和文本信息，DeepSeek 在电商领域提供精准的商品推荐。
医疗知识图谱：在医疗领域，DeepSeek 可以辅助医生进行疾病诊断和治疗方案制定。
教育支持：为学生提供个性化学习资源推荐，帮助解决学习中的难题。

技术创新

混合专家架构（MoE） ：DeepSeek-V3 采用了创新的 MoE 架构，拥有 6710 亿参数，激活参数为 370 亿，显著提高了模型效率和准确性。
分布式计算框架：通过分布式计算框架压缩模型大小，同时保持高效性能。
API 接口优化：DeepSeek 提供了兼容 OpenAI API 的接口，用户可以轻松接入并使用其功能。

市场表现与影响

市场地位：DeepSeek 在苹果应用商店中超越了 OpenAI 的 ChatGPT，成为美国区免费应用下载排行榜的冠军。
行业震动：DeepSeek 的低成本高性能模式打破了美国科技巨头对 AI 市场的垄断地位，引发国内外产业圈和投资圈的关注。
国际认可：印度总理盛赞 DeepSeek 模型，认为其引领了科技新潮流。

总结

DeepSeek 是一款具有强大性能和广泛应用潜力的 AI 模型。其开源策略、性价比优势以及多模态融合能力使其在全球范围内受到广泛关注。未来，DeepSeek 将继续深化技术迭代，推动 AI 应用生态的发展，并在更多领域展现其价值。

三、怎么使用呢？

目前 DeepSeek 提供了如下使用方式：

网页版：打开 https://chat.deepseek.com/ 直接使用。
App：手机扫码下载。

默认情况下，DeepSeek 使用的是 V3 模型，点击深度思考才会切换为 R1 模型，即现在让“硅谷震惊”的模型。

深度思考旁边还有个联网搜索，默认情况下 DeepSeek 使用的是好几个月前的训练数据，如果我们想参考最新的新闻，则点击联网搜索让 DeepSeek R1 基于最新的网络数据来优化回答。

DeepSeek 的服务状态检测地址：

https://status.deepseek.com

在这里插入图片描述

四、整理的一些使用技巧

一、万能提问模板：背景 + 需求 + 约束条件

背景：说明你是谁、当前水平或具体情境。
- 例如：“我是一个互联网打工人，刚接触自媒体，对运营一窍不通。”
需求：清晰表达你希望解决的问题或实现的目标。
- 例如：“我想学习如何从0到1运营一个自媒体账号。”
约束条件：添加限制或优化条件，让回答更精准。
- 例如：“请以自媒体运营专家的身份，用通俗易懂的语言，提供适合新手的实操步骤。”

示例提问：

背景：我是一个互联网打工人，刚接触自媒体，对运营一窍不通。
需求：我想学习如何从0到1运营一个自媒体账号。
约束条件：请以自媒体运营专家的身份，用通俗易懂的语言，提供适合新手的实操步骤。

为什么这个模板好用？

背景：帮助 DeepSeek 理解你的身份和需求，提供更贴合实际的建议。
需求：明确目标，避免回答偏离主题。
约束条件：进一步优化回答内容，确保结果更精准、实用。

通过这个模板，你可以轻松获得更高质量、更个性化的回答！如：我家小孩4个月（交待背景），怎样锻炼他的抬头动作（提出需求），需要考虑安全问题（约束条件，可选）。

例子：

我家小孩4个月（交待背景），怎样锻炼他的抬头动作（提出需求），需要考虑安全问题（约束条件，可选）。

在这里插入图片描述

二、让 DeepSeek “说人话”

内容: 我是一个对互联网不了解的人，我想了解一下 deepseek。

优化前：

我是一个对互联网不了解的人，我想了解一下 deepseek
在这里插入图片描述

优化后：

我是一个对互联网不了解的人，我想了解一下 deepseek。说人话
在这里插入图片描述

三、组合模型法：

在复杂场景下，单一 AI 模型往往无法提供最佳效果。这时，可以将 DeepSeek R1 与 GPT-4o 或 Claude 3.5 Sonnet 结合使用。通常，我们可以先让 DeepSeek R1 解析问题，给出解决思路，再让更擅长生成的模型执行具体任务。

四、业务分析法：

在业务分析方面，DeepSeek R1 支持“联网搜索”，可实时获取信息，并能处理上传的附件进行精准分析。例如，想在小红书起号，可以先联网搜索对标账号，再让 DeepSeek R1 提供详细的起号流程。对于无法直接搜索的内容，可先下载资料并上传，由 DeepSeek R1 解析。

此外，DeepSeek R1 还能自动生成 mermaid 图表，帮助可视化流程，极大提升工作效率。

五、如何解决DeepSeek慢或者无法使用的场景？

1、本地部署：

由于DeepSeek是开源生态，模型都提供了，使用本地部署，然后利用一些第三方软件来接入模型使用。

但是遗憾的是，本地部署非常的依赖：自己的电脑性能

一方面，电脑的配置决定了你能运行的 AI 模型规模。像我用 4090 显卡的电脑，最多也只能跑 32B 的模型，再大的基本就跑不动了，又卡又慢。另一方面，你知道完整版模型可是 671B 的吗？个人电脑几乎不可能运行。如果你的设备配置不高，只能跑 7B 这种低参数模型，那效果肯定会大打折扣，体验感也不佳，基本就是个玩具级别的尝试。

2、其他方案

目前，国内除了DeepSeek官网之外提供满血版DeepSeek能力的有两家。

第一家：360的纳米AI搜索：

https://www.n.cn/

原本只提供32b的，后面上了满血的但是有限度。（使用的时候勾上这个慢思考模式就是了）
在这里插入图片描述

第二家：白嫖—硅基流动 SiliconCloud

提供了：大模型云服务平台 SiliconCloud 首发上线基于华为云昇腾云服务的 DeepSeek-V3、DeepSeek-R1。

为什么说是“白嫖”呢？因为在 SiliconCloud 通过邀请好友注册，双方都能获得 2000 万 Tokens（约 14 元的平台配额）。只需邀请家人朋友注册，就能轻松攒到 2000 万 Tokens，足够用很久。拿到密钥后，搭配支持 API 的第三方软件，就能直接使用满血版 DeepSeek。这才是大家应该掌握的省钱技巧！

接下来，我就手把手教你如何完成整个流程，免费体验完整体的 DeepSeek。

3.1 注册账号

登录一下网址，通过手机号注册个账号：

https://cloud.siliconflow.cn/i/5WC4oDo4
在这里插入图片描述