Deepseek-R1
1. 简介
DeepSeek-R1 是由 DeepSeek 团队重磅打造的一款极具突破性的高性能推理模型,在推理领域展现出了卓越的领先优势。与传统模型不同,它无需进行预先的监督微调,大大简化了模型的使用流程,降低了时间和资源成本。
该模型基于大规模强化学习训练,具备强大的探索能力,能够在复杂问题中挖掘链式思维,实现对问题的深度剖析和有效解决。值得一提的是,DeepSeek-R1 还展现出了自我验证、反思以及生成长链思维等高阶能力。通过自我验证,它能够确保推理结果的准确性和可靠性;反思能力则使其不断优化推理过程,持续提升性能;而生成长链思维的能力,让它在面对复杂任务时,能够层层递进、抽丝剥茧,给出全面且深入的解决方案。这种独特的技术路径,与 OpenAI o1 可谓是异曲同工,代表了推理模型技术发展的前沿方向,为众多领域的复杂问题求解提供了全新的、高效的解决方案。
推理模型是人工智能领域里专门处理复杂推理任务的模型。它的核心优势在于,面对问题时能像人类一样深入思考、逻辑推导,找到最佳解题路径。
OpenAI o1 开启了推理模型发展的新阶段,让这一概念更加明确。o1 是 OpenAI 推出的复杂推理大模型,回答问题前会进行 “思考”,思考时间越长,推理质量越高。该模型运用强化学习,将思维链内化后持续训练,大幅提升了推理能力。
2. 特点
-
强大的推理能力 :DeepSeek-R1 在多个推理任务上表现出色,如在 AIME 2024 上获得 79.8% 的 pass@1 得分,略微超过 OpenAI-o1-1217。在 MATH-500 上,它获得了 97.3% 的得分,与 OpenAI-o1-1217 的性能相当,并且显著优于其他模型。
-
思维链和深度思考 :DeepSeek-R1 在训练过程中特别强调思维链推理,这使得模型能够将问题分解为更小、更易于管理的步骤,从而在数学、编码和逻辑推理等领域表现出色。模型通过 GRPO(Group Relative Policy Optimization)算法来评估自己的表现,逐步涌现长推理链能力,甚至能自我修正错误步骤,类似于 OpenAI o1 的内化思维链学习方式。
-
多阶段训练 :DeepSeek-R1 的训练过程包括多个阶段,从基础模型到监督微调(SFT),再到用于推理的强化学习,最后通过拒绝采样和监督微调扩展模型的能力。这种多阶段训练方法提高了模型的推理性能和通用性,与 OpenAI o1 的训练方式有相似之处。
-
冷启动数据 :在训练过程中,DeepSeek-R1 使用了冷启动数据,通过 R1-zero 模型和人工注释生成长达 10,000 个标记的推理补全(CoT)数据,提高了模型输出的可读性、连贯性和逻辑流畅性。
-
语言一致性 :DeepSeek-R1 引入了语言一致性奖励,鼓励模型在整个输出中保持相同的语言风格,解决了“语言混搭”问题。
3. 应用场景
数学领域:精准破题,超越同行
在数学问题处理上,DeepSeek-R1 能力出众。以 AIME 2024 数学竞赛为例,它取得了 79.8% 的 pass@1 得分,这一成绩略微超过 OpenAI-o1-1217。无论是复杂的数学竞赛题目,还是数学建模等科研难题,DeepSeek-R1 都能轻松应对,为科研工作者攻克数学难关提供了有力支持,同时也为数学教育提供了新思路和方法。
代码生成:高效创作,超越人类
代码生成是 DeepSeek-R1 的又一专长领域。在 Codeforces 平台上,它获得了 2029 的 Elo 评级,超过了 96.3% 的人类参与者。开发者利用 DeepSeek-R1,能快速生成代码片段,高效解决编程问题,极大地提高了编程效率,是软件开发和算法设计不可或缺的得力工具。
逻辑推理:深度分析,可靠输出
面对逻辑推理任务,DeepSeek-R1 同样表现亮眼。在 FRAMES 这种长上下文依赖的 QA 任务中,它展现出强大的文档分析能力,能够准确回答各类逻辑推理问题,无论是事实问答,还是复杂的逻辑推导,都不在话下。这使其成为人工智能驱动的搜索和数据分析任务的可靠解决方案,为相关领域的高效运作提供了保障。
自然语言处理:理解深入,创作优质
在自然语言处理方面,DeepSeek-R1 同样表现卓越。在 C-Eval 中文基础模型评估套件中,它的准确率达到 85.00%,尤其在中文语言理解能力上表现突出。基于此,它能够生成高质量的文本内容,无论是商业计划书、新闻报道,还是故事创作,DeepSeek-R1 都能轻松驾驭,为内容创作和文本生成提供了强大支持。
个人电脑快速部署Deepseek-R1
DeepSeek-R1 有 1.5B、7B、8B、14B、32B、70B、671B 参数规模的模型,根据个人电脑配置,一般建议不要部署超过 14B 的模型。
Windows版ollama
到 Ollama 官网,进行下载按照按照即可
通过 Ollama 部署 DeepSeek-R1
以 deepseek-R1:1.5b
为例:
打开cmd,运行以下命令
-
下载模型:
ollama pull deepseek-r1:1.5b
-
启动运行:(可以直接用run命令启动,会检测本地地方已经缓存了模型,如果没有,会自动下载)
ollama run deepseek-r1:1.5b
模型运行后后,Ollama 会提供对应的 API 服务,可以通过 API 的方式进行调用,也可以直接输入进行对话,详细信息请参考官方说明文档:
-
KEY: ollama
tips:如果快下载完,速度变慢了,可以ctrl+c终止,再重新执行一下就会变快
-
下面是官方的 Python 的调用示例:
from openai import OpenAI
client = OpenAI(
base_url='http://localhost:11434/v1/',
# required but ignored
api_key='ollama',
)
chat_completion = client.chat.completions.create(
messages=[
{
'role': 'user',
'content': 'Say this is a test',
}
],
model='llama3.2',
)
response = client.chat.completions.create(
model="llava",
messages=[
{
"role": "user",
"content": [
{"type": "text", "text": "What's in this image?"},
{
"type": "image_url",
"image_url": "data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAG0AAABmCAYAAADBPx+VAAAACXBIWXMAAAsTAAALEwEAmpwYAAAAAXNSR0IArs4c6QAAAARnQU1BAACxjwv8YQUAAA3VSURBVHgB7Z27r0zdG8fX743i1bi1ikMoFMQloXRpKFFIqI7LH4BEQ+NWIkjQuSWCRIEoULk0gsK1kCBI0IhrQVT7tz/7zZo888yz1r7MnDl7z5xvsjkzs2fP3uu71nNfa7lkAsm7d++Sffv2JbNmzUqcc8m0adOSzZs3Z+/XES4ZckAWJEGWPiCxjsQNLWmQsWjRIpMseaxcuTKpG/7HP27I8P79e7dq1ars/yL4/v27S0ejqwv+cUOGEGGpKHR37tzJCEpHV9tnT58+dXXCJDdECBE2Ojrqjh071hpNECjx4cMHVycM1Uhbv359B2F79+51586daxN/+pyRkRFXKyRDAqxEp4yMlDDzXG1NPnnyJKkThoK0VFd1ELZu3TrzXKxKfW7dMBQ6bcuWLW2v0VlHjx41z717927ba22U9APcw7Nnz1oGEPeL3m3p2mTAYYnFmMOMXybPPXv2bNIPpFZr1NHn4HMw0KRBjg9NuRw95s8PEcz/6DZELQd/09C9QGq5RsmSRybqkwHGjh07OsJSsYYm3ijPpyHzoiacg35MLdDSIS/O1yM778jOTwYUkKNHWUzUWaOsylE00MyI0fcnOwIdjvtNdW/HZwNLGg+sR1kMepSNJXmIwxBZiG8tDTpEZzKg0GItNsosY8USkxDhD0Rinuiko2gfL/RbiD2LZAjU9zKQJj8RDR0vJBR1/Phx9+PHj9Z7REF4nTZkxzX4LCXHrV271qXkBAPGfP/atWvu/PnzHe4C97F48eIsRLZ9+3a3f/9+87dwP1JxaF7/3r17ba+5l4EcaVo0lj3SBq5kGTJSQmLWMjgYNei2GPT1MuMqGTDEFHzeQSP2wi/jGnkmPJ/nhccs44jvDAxpVcxnq0F6eT8h4ni/iIWpR5lPyA6ETkNXoSukvpJAD3AsXLiwpZs49+fPn5ke4j10TqYvegSfn0OnafC+Tv9ooA/JPkgQysqQNBzagXY55nO/oa1F7qvIPWkRL12WRpMWUvpVDYmxAPehxWSe8ZEXL20sadYIozfmNch4QJPAfeJgW3rNsnzphBKNJM2KKODo1rVOMRYik5ETy3ix4qWNI81qAAirizgMIc+yhTytx0JWZuNI03qsrgWlGtwjoS9XwgUhWGyhUaRZZQNNIEwCiXD16tXcAHUs79co0vSD8rrJCIW98pzvxpAWyyo3HYwqS0+H0BjStClcZJT5coMm6D2LOF8TolGJtK9fvyZpyiC5ePFi9nc/oJU4eiEP0jVoAnHa9wyJycITMP78+eMeP37sXrx44d6+fdt6f82aNdkx1pg9e3Zb5W+RSRE+n+VjksQWifvVaTKFhn5O8my63K8Qabdv33b379/PiAP//vuvW7BggZszZ072/+TJk91YgkafPn166zXB1rQHFvouAWHq9z3SEevSUerqCn2/dDCeta2jxYbr69evk4MHDyY7d+7MjhMnTiTPnz9Pfv/+nfQT2ggpO2dMF8cghuoM7Ygj5iWCqRlGFml0QC/ftGmTmzt3rmsaKDsgBSPh0/8yPeLLBihLkOKJc0jp8H8vUzcxIA1k6QJ/c78tWEyj5P3o4u9+jywNPdJi5rAH9x0KHcl4Hg570eQp3+vHXGyrmEeigzQsQsjavXt38ujRo44LQuDDhw+TW7duRS1HGgMxhNXHgflaNTOsHyKvHK5Ijo2jbFjJBQK9YwFd6RVMzfgRBmEfP37suBBm/p49e1qjEP2mwTViNRo0VJWH1deMXcNK08uUjVUu7s/zRaL+oLNxz1bpANco4npUgX4G2eFbpDFyQoQxojBCpEGSytmOH8qrH5Q9vuzD6ofQylkCUmh8DBAr+q8JCyVNtWQIidKQE9wNtLSQnS4jDSsxNHogzFuQBw4cyM61UKVsjfr3ooBkPSqqQHesUPWVtzi9/vQi1T+rJj7WiTz4Pt/l3LxUkr5P2VYZaZ4URpsE+st/dujQoaBBYokbrz/8TJNQYLSonrPS9kUaSkPeZyj1AWSj+d+VBoy1pIWVNed8P0Ll/ee5HdGRhrHhR5GGN0r4LGZBaj8oFDJitBTJzIZgFcmU0Y8ytWMZMzJOaXUSrUs5RxKnrxmbb5YXO9VGUhtpXldhEUogFr3IzIsvlpmdosVcGVGXFWp2oU9kLFL3dEkSz6NHEY1sjSRdIuDFWEhd8KxFqsRi1uM/nz9/zpxnwlESONdg6dKlbsaMGS4EHFHtjFIDHwKOo46l4TxSuxgDzi+rE2jg+BaFruOX4HXa0Nnf1lwAPufZeF8/r6zD97WK2qFnGjBxTw5qNGPxT+5T/r7/7RawFC3j4vTp09koCxkeHjqbHJqArmH5UrFKKksnxrK7FuRIs8STfBZv+luugXZ2pR/pP9Ois4z+TiMzUUkUjD0iEi1fzX8GmXyuxUBRcaUfykV0YZnlJGKQpOiGB76x5GeWkWWJc3mOrK6S7xdND+W5N6XyaRgtWJFe13GkaZnKOsYqGdOVVVbGupsyA/l7emTLHi7vwTdirNEt0qxnzAvBFcnQF16xh/TMpUuXHDowhlA9vQVraQhkudRdzOnK+04ZSP3DUhVSP61YsaLtd/ks7ZgtPcXqPqEafHkdqa84X6aCeL7YWlv6edGFHb+ZFICPlljHhg0bKuk0CSvVznWsotRu433alNdFrqG45ejoaPCaUkWERpLXjzFL2Rpllp7PJU2a/v7Ab8N05/9t27Z16KUqoFGsxnI9EosS2niSYg9SpU6B4JgTrvVW1flt1sT+0ADIJU2maXzcUTraGCRaL1Wp9rUMk16PMom8QhruxzvZIegJjFU7LLCePfS8uaQdPny4jTTL0dbee5mYokQsXTIWNY46kuMbnt8Kmec+LGWtOVIl9cT1rCB0V8WqkjAsRwta93TbwNYoGKsUSChN44lgBNCoHLHzquYKrU6qZ8lolCIN0Rh6cP0Q3U6I6IXILYOQI513hJaSKAorFpuHXJNfVlpRtmYBk1Su1obZr5dnKAO+L10Hrj3WZW+E3qh6IszE37F6EB+68mGpvKm4eb9bFrlzrok7fvr0Kfv727dvWRmdVTJHw0qiiCUSZ6wCK+7XL/AcsgNyL74DQQ730sv78Su7+t/A36MdY0sW5o40ahslXr58aZ5HtZB8GH64m9EmMZ7FpYw4T6QnrZfgenrhFxaSiSGXtPnz57e9TkNZLvTjeqhr734CNtrK41L40sUQckmj1lGKQ0rC37x544r8eNXRpnVE3ZZY7zXo8NomiO0ZUCj2uHz58rbXoZ6gc0uA+F6ZeKS/jhRDUq8MKrTho9fEkihMmhxtBI1DxKFY9XLpVcSkfoi8JGnToZO5sU5aiDQIW716ddt7ZLYtMQlhECdBGXZZMWldY5BHm5xgAroWj4C0hbYkSc/jBmggIrXJWlZM6pSETsEPGqZOndr2uuuR5rF169a2HoHPdurUKZM4CO1WTPqaDaAd+GFGKdIQkxAn9RuEWcTRyN2KSUgiSgF5aWzPTeA/lN5rZubMmR2bE4SIC4nJoltgAV/dVefZm72AtctUCJU2CMJ327hxY9t7EHbkyJFseq+EJSY16RPo3Dkq1kkr7+q0bNmyDuLQcZBEPYmHVdOBiJyIlrRDq41YPWfXOxUysi5fvtyaj+2BpcnsUV/oSoEMOk2CQGlr4ckhBwaetBhjCwH0ZHtJROPJkyc7UjcYLDjmrH7ADTEBXFfOYmB0k9oYBOjJ8b4aOYSe7QkKcYhFlq3QYLQhSidNmtS2RATwy8YOM3EQJsUjKiaWZ+vZToUQgzhkHXudb/PW5YMHD9yZM2faPsMwoc7RciYJXbGuBqJ1UIGKKLv915jsvgtJxCZDubdXr165mzdvtr1Hz5LONA8jrUwKPqsmVesKa49S3Q4WxmRPUEYdTjgiUcfUwLx589ySJUva3oMkP6IYddq6HMS4o55xBJBUeRjzfa4Zdeg56QZ43LhxoyPo7Lf1kNt7oO8wWAbNwaYjIv5lhyS7kRf96dvm5Jah8vfvX3flyhX35cuX6HfzFHOToS1H4BenCaHvO8pr8iDuwoUL7tevX+b5ZdbBair0xkFIlFDlW4ZknEClsp/TzXyAKVOmmHWFVSbDNw1l1+4f90U6IY/q4V27dpnE9bJ+v87QEydjqx/UamVVPRG+mwkNTYN+9tjkwzEx+atCm/X9WvWtDtAb68Wy9LXa1UmvCDDIpPkyOQ5ZwSzJ4jMrvFcr0rSjOUh+GcT4LSg5ugkW1Io0/SCDQBojh0hPlaJdah+tkVYrnTZowP8iq1F1TgMBBauufyB33x1v+NWFYmT5KmppgHC+NkAgbmRkpD3yn9QIseXymoTQFGQmIOKTxiZIWpvAatenVqRVXf2nTrAWMsPnKrMZHz6bJq5jvce6QK8J1cQNgKxlJapMPdZSR64/UivS9NztpkVEdKcrs5alhhWP9NeqlfWopzhZScI6QxseegZRGeg5a8C3Re1Mfl1ScP36ddcUaMuv24iOJtz7sbUjTS4qBvKmstYJoUauiuD3k5qhyr7QdUHMeCgLa1Ear9NquemdXgmum4fvJ6w1lqsuDhNrg1qSpleJK7K3TF0Q2jSd94uSZ60kK1e3qyVpQK6PVWXp2/FC3mp6jBhKKOiY2h3gtUV64TWM6wDETRPLDfSakXmH3w8g9Jlug8ZtTt4kVF0kLUYYmCCtD/DrQ5YhMGbA9L3ucdjh0y8kOHW5gU/VEEmJTcL4Pz/f7mgoAbYkAAAAAElFTkSuQmCC",
},
],
}
],
max_tokens=300,
)
completion = client.completions.create(
model="llama3.2",
prompt="Say this is a test",
)
list_completion = client.models.list()
model = client.models.retrieve("llama3.2")
embeddings = client.embeddings.create(
model="all-minilm",
input=["why is the sky blue?", "why is the grass green?"],
)