DeepSeek
一、人工智能模型
1.1 推理模型
- 推理大模型: 推理大模型是指能够在传统的大语言模型基础上,强化推理、逻辑分析和决策能力的模型。它们通常具备额外的技术,比如强化学习、神经符号推理、元学习等,来增强其推理和问题解决能力。例如:DeepSeek-R1,GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。
- 非推理大模型: 适用于大多数任务,非推理大模型一般侧重于语言生成、上下文理解和自然语言处理,而不强调深度推理能力。此类模型通常通过对大量文本数据的训练,掌握语言规律并能够生成合适的内容,但缺乏像推理模型那样复杂的推理和决策能力。例如:GPT-3、GPT-4(OpenAI),BERT(Google),主要用于语言生成、语言理解、文本分类、翻译等任务。
提示语策略差异
- 推理大模型:提示语更简洁,只需明确任务目标和需求(因其已内化推理逻辑)。无需逐步指导,模型自动生成结构化推理过程(若强行拆解步骤,反而可能限制其能力)。
- 通用模型:需显式引导推理步骤(如通过CoT提示),否则可能跳过关键逻辑。依赖提示语补偿能力短板(如要求分步思考、提供示例)。
1.2 大模型类型
CoT链式思维的出现将大模型分为了两类:“概率预测(快速反应)”模型和“链式推理(慢速思考)”模型。前者适合快速反馈,处理即时任务;后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合适的模型,实现最佳效果。
1.2 模型使用
- 模型选择:优先根据任务类型而非模型热度选择(如数学任务选推理模型,创意任务选通用模型)。
- 提示语设计:推理模型:简洁指令,聚焦目标,信任其内化能力。(“要什么直接说”)。通用模型:结构化、补偿性引导(“缺什么补什么”)。
- 避免误区:不要对推理模型使用“启发式”提示(如角色扮演),可能干扰其逻辑主线。不要对通用模型“过度信任”(如直接询问复杂推理问题,需分步验证结果)。
提示语
提示语(Prompt)是用户输入给AI系统的指令或信息,用于引导AI生成特定的输出或执行特定的任务。简单来说,提示语就是我们与AI“对话”时所使用的语言,它可以是一个简单的问题,一段详细的指令,也可以是一个复杂的任务描述。
提示语的基本结构包括指令、上下文和期望。
- 指令(Instruction):这是提示语的核心,明确告诉AI你希望它执行什么任务。
- 上下文(Context):为AI提供背景信息,帮助它更准确地理解和执行任务。
- 期望(Expectation):明确或隐含地表达你对AI输出的要求和预期。
提示语的类型:
- 指令型提示语:直接告诉AI需要执行的任务。
- 问答型提示语:向AI提出问题,期望得到相应的答案。
- 角色扮演型提示语:要求AI扮演特定角色,模拟特定场景。
- 创意型提示语:引导AI进行创意写作或内容生成。
- 分析型提示语:要求AI对给定信息进行分析和推理。
- 多模态提示语:结合文本、图像等多种形式的输入。
提示语策略
- 挖掘反向思维:从非传统角度切入
创新设计策略:
▪ 设定逆向任务:提示语可以引导AI从相反的角度处理问题,提供不同于传统生成的内容。
▪ 挑战预设思维模式:通过打破任务的常规设定,促使AI生成具有挑战性和创新性的内容。 - 灵活运用任务开放性:给AI自由发挥的空间
创新设计策略:
▪ 设定基本框架,留出探索余地:提示语应提供一个结构化的框架,包含具体的生成目标,但不应过度限制表达方式或细节内容,给AI足够的空间进行创造。
▪ 多维度任务引导:通过引导AI从多个角度看待问题,激发其对生成内容的多样化思考。
提示语常见陷阱
-
缺乏迭代陷阱:期待一次性完美结果
-
过度指令和模糊指令陷阱:当细节淹没重点或意图不明确
-
假设偏见陷阱:当AI只告诉你想听的
陷阱症状:
▪ 提示语中包含明显立场或倾向
▪ 获得的信息总是支持特定观点
▪ 缺乏对立或不同观点的呈现
应对策略:
▪ 自我审视:在设计提示语时,反思自己可能存在的偏见。
▪ 使用中立语言:避免在提示语中包含偏见或预设立场。
▪ 要求多角度分析:明确要求AI提供不同的观点或论据。
▪ 批判性思考:对AI的输出保持警惕,交叉验证重要信息。 -
幻觉生成陷阱:当AI自信地胡说八道
陷阱症状:
▪ AI提供的具体数据或事实无法验证
▪ 输出中包含看似专业但实际上不存在的术语或概念
▪ 对未来或不确定事件做出过于具体的预测
应对策略:
▪ 明确不确定性:鼓励AI在不确定时明确说明。
▪ 事实核查提示:要求AI区分已知事实和推测。
▪ 多源验证:要求AI从多个角度或来源验证信息。
▪ 要求引用:明确要求AI提供信息来源,便于验证。 -
忽视伦理边界陷阱:低估AI的伦理限制
提示语示例
- 决策需求
- 分析需求
- 创造性需求
- 验证性需求
- 执行需求
提示语链
在提示语设计中,提示语链发挥着至关重要的作用,通过系统性地引导AI生成高质量、创新性的内容。以下是提示语链在内容生成过程中的七个主要作用机制:
- 任务分解与整合
- 将这个复杂的主题分解为几个主要部分,逐一讨论每个部分。
- 对每个子任务设定具体目标和预期成果。
- 在每个子任务完成后,总结其关键点并与整体主题关联。
- 通过层次结构图或思维导图展示分解后的各部分及其关系。
- 结合各部分的结果,撰写一段总结性内容,确保整体连贯。
- 知识激活与联想
- 列出与[主题]相关的所有关键知识点,逐一进行详细解释。
- 从不同领域中寻找与[问题]相关的知识点,并进行创造性联想。
- 通过比喻或类比,将[复杂概念]与日常经验联系起来,便于理解。
- 使用头脑风暴技术,生成多个可能的联想和创新点。
- 将联想到的新观点或概念,整合进现有的知识体系中。
- 思维框架构建
- 明确这个问题的核心要点,然后系统地收集相关信息进行分析。
- 列出与主题相关的所有关键概念和理论,并进行系统梳理。
- 使用逻辑框架图展示信息收集、分析和结论的过程。
- 针对每个关键概念,撰写简要解释并说明其在文章中的作用。
- 通过案例分析或实例应用,验证思维框架的有效性和适用性。
- 创意引导与拓展
- 请从一个全新的角度重新思考[问题/主题],并提出与众不同的见解。
- 请将其他领域中与此不相关的概念结合起来,探索其在[主题]上的应用。
- 请设定一个全新的情境,讨论在此情境下[问题/主题]会有怎样的发展。
- 请挑战现有的常规观点,从反面角度思考[问题/主题],并提出新的可能性。
- 请结合不同学科的理论,提出一个创新的解决方案。
- 请从结果出发,倒推可能的原因和过程,探索新的解决途径。
- 质量控制与优化
- 反馈整合与动态调整
- 多模态信息处理
二、DeepSeek简介
2.1 DeepSeek
DeepSeek是一家专注通用人工智能的中国科级公司,主攻大模型研发与应用。DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费使用。
DeepSeek直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。
2.2 DeepSeek功能
文本生成
- 文本创作:文章/故事/诗歌写作;营销文案、广告语生成;社交媒体内容(如推文、帖子);剧本或对话设计
- 摘要与改写:长文本摘要(论文、报告);文本简化(降低复杂度);多语言翻译与本地化
- 结构化生成:表格、列表生成(如日程安排、菜谱);代码注释、文档撰写
自然语言理解与分析
- 语义分析:语义解析;情感分析(评论、反馈);意图识别(客服对话、用户查询);实体提取(人名、地点、事件)
- 文本分类:文本分类;主题标签生成(如新闻分类);垃圾内容检测
- 知识推理:知识推理;逻辑问题解答(数学、常识推理);因果分析(事件关联性)
编程与代码相关
- 代码生成:根据需求生成代码片段(Python、JavaScript );自动补全与注释生成
- 代码调试:错误分析与修复建议;代码性能优化提示
- 技术文档处理:API文档生成;代码库解释与示例生成
常规绘图
三、如何使用DeepSeek
DeepSeek网页版
在PC 上本地运行DeepSeek-R1 模型
3.1 基础对话
有效对话的五个基本原则:
- 明确需求:「我需要一封求职邮件,应聘新媒体运营岗位,强调3年公众号运营经验」
- 提供背景:这是一家奶茶店过去三个月的销售数据,请分析周末和工作日的销量差异
- 指定格式:「请用表格形式列出三种情人节咖啡店促销方案,包含成本预估和预期效果」
- 控制长度:「请用200字以内解释区块链技术,让完全不懂技术的老人能听懂」
- 及时纠正:当回答不满意时,可以:◦ 「这个方案成本太高,请提供预算控制在500元以内的版本」「请用更正式的语气重写第二段」
3.2 基础指令
- /续写 :当回答中断时自动继续生成
- /简化 :将复杂内容转换成大白话
- /示例 :要求展示实际案例(特别是写代码时)
- /步骤 :让AI分步骤指导操作流程
- /检查 :帮你发现文档中的错误
3.3 功能
文档分析
点击「回形针」图标上传文件(支持PDF/Word/TXT)。可实现功能:总结文档要点;提取数据;对比多个文档的差异。
- 超过50页的文档建议先拆分处理
- 扫描版PDF需确保文字可复制
写代码
模版:
【语言】Python
【功能】自动下载网页图片
【要求】
- 处理SSL证书错误
- 显示下载进度条
- 保存到指定文件夹
执行策略:
- 先让AI生成代码
- 要求添加注释说明
- 请求逐行解释关键代码段
- 遇到报错直接粘贴错误信息
查重降重一体化
分析以下段落:[粘贴文本]
1. 预测查重率及高危片段(标红显示)
2. 识别潜在引用缺失(推荐3篇相关文献)
3. 给出改写建议(同义替换/结构调整)
期刊匹配引擎
基于我的研究:
- 领域:人工智能辅助教育
- 创新点:动态知识点图谱构建
- 数据量:10万+用户样本
推荐:
1. 3个冲刺期刊(IF 3-5)
2. 2个保底期刊(录用率>40%)
3. 1个新兴开源期刊(APC免费)
要求:
- 附最新影响因子和审稿周期
- 标注格式要求差异(参考文献/图表规范)