- 博客(165)
- 收藏
- 关注
原创 AI大模型如何破局传统医疗|浙江大学|DeepSeek系列公开课|第二季
什么是DeepSeek?介绍了DeepSeek作为开源大模型的技术背景与发展历程,包括其参数规模(十亿级以上)、基于Transformer架构的特点,以及与GPT、LLaMA等模型的对比。阐述了DeepSeek在算力投入、开源生态、国产化替代等方面的优势,并提到其在医疗场景中的应用潜力。强调DeepSeek通过“系统2”式深度推理能力(如临床病例分析)弥补传统大模型的不足,推动医疗智能化发展。如何破局智慧医疗?技术层面。
2025-04-03 07:23:18
272
原创 哈尔滨工业大学|人工智能:从图灵测试到DeepSeek|82页
第一部分:人工智能的概念从智能的定义出发,引用尼尔逊和爱因斯坦的观点,阐述智能涵盖感知、推理、学习等能力。随后定义人工智能(AI)为模拟人类思维与认知的学科,并列举生活中的应用实例,如扫地机器人、无人驾驶等。同时回顾AI发展史,包括1956年达特茅斯会议的起源、四次技术热潮(如深度学习兴起、ChatGPT发布),以及弱人工智能(如专用系统)、强人工智能(通用智能)和超级人工智能(超越人类)的分类。第二部分:从图灵测试到DeepSeek。
2025-04-02 07:28:33
312
原创 AI Agent创新10大前沿方向与落地实践分析
AI Agent的十大创新方向涵盖多模态交互、行业垂直化、边缘计算、区块链集成、数字孪生、人机协作、自主学习、市场平台、低代码开发、隐私安全等十大方向。多模态AI Agent:整合多模态交互能力,应用于家庭健康管理和工业巡检。区块链AI Agent:通过智能合约实现可信协作,案例包括去中心化研究网络。低代码开发平台:通过可视化工具降低开发门槛,支持企业自动化流程构建。AI Agent的核心定义与技术特性。
2025-04-01 08:57:48
385
原创 AI Agent拐点已至,2B+2C星辰大海——行业深度报告
2025年AI Agent商业化应用元年预测报告指出,AI Agent以大语言模型(LLM)为核心,结合规划、记忆、工具调用和行动能力,能够自主执行复杂任务。2025年被视为其商业化元年,B端场景(如金融、医疗、法律)将率先落地,C端则需等待“杀手级应用”出现。技术路径上,AI Agent被认为是通往通用人工智能(AGI)的关键阶段,通过提升工具使用能力和自我学习能力,推动行业进入更高层级。C端应用:初步探索与潜力。
2025-04-01 07:30:10
450
原创 中山大学|从技术突破到场景落地:大模型发展图谱与DeepSeek创新应用|96页
第一部分:人工智能大模型发展现状涵盖人工智能的定义、分类及技术演进趋势,包括弱人工智能(ANI)、强人工智能(AGI)和超人工智能(ASI)的分类。分析了决策式AI与生成式AI的发展历程,重点讨论了技术积累(如推荐系统、图像识别)和大模型的参数规模(如GPT-4参数量与人脑神经元对比)。此外,探讨了AI在速度、容量、可靠性等方面的优势,以及技术挑战(如模型可解释性、伦理规范)。最后,结合政府政策(如“人工智能+”行动)和市场规模预测,展示了大模型在科研与产业中的重要性。
2025-03-30 18:41:43
932
原创 2023|2024|大模型落地应用案例集|150+案例|450页
大家好,我是吾鳴。大模型发展已经是有一段时间了,从2017年transformer架构提出,大模型开始进入到了蓬勃发展阶段,一路以来有OpenAI的GPT、Google的Bert等大模型的不断发展进步,从纯文本对话式的AI大模型到多模态的AI大模型,再到DeepSeek把这些AI技术平权化,再到Manus的出现,AI智能体已经不再是纸上谈兵。
2025-03-30 14:22:43
270
原创 不懂编程也能玩转AI智能体
为了更加的近距离地去了解一下AI 智能体,吾鳴找了一个国内比较火的,扣子智能体平台去了解了一下AI 智能体,扣子智能体平台是一个开箱即用的平台,即使你没有编程基础,也能使用扣子平台搭建你的AI智能体。
2025-03-30 13:15:41
725
原创 浙江大学公开课|第二季|从大模型、智能体到复杂AI应用系统的构建——以产业大脑为例
大模型发展与应用介绍大模型的演进历程,包括从早期基于规则的系统到现代生成式AI(如ChatGPT)的突破。重点讨论了大模型在推理能力上的提升与挑战,如幻觉问题、数学推理不足等,并提及OpenAI的o1/o3和DeepSeek-R1等模型在推理任务上的突破性进展。推理模型与思维链(CoT)阐述思维链(Chain of Thought)技术如何通过逐步分解问题提升模型推理能力,例如通过数学题或逻辑题演示模型如何生成详细推理步骤。同时探讨如何通过少量高质量数据(如LIMO方法)低成本训练高性能推理模型。
2025-03-29 16:25:02
752
原创 浙江大学公开课|第二季|智能金融:AI 驱动的金融变革
新一代人工智能从人工智能的定义与历史背景出发,重点探讨自然语言处理模型的演进(如统计模型、神经网络模型、Transformer架构的LLM),以及强化学习、模型蒸馏等核心技术。同时分析了AI面临的挑战,包括安全隐私问题(数据投毒、模型窃取)、算法共振(金融市场同质化风险)、幻觉率与创造力矛盾(如DeepSeek-R1的案例),以及价值对齐(通过RLHF等技术确保AI符合人类伦理)。金融智能研究实践。
2025-03-29 13:54:54
480
原创 浙江大学公开课|第二季|人工智能重塑科学与工程研究
科学研究范式的演进介绍科学研究的五大范式:经验驱动(观察归纳)、理论驱动(逻辑演绎)、计算驱动(计算机仿真)、数据驱动(海量数据分析)及智能驱动(AI全过程参与)。强调第五范式整合前四者优势,通过AI自主提出假设、设计实验,解决复杂系统问题。人工智能在科学与工程中的应用案例列举AI在方程求解(如流体力学、电磁场方程)、工程仿真(汽车碰撞、机翼设计)、地球科学(气候预测、地下水流模拟)、气象预报(华为云盘古模型、Google GraphCast)等领域的应用,展示其加速设计与优化的能力。
2025-03-29 12:09:08
752
原创 终于不用在本地安装DeepSeek搭建知识库了,腾讯ima知识库方便又好用
大家好,我是吾鳴。最近吾鳴看到有很多的9.9帮你搭建DeepSeek,搭建你专属的知识库的教程。这个不得不说明一下,如果你的电脑的配置不是特别高(GPU),那么还是放弃这个念头,因为即便本地安装上了DeepSeek,那速度也是龟速,回答个问题,估计得要个大半天。今天吾鳴给大家风向一下腾讯最新产品,ima知识库。这个知识库支持你上传本地的文件,搭建自己的知识库,然后DeepSeek-R1大模型可以聚焦于你本地的知识库的内容,做个性化的回答。让我们一起来好好感受一下ima知识库。
2025-03-28 22:43:31
439
原创 浙江大学|DeepSeek系列公开课|第二季|DeepSeek技术溯源及前沿探索
1. 语言模型介绍语言模型的基本任务,即计算词序列的概率。讨论传统方法如One-hot编码的局限性,并引入词嵌入(Word Embedding)技术,通过低维向量表示词汇语义相似性。技术演化部分涵盖从统计方法(N-gram)到神经网络(LSTM/GRU)的过渡,最终聚焦Transformer架构的优势,如自注意力机制和并行计算能力。解析Transformer的核心组件,包括自注意力机制、多头注意力、位置编码和层归一化。
2025-03-28 12:06:20
964
原创 清华大学|迈向未来的AI教学实验|2023-2024沈阳团队师生作业集|396页
1. 团队与教育框架介绍团队背景及“四能教育”理论,提出在AI赋能下学习者能力的四个跃升阶段:从低能到高能(个性化学习)、单能到多能(跨学科融合)、多能到超能(深度学习)、超能到异能(创新思维)。强调AI重塑教育中教师、学生与技术的角色,推动认知突围与跨学科整合。2. AI科学创见通过多个科学实验案例展示AI在科研中的应用,如自动执行生物医学实验(线粒体乳酸转运蛋白研究)、文明冲突仿真(模拟东西方价值观差异与资源矛盾)、素数理论构建(结合数学与密码学)等。
2025-03-28 08:12:49
698
原创 DeepSeek-V3新升级的版本带来了哪些惊喜?
是的,这家公司连发个新闻稿都懒得搞,直接半夜把新模型往GitHub一丢,深藏功与名。的更新,看似只是“小版本”,实则暗藏玄机。官方轻描淡写地说“优化了后训练方法”,但实测结果直接让网友喊出“白送法拉利”。最后友情提示:赶紧去官网体验新版V3,否则你可能成为朋友圈最后一个用上“AI法拉利”的人(而且这车还不用考驾照)。,吾鳴最近收集到了一些DeepSeek相关的教程报告资料,感兴趣的可以按照文末的方式免费自取。的组合拳,重新定义了AI行业的“性价比天花板”。如果说性能是DeepSeek的“面子”,那。
2025-03-27 12:52:03
610
原创 浙江大学|DeepSeek系列专题公开课|第一季|PDF+视频(全)
今天吾鳴把视频也给大家找来了,而且把第一季的DeepSeek系列公开课也稍做了下整理,PDF和视频的下载链接我都放到了文末。第一期(下):Chatting or Acting?第二期(上):孙凌云(浙江大学)DeepSeek:智能时代的全面到来和人机协作的新常态。第四期(上):陈建海(浙江大学)DeepSeek的本地化部署与AI通识教育之未来。第一期(上):吴飞(浙江大学)DeepSeek:回望AI三大主义与加强通识教育。第三期(上):陈静远(浙江大学)语言解码双生花:人类经验与AI算法的镜像之旅。
2025-03-27 07:58:58
785
原创 浙大公开课:《走向数字社会:从Deepseek到群体智慧》
技术发展历程从图灵机、符号主义(知识表示、数理逻辑、搜索)到现代人工智能技术(机器学习、深度学习、大模型)的演进。重点探讨了大模型(如1750亿参数模型)的涌现能力,依赖大数据(45TB)和大算力(1万张A100 GPU),并强调生成式模型(如语言模型)的潜力。同时介绍了DeepSeek项目的突破,包括挑战闭源模型垄断、优化算法(混合专家模型、强化学习等)及降低部署成本。数字化转型与社会应用人工智能推动社会各领域数字化,如机构节能、网约车需求预测、智能康复训练等。
2025-03-26 18:53:46
238
原创 浙大公开课:《DeepSeek模型优势:算力、成本角度解读》
引言与背景介绍讲座主题(从算力与成本角度分析DeepSeek模型优势)、作者信息及时间背景(浙江大学,2025年2月)。算力基础与发展概念:算力定义为信息计算、存储与传输能力的综合。历史演进:从大脑、草绳算力工具到现代计算机,对比原生算力与外部工具的特点。计算机算力阶段:大型机、PC、云计算、AI时代的算力需求变化,AI时代算力不足成为核心挑战。AI大模型算力与成本分析算力需求:基于OpenAI的扩展法则,提出万亿参数模型的计算量估算(如计算次数达(10^{25})量级)。硬件成本对比。
2025-03-26 12:56:46
378
原创 浙大公开课|DeepSeek核心技术突破
1. DeepSeek与中华文化基因的关联以中华文化中的开放、包容、共享精神为切入点,分析DeepSeek项目的核心理念。通过对比佛教“大乘法”与“小乘法”,强调DeepSeek以“利他”为目标,追求普适性人工智能发展。同时,从汉字的高效性、可传承性等角度,论证中文在AI训练中的潜在优势,并通过语料对比(如DeepSeek与ChatGPT的中英文比例),指出中文语料处理的挑战与优化方案。2. DeepSeek的技术争议与突破知识蒸馏的伦理边界。
2025-03-26 07:28:13
259
原创 浙大公开课|DeepSeek的本地化部署与AI通识教育之未来
课程背景与提纲介绍了浙江大学DeepSeek系列专题线上公开课第四期的主题——“DeepSeek的本地化部署与AI通识教育之未来”,由陈建海副教授主讲。课程提纲涵盖DeepSeek的新时代背景、本地化部署实践、AI通识教育未来方向及总结。人工智能时代背景从技术发展历程(农耕时代到人工智能新时代)切入,强调AI已渗透至生活各领域,如AIGC(文生文、文生图、文生视频)、智能图像理解、自动驾驶、医疗诊断等。同时探讨人机共存时代的元宇宙与数字分身趋势,以及AI的起源与多元智能理论。
2025-03-26 07:21:55
250
原创 语言解码双生花:人类经验与AI算法的镜像之旅
语言的奥秘:人类如何解码世界探讨语言对人类的核心作用,强调语言是思维工具、合作纽带及人类与动物的根本区别。人类通过经验和神经连接理解语言,依赖上下文消解歧义。例如,词语如“下雨”和“家”在大脑中形成固定关联,语境对精准解译至关重要。从符号到智能:AI的语言理解之路分析AI如何通过数字化处理语言,从传统词向量(如欧氏距离、余弦相似度)到Transformer架构的注意力机制,解决多义词和上下文依赖问题。指出传统模型的局限性,并介绍大语言模型如何动态生成上下文相关的词向量。
2025-03-25 22:49:11
431
原创 智灵动力:《DeepSeek行业应用与实践》
DeepSeek概述介绍了DeepSeek的核心产品DeepSeek-R1,其性能对标OpenAI,支持网页端、APP和API,强调开源策略(MIT协议)及低成本优势。模型通过强化学习技术优化推理能力,在数学、代码和自然语言任务中表现优异,日活用户迅速突破2000万,并在全球多国下载量领先。技术特点与模型对比DeepSeek-R1采用大规模强化学习,依赖少量标注数据提升性能,支持动态生成题目验证。横向对比显示其在多项基准测试(如MMLU、DROP、HumanEval)中超越或接近GPT-4等模型。
2025-03-24 08:29:08
604
原创 网易外贸通:《2025年DeepSeek保姆级入门指令手册》
客户开发:涵盖潜在客户挖掘、客户邮箱获取、社交媒体账号定位及官网信息深度提取。通过AI指令筛选目标客户,例如提取行业头部进口商特征、获取特定国家/行业的采购负责人联系方式,并解析企业官网获取隐藏信息。市场调研:包括行业动态追踪、关税影响测算、区域市场渗透策略和竞争对手监控。通过分析贸易政策、生成SWOT报告、监测竞品动态等,帮助企业制定市场进入策略和应对政策变化。邮件写作:提供外贸邮件的模板与策略,如首封开发信、二次跟进邮件、精准报价生成及节日营销内容。
2025-03-24 07:32:58
241
原创 《Manus学习手册》.pdf(文末附完整版下载地址)
1.产品概述与核心理念介绍Manus作为全球首款通用AI智能体平台的定位,强调其“知行合一”的理念。产品由Monica团队开发,旨在通过调用工具(如浏览器、代码编辑器等)自主执行任务,将用户指令转化为具体成果。其核心能力包括独立思考、系统规划、跨工具协作,并在GAIA基准测试中表现卓越,超越OpenAI的Deep Research。2.功能与使用场景详细列举Manus的核心功能,如任务规划、代码编写、数据可视化、多场景应用(旅行规划、股票分析、教育内容创建等)。
2025-03-23 19:49:47
1203
原创 AI工具都有哪些?1000+AI神器入口都在这里!这个网站你要藏好!
之前吾鳴也给大家分享过一些文档,是由前人整理分享的一些AI工具集,但是文档终归会过时,跟不上AI更新的步伐,所以这段时间吾鳴也在留意,市面上有没有一个门户网站,专门整理AI工具集,并且做好分类,比如AI办公、AI作图、AI视频等,那我们有相应的需求的时候就可以去找对口的分类工具使用即可。如果你发现你现在在用的AI工具,在AI工具集里面没有找到相关的入口,你还可以选择顶部的提交AI工具入口,给AI工具集提交相关的AI工具,AI工具集会把你的AI工具入口也添加到网站中。
2025-03-23 12:24:24
317
原创 极客时间:《AIGC时代的数字化人才培养新范式》
1. 行业趋势与人才需求分析引用《2023年未来就业报告》,强调企业需优先培养员工在AI、大数据、分析思维等领域的技能,44%的员工技能需升级。新兴职位如数字化转型专家、AI工程师等需求激增,薪资显著高于传统职位(如自然语言处理、深度学习岗位月薪超40k)。2. AI技术驱动的职业与技能变革AI催生新兴职位(如AI合规专家、AI数据注释员),并推动对预测分析、大语言模型(如ChatGPT)等技能的需求。企业需结合AI技术重塑学习场景,例如通过智能测评、个性化学习路径提升培训效率。
2025-03-23 07:55:23
491
原创 至顶AI:《DeepSeek完全实用手册:从技术原理到使用技巧》
DeepSeek简介介绍公司背景(杭州深度求索人工智能基础技术研究有限公司,成立于2023年,专注于通用人工智能)及核心模型(如v3对话模型和R1推理模型)。重点分析模型特性,包括混合专家架构(MoE)、强化学习训练、低成本训练与推理性能,以及与OpenAI等模型的对比数据。技术路线解析详细阐述模型技术架构,包括R1系列模型的训练流程(基座模型继承、冷启动、蒸馏技术)、混合专家(MoE)设计、多头潜在注意力(MLA)、FP8混合精度训练、多词元预测(MTP)及强化学习优化策略(如GRPO)。
2025-03-22 21:56:24
243
原创 南京审计大学:《 面向工程审计行业的DeepSeek大模型应用指南》.pdf(免费下载)
背景与引言阐述工程审计行业面临的挑战(如数据爆炸、场景复杂),指出传统审计模式的局限性,引出DeepSeek大模型在提升审计效率、推动智能化转型中的核心价值,并列举其在法律解读、智慧造价、招投标文件生成等场景的初步应用。技术基础与模型概述介绍DeepSeek大模型的基本原理(如混合专家架构MoE)、核心功能(智能问答、文本生成、数据分析等)及系列模型(如DeepSeek-V3、DeepSeek-R1)。重点说明其多模态理解、动态推理与低成本本地化部署的技术优势。使用与部署指南。
2025-03-22 16:24:51
1075
原创 DeepSeek 7大场景-50大案例-全套提示词 从入门到精通(免费下载)
介绍DeepSeek作为国产AI工具的核心优势,包括智能问答、内容生成、数据分析等核心功能,以及其全球下载量领先的原因。详细说明注册与使用流程,涵盖网页版和客户端的操作步骤,并强调联网搜索与附件上传的注意事项。
2025-03-22 07:35:58
280
原创 华中科技大学:《从DeepSeek到Manus:AI如何重塑企业价值》.pdf (文末附下载地址)
1. 背景与核心观点概述AI与企业管理的深度整合趋势,强调新质生产力发展的重要性。核心观点包括:AI(如DeepSeek和Manus)可能颠覆产品形态、改变商业模式、实现降本增效。企业需警惕行业变革风险,早期投入虽成本高但收益显著。DeepSeek因低成本、开源和高性能成为企业AI赋能的关键工具,而Manus作为通用智能体通过全链路自动化显著提升效率。2. 生成式AI的发展与行业重塑梳理生成式AI从机器学习奠基到智能体普及的演进历程,重点分析其对行业的重塑。
2025-03-22 07:19:08
931
原创 AI办公最新实用工具集100+
今天吾鳴给大家分享的是有大任智库整理的2025年度AI办公最新实用工具集,整理的工具超过100个,涵盖DeepSeek在线使用满月版的平台30+,API调用平台10+,AI搜索工具8个,AI文本优化工具6个,AI生图/视频工具17个,AI抠图/模糊变高清/扩图工具8个,AI生成PPT工具9个。文末附上PDF免费下载地址。
2025-03-21 11:42:17
265
原创 清华大学第12弹:《DeepSeek政务应用场景与解决方案》.pdf(文末附免费下载地址)
政务数字化转型背景概述政务数字化发展的三个阶段:电子政务(IT化初步数字化)、互联网+政务(平台化协同服务)、AI+政务(智能化深度变革)。强调AI驱动决策与服务升级,核心任务包括大模型应用、智能决策支持等。人工智能+政务应用场景分四大方向:智能政务办公(如公文写作、跨部门协同)、智能城市治理(交通、环境管理等)、智能民生服务(教育、养老等全周期服务)、智能辅助决策(经济预测、舆情研判)。具体场景涵盖行政审批优化、司法智能推演、城市数据融合治理等。核心技术方案。
2025-03-21 07:40:14
1053
原创 大任智库版DeepSeek企业落地应用讲义精华全版(258页)
大家好,我是吾鳴。今天吾鳴要给大家分享一份由大任智库出品的DeepSeek报告——《DeepSeek企业落地应用讲义精华全版》。这份报告一共从特征价值篇、交互生成篇、智能增强篇、部署开发篇以及新型组织与文化这几部分内容展开介绍DeepSeek应该如何在企业中落地应用,报告一共259页PPT,内容比较详细,文末有完整版下载地址。
2025-03-19 07:47:12
414
原创 清华大学第13弹:《AIGC如何助力工作和学习?》
介绍了AIGC的定义,即基于人工智能技术,通过训练大量数据生成文本、图像、语音等内容。同时,概述了清华大学新闻学院元宇宙文化实验室的相关研究报告,以及国内首部AI全流程微短剧《中国神话》的制作背景。
2025-03-19 07:39:22
927
原创 DeepSeek:AI赛道的超级引擎
开篇与背景介绍人工智能革命的临界点,强调DeepSeek作为AI赛道超级引擎的地位。极客邦科技创始人霍太稳指出,DeepSeek通过技术突破(如MoE架构、纯强化学习)和开源生态,正在重塑行业格局,并推动AI从实验室走向产业应用。技术突破与架构创新MoE(混合专家模型):通过细粒度专家分割与共享专家机制,降低训练和推理成本,提升性能。MLA(多头潜在注意力):优化Transformer注意力机制,减少显存占用,提高推理效率。纯强化学习(R1模型)
2025-03-18 08:04:24
456
原创 DeepSeek高校教程大合集(清华,北大,浙大,夏大,天大,湖大,天大,北师大),持续更新
大家好,我是吾鳴。自从DeepSeek爆火之后,吾鳴就一直在收集和整理关于DeepSeek的教程报告等资料,也收集了有一个多月了。但是有粉丝朋友反馈说,有点凌乱,细找比较麻烦。于是乎吾鳴基于金山文档建设了一个比较简陋的资源站(),你只需要输入相关的报告的关键字,就可以找到对应的报告的下载地址了。除此之外,吾鳴今天也把这段时间收集到的报告在文章中做一个总结,有需要的朋友可以到吾鳴的资源站中自行下载。
2025-03-17 07:30:00
2880
原创 北京大学第六弹:《DeepSeek应用场景中需要关注的十个安全问题和防范措施》
1. DeepSeek安全问题的特点及安全方案框架DeepSeek的安全问题具有“威胁难以预测”和“攻防非对称”两大特点。威胁难以预测源于AI模型的“黑箱”特性和复杂系统的“涌现”行为;攻防非对称性表现为攻击成本低而防御成本高。安全方案框架分为“内生安全”和“外延安全”:内生安全聚焦模型算法、数据安全及系统稳定性(如对抗攻击防护、数据隐私保护);外延安全涵盖法律、伦理、网络攻击滥用等外部风险(如虚假信息传播、技术滥用)。2. DeepSeek模型的5个安全问题①DDoS攻击。
2025-03-16 22:09:57
493
原创 DeepSeek入门宝典——行业应用篇
DeepSeek核心能力摘要:介绍DeepSeek的四大差异化技术能力,包括精准推理(提升复杂任务处理速度与准确率)、领域适配(支持垂直领域定制化需求)、多模态协同(联合分析文本、表格、时序数据)、轻量化部署(低资源占用与边缘计算支持)。每项能力均通过具体应用场景(如合同审查、物流监控、灾害应急等)说明其实际价值。行业赋能与应用案例摘要:聚焦医疗、金融、制造、教育四大行业,分析各行业痛点并提出DeepSeek的解决方案。
2025-03-16 20:16:38
283
原创 DeepSeek入门宝典——开发实战篇
DeepSeek核心价值与优势介绍DeepSeek在企业端(降本增效)、产品端(体验升级)及开发者端(辅助开发)的核心价值,并列出三大优势:高性能(对标OpenAI)、低成本(API价格低20倍)、开发者友好(兼容OpenAI格式)。包含API定价表格及企业应用案例(如恒瑞医药、华为小艺等)。部署DeepSeek的关键决策与方式。
2025-03-16 20:12:05
428
原创 DeepSeek入门宝典——技术解析篇
DeepSeek概述介绍DeepSeek的背景:由幻方量化于2023年创立,2024年发布首款AI大模型DeepSeek LLM,2025年推出对标OpenAI o1的高性能推理模型R1。强调其开源、低成本(开发成本仅为OpenAI的2%)和高性能(推理表现媲美OpenAI o1)三大特点,并对比普通用户与开发者使用DeepSeek的五种方式(官网、API、本地部署、云平台等)。R1核心技术解析详细剖析R1模型的架构与技术路径:基座模型V3。
2025-03-16 15:50:05
406
原创 DeepSeek入门宝典——个人使用篇
入门指南介绍DeepSeek个人用户的基本使用方式,包括四种访问途径(网页版、手机APP、API平台、私有化部署),以及三种使用模式(深度思考、联网搜索、默认模式)的区别。重点说明深度思考模式的特点,如调用复杂推理能力、生成结构化分析等,适合需要逻辑推演的场景。同时提到当前服务器繁忙的瓶颈问题,分析可能原因(如流量过大、技术瓶颈)并提供解决办法(错峰使用、本地部署等)。提问技巧与策略强调DeepSeek作为推理性大模型的特性,提倡使用自然语言而非过多提示词。
2025-03-16 15:44:38
416
jdk-22.0.2-macos-x64-bin.tar.gz
2024-10-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人