DeepSeek
文章平均质量分 97
DeepSeek是一家中国的人工智能公司,全名为杭州深度求索人工智能基础技术研究有限公司,成立于2023年。它专注于自然语言处理(NLP)和大语言模型(LLM),开发了一系列前沿的AI模型。DeepSeek是一款强大的人工智能模型,它在多个领域展现出了巨大的应用潜力,特别是在医疗健康领域。
正在走向自律
(1)荣誉与身份:2024年度优快云博客之星TOP71、优快云博客专家/全栈领域优质创作者、阿里云开发者社区专家博主、华为云.云享专家!全网中文IP:正在走向自律
(2)领域专长:人工智能、AI大模型、数字人、Java、Python、服务器管理、第三方支付等!
(3)创作理念:通过分享 IT 行业的专业见解、案例分析和实用技巧,帮助读者更好地了解 IT 领域的发展动态和应用实践!
(4)粉丝支持:感谢全网3万+粉丝的关注与支持,我会继续努力,带来更多优质内容!
(5)座右铭:创作之路漫漫其修远兮,吾将上下而求索!
(6)关注交流:微信公众号《正在走向自律1》,交流技术心得,领取技术干货!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
DeepSeek+Kimi:PPT制作的效率革命
DeepSeek 和 Kimi 的组合,为 PPT 制作带来了前所未有的变革,显著提升了制作效率和质量。通过智能生成逻辑框架、自动匹配设计规范、实时联网更新数据以及多格式无缝衔接等优势,让打工人从繁琐的 PPT 制作流程中解脱出来,将更多的时间和精力投入到内容的创意和策略思考上。然而,我们也应清醒地认识到,AI 虽然强大,但并不能完全取代人类的创造力和判断力。在 PPT 制作过程中,一些情感化的表述、独特的品牌调性以及对特定受众的精准把握,仍需要人工来进行细致的打磨和调整。原创 2025-03-30 23:36:48 · 5604 阅读 · 22 评论
-
手把手教你在Windows+docker本地部署DeepSeek-R1
本文详细介绍了在 Windows 系统上通过 Docker 部署 DeepSeek-R1 模型的完整过程。DeepSeek-R1 是一款由 DeepSeek 公司于 2025 年 1 月 20 日发布的开源推理大模型,具有出色的性能和广泛的应用场景。文章从部署前的准备工作开始,包括硬件和软件要求,详细阐述了 Docker 环境的搭建、基于 Ollama 和 Docker 的部署方式,以及部署后的测试与验证。此外,文章还提供了常见问题的解决方法和相关代码示例,帮助读者更好地理解和应用 DeepSeek-R1。原创 2025-02-11 11:46:30 · 6417 阅读 · 11 评论
-
DeepSeek:打工人的高效工作神器
DeepSeek 是由杭州深度求索人工智能基础技术研究有限公司开发的先进大语言模型 ,这家公司成立于 2023 年 7 月 17 日,由知名量化资管巨头幻方量化创立,专注于大语言模型及相关技术的研发。自诞生以来,DeepSeek 不断推陈出新,发布了一系列具有强大功能的模型。2025 年 1 月 20 日发布的 DeepSeek-R1 模型更是惊艳众人,在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版,在国际开发者社区和技术领域产生了重大影响 。原创 2025-02-11 10:47:20 · 5492 阅读 · 1 评论
-
深入探索DeepSeek最新版本,1024程序员节全面技术评测
DeepSeek在2025年程序员节前夕发布V3系列重大更新,展现多项技术突破。V3.1引入混合推理架构,支持快速响应与深度思考双模式;V3.2-Exp采用稀疏注意力机制(DSA),将长文本处理复杂度从O(n²)降至O(nlogn)。评测显示,新版本在保持性能的同时实现API成本降低50%以上,支持128K上下文长度,并在编程、数学推理等任务中表现优异。企业级应用方面,增强了严格模式函数调用能力,兼容主流API格式。技术创新包括UE8M0FP8低精度计算优化、闪电索引器等,为国产AI生态发展奠定基础。原创 2025-10-24 13:10:34 · 35359 阅读 · 157 评论 -
企业微信+DeepSeek大模型自动发消息给微信用户
本文探讨了企业微信与DeepSeek大模型结合实现消息自动发送的技术方案。企业微信提供稳定的API接口,DeepSeek大模型具备强大的自然语言处理能力,二者结合可显著提升企业沟通效率。通过详细的技术实现步骤和代码示例,展示了如何构建这一系统。实际应用表明,该方案能大幅缩短客户响应时间(从5分钟降至10秒内)、提高满意度至90%,同时减少内部任务完成时间20%。文章还展望了该技术在智能客服、精准营销等领域的拓展前景,为企业数字化转型提供了高效、智能的沟通解决方案。原创 2025-10-13 22:43:36 · 11208 阅读 · 37 评论 -
DeepSeek与Kimi强强联手,解锁AI新境界
摘要:DeepSeek与Kimi分别代表国内AI大模型与中文长文本处理的顶尖技术。DeepSeek通过MoE架构、MLA技术及FP8训练实现高效知识理解与代码生成;Kimi则以128K超长上下文、多模态支持和中文优化见长。二者协同形成"DeepSeek初稿+Kimi精修"的闭环,显著提升内容创作、科研、法律文书及PPT生成的效率与质量。尽管面临数据一致性、模型融合等挑战,但通过中间表示层、分布式计算等技术可有效解决。原创 2025-08-24 14:10:47 · 9014 阅读 · 32 评论 -
DeepSeek:技术专家的效率革命,开启工作新境界
摘要:DeepSeek是幻方量化推出的高性能大语言模型,采用MoE架构和MLA技术,显著降低推理成本(显存占用仅为传统模型的5%-13%)。其模型迭代迅速,如6710亿参数的DeepSeek-V3以行业1/10的训练成本实现媲美GPT-4的性能。在技术领域,DeepSeek可辅助代码生成(如Python/Flask应用)、系统架构设计(微服务方案)、数据分析(Pandas清洗与可视化)及文档撰写,大幅提升效率。使用时需注意精准提问、交叉验证结果,并与其他工具(如Pandas、Flask)协同。原创 2025-08-17 21:19:36 · 3391 阅读 · 8 评论 -
如何使用 DeepSeek 帮助自己的工作?
摘要:DeepSeek 是面向技术专家的AI助手,支持代码生成与优化(如Python/Java)、数据分析(数据清洗、可视化)、技术文档撰写(需求文档/设计文档)及技术难题解答(分布式系统问题)。通过精准提问和提示词技巧(如“生成RESTful订单管理API”),可快速输出解决方案。需注意数据脱敏、结果验证及理解其专业局限性。支持网页端与移动端,结合IDE或PandasAI可提升工作效率,是开发者提效的核心工具。原创 2025-08-17 14:38:38 · 3623 阅读 · 48 评论 -
DeepSeek开发者生态:解锁从0到1,再到无限可能的成长密码(18/18)
本文摘要:文章介绍了DeepSeek开发者生态,其凭借强大的通用人工智能技术研发能力与创新理念,在全球AI市场迅速崛起。开发者可从基础使用逐步深入,通过优化模型参数、多模态交互应用、与其他工具集成等方式挖掘更多功能,还能通过参与开源项目、提出创意建议等方式从使用者转变为贡献者。尽管面临技术难题、竞争压力和生态规则适应等挑战,但凭借技术创新、用户体验优化和生态建设,有望在多模态融合、强化学习及拓展医疗、金融等行业合作方面实现新突破。原创 2025-03-23 15:02:36 · 2052 阅读 · 51 评论 -
DeepSeek:大模型跃迁AGI,探索智能新航道(17/18)
这三个代码案例展示了DeepSeek在智能开发领域的强大功能,包括代码生成、代码审查和代码优化。这些功能不仅能够显著提高开发效率,还能提升代码质量和系统性能,是现代软件开发中不可或缺的工具。原创 2025-03-22 19:11:05 · 1231 阅读 · 4 评论 -
DeepSeek超参优化实战:AutoML调参全解析,解锁AI性能密码(16/18)
AutoML,即自动化机器学习(Automated Machine Learning) ,是一种能够自动完成机器学习模型构建和优化过程的技术。它涵盖了从数据预处理、特征工程、模型选择到超参数优化等一系列机器学习任务的自动化实现。传统的机器学习流程需要数据科学家花费大量时间和精力在各个环节进行手动操作和调整,而 AutoML 的出现极大地改变了这一现状。在实际应用中,AutoML 展现出了诸多重要价值。原创 2025-03-12 21:58:27 · 2088 阅读 · 57 评论 -
DeepSeek携手ONNX,开启跨平台部署新纪元(15/18)
DeepSeek 作为一款备受瞩目的人工智能模型,以其卓越的性能和创新的技术在众多领域崭露头角。它具备强大的自然语言处理能力,能够理解和生成高质量的文本,无论是日常对话、文章创作还是专业领域的知识问答,DeepSeek 都能应对自如。在智能客服场景中,DeepSeek 可以快速准确地理解用户的问题,并提供详细且针对性的回答,大大提高了客户服务的效率和质量。其优势不仅体现在语言处理能力上,还在于高效的计算和学习能力。原创 2025-03-12 21:33:57 · 1597 阅读 · 5 评论 -
DeepSeek模型蒸馏:开启AI高效新时代(14/18)
DeepSeek 模型蒸馏技术凭借其独特的动态注意力迁移算法和异构硬件适配技巧,在模型压缩与性能提升领域展现出卓越的优势。动态注意力迁移算法赋予模型动态分配注意力权重的能力,使其能够精准捕捉数据关键信息,极大地提升了模型对复杂数据的理解和处理能力。这种算法创新不仅在理论上优化了模型的学习过程,更在实际应用中显著提高了模型的准确率和泛化能力,为模型在不同任务和领域的高效运行奠定了坚实基础。在异构硬件适配方面,DeepSeek 展现出了强大的兼容性和优化能力。原创 2025-03-10 11:05:42 · 1481 阅读 · 10 评论 -
DeepSeek:开启AI联动与模型微调的无限可能
DeepSeek 是一家由中国知名量化私募巨头幻方量化创立的人工智能公司,成立于 2023 年 7 月。其技术基石主要包括混合专家架构(MoE)、强化学习与奖励工程以及知识蒸馏技术等。2023 年至今,DeepSeek 陆续推出了多个大语言模型,如 DeepSeek Coder、DeepSeek LLM、DeepSeek-V2、DeepSeek-V3 和 DeepSeek-R1,在不同场景下展现出强大的性能和高度的优化平衡。原创 2025-03-03 18:53:55 · 3509 阅读 · 68 评论 -
DeepSeek与Kubernetes:解锁大规模训练集群管理密码(13/18)
DeepSeek 与 Kubernetes 的结合,无疑为大规模训练集群管理带来了一场革命性的变革。在这场变革中,弹性资源调度策略如同精准的指挥棒,根据训练任务的动态需求,巧妙地调配着计算资源,实现了资源的高效利用,大幅提升了训练效率;容错机制与断点续训技术则像坚固的盾牌和可靠的指南针,在面对硬件故障、网络中断等重重挑战时,保障了训练过程的稳定性和连续性,避免了因意外中断而造成的时间和资源浪费;原创 2025-03-01 21:27:37 · 1031 阅读 · 11 评论 -
DeepSeek Model Zoo:解锁预训练模型的宝藏地图(12/18)
DeepSeek Model Zoo 是一个集多种先进预训练模型于一体的宝库,涵盖自然语言处理(NLP)、计算机视觉(CV)和语音等多个领域。这些模型在各自领域展现出卓越的性能,为不同场景下的应用开发提供了坚实的基础。通过深入了解 DeepSeek Model Zoo 中的模型,研究者和开发者能够更好地掌握人工智能技术的前沿动态,为解决实际问题提供更高效、更智能的解决方案。原创 2025-02-26 22:17:27 · 1192 阅读 · 13 评论 -
DeepSeek三大版本大揭秘:量化、蒸馏、满血,谁才是你的菜?
DeepSeek 的量化版、蒸馏版和满血版在参数规模、性能表现和适用场景上各有千秋。满血版凭借庞大参数和强大性能,成为高端科研和大型企业复杂任务的首选;蒸馏版以其灵活的参数规模和在资源受限环境中的出色表现,满足了小型企业和实时响应场景的需求;量化版则通过量化技术实现了模型大小和推理速度的优化,在移动端和边缘设备上展现出独特优势。在实际应用中,用户应根据自身的需求、硬件资源和预算等因素,综合考虑选择最适合的版本。如果是进行复杂的科研项目或对精度要求极高的企业级应用,满血版无疑是最佳选择。原创 2025-02-25 20:51:34 · 9107 阅读 · 8 评论 -
AI新势力!蓝耘DeepSeek满血版登场,500万tokens免费开薅
蓝耘科技推出的 DS 满血版模型,凭借其在架构、训练、多语言、推理速度、算力基建、上下文窗口以及多模态融合等多方面的技术革新,展现出了强大的性能和广泛的应用潜力。而 500 万 tokens 免费赠送活动,更是为广大 AI 开发者和研究人员提供了宝贵的资源,降低了开发成本,促进了 AI 技术的普及和创新应用。在未来,随着人工智能技术的不断发展,蓝耘科技有望继续在技术创新的道路上砥砺前行。一方面,DS 满血版模型可能会在更多的行业和领域得到深入应用,为各行业的智能化转型提供更加强有力的支持。原创 2025-02-25 19:48:39 · 2936 阅读 · 61 评论 -
DeepSeek Studio:开启可视化AI开发新时代(11/18)
DeepSeek Studio 作为一款前沿的可视化开发工具,以其独特的拖拽式模型构建工作流、强大的自动化超参数调优功能以及全面的模型性能监控仪表盘,为 AI 开发者提供了高效、便捷且智能的开发体验。它不仅降低了 AI 开发的门槛,让更多人能够参与到 AI 创新的浪潮中,还在实际应用中展现出了卓越的效果,为医疗、金融、交通等多个领域的智能化发展提供了有力支持。对于广大 AI 开发者和相关领域的从业者来说,DeepSeek Studio 无疑是一个值得尝试和探索的强大工具。原创 2025-02-24 22:44:59 · 1452 阅读 · 5 评论 -
DeepSeek:开启AIGC全链路内容创作新时代(10/18)
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司 ,作为一家在 AIGC 领域崭露头角的明星企业,自 2023 年 7 月成立以来,便以迅猛之势在人工智能的赛道上一路疾驰。它由知名量化资管巨头幻方量化创立,自诞生之初就汇聚了众多行业顶尖人才,这些专业人士凭借在人工智能领域的深厚积累,为 DeepSeek 注入了强大的技术基因。原创 2025-02-24 22:24:42 · 1448 阅读 · 1 评论 -
DeepSeek 智慧城市应用:交通流量预测(9/18)
在 DeepSeek Serving 中,需要定义 API 接口来接收输入数据和返回预测结果。可以通过配置文件或代码来定义接口的输入输出格式、请求处理逻辑等。self.model = load_model(model_path) # 加载导出的模型。原创 2025-02-19 22:58:28 · 5818 阅读 · 53 评论 -
DeepSeek医疗影像诊断:从数据到模型的落地密码(8/18)
DeepSeek医疗影像诊断:从数据到模型的落地密码南》通过详细介绍DICOM数据预处理规范、3D器官分割模型训练以及联邦学习保障数据隐私等方面的内容,为医疗影像诊断的实践提供了全面的指导。这些技术和方法的应用,不仅可以提高医疗影像诊断的准确性和效率,还可以有效保护患者数据的隐私,推动医疗影像诊断技术的发展和应用。原创 2025-02-19 22:29:12 · 1773 阅读 · 5 评论 -
DeepSeek开启游戏AI开发新纪元:实战攻略与创新应用(7/18)
本文深入探索了 DeepSeek 在游戏 AI 开发领域的卓越应用,从多个维度展示了其强大的功能和潜力。在非对称多智能体对战训练中,DeepSeek 打破了传统智能体的单一模式,通过赋予不同智能体独特的能力和目标,激发了它们在竞争与合作中的无限潜力。通过数据采集、模型训练和策略优化等一系列精细的流程,智能体能够不断学习和进化,在游戏中展现出更加智能、灵活的行为,为玩家带来了前所未有的挑战和乐趣。蒙特卡洛树搜索(MCTS)优化则为游戏 AI 的决策过程提供了精准的导航。原创 2025-02-16 06:00:00 · 4612 阅读 · 11 评论 -
DeepSeek金融风控实战:反欺诈模型的进阶之路(6/18)
部分依赖图(PDP):部分依赖图主要用于展示一个或两个特征对机器学习模型预测结果的边际效应。它通过改变感兴趣特征的值,同时保持其他特征的值不变,来分析模型输出,从而计算特征变量对模型预测结果影响的函数关系。这种关系可以是近似线性关系、单调关系或者更复杂的关系。例如,在一个基于用户交易数据的反欺诈模型中,我们可以使用 PDP 来观察交易金额与欺诈风险之间的关系。原创 2025-02-15 15:50:35 · 3405 阅读 · 7 评论 -
DeepSeek赋能智能客服:技术革新与体验升级(5/18)
本文概述了DeepSeek智能客服引擎的关键技术,包括意图识别、对话管理、情感分析和亿级并发架构。文章首先介绍了DeepSeek的基础知识和背景,然后深入探讨了这些技术如何提升客服的精准交互和“温度”。最后,文章讨论了面临的挑战、未来发展方向和应用前景,为智能客服技术的发展提供了洞见。原创 2025-02-15 15:27:22 · 2384 阅读 · 2 评论 -
DeepSeek与PyTorch携手:开启工业缺陷检测新时代(4/18)
经过项目团队的努力,成功实现了手机主板表面缺陷检测系统的部署和应用。在实际运行中,系统的缺陷检测准确率达到了 96%,召回率达到了 92%,检测速度达到了每分钟处理 35 块主板,完全满足了项目的预期目标。通过该系统的应用,企业的次品率显著降低,从原来的 5% 降低到了 2% 以下,有效提高了产品质量和市场竞争力。人工成本也大幅减少,原本需要 10 名检测人员的工作,现在仅需 2 名技术人员进行设备维护和监控,为企业节省了大量的人力成本。在项目实施过程中,也积累了宝贵的经验教训。原创 2025-02-14 21:51:45 · 2780 阅读 · 5 评论 -
解锁DeepSeek多模态:从原理到实战全解析(3/18)
DeepSeek 的多模态能力在图文跨模态对齐、视频理解与生成以及多模态检索系统搭建等方面展现出了卓越的技术实力和广泛的应用价值。通过时空同步对比学习框架和对抗性负样本生成器等创新技术,实现了图文之间的高效对齐;基于 Transformer 架构和生成对抗网络的视频理解与生成统一框架,为视频内容的处理提供了强大的工具;而多模态检索系统的搭建案例则展示了如何将 DeepSeek 技术应用于实际场景,解决信息检索的难题。展望未来,随着人工智能技术的不断发展,DeepSeek 多模态技术有望在更多领域取得突破。原创 2025-02-14 21:26:07 · 2211 阅读 · 4 评论 -
BlueCloud Platform携手DeepSeek:开启AI应用新征程
通过在蓝耘平台上结合 DeepSeek 进行 AI 模型优化、分布式训练以及行业解决方案的应用实践,取得了一系列显著的成果和价值。在 AI 模型优化方面,通过量化、剪枝和参数调整等策略,成功提升了 DeepSeek 模型的性能。量化技术在不显著降低模型精度的前提下,有效减少了模型的内存占用和计算量,使得模型能够在资源受限的设备上高效运行。剪枝策略去除了模型中不重要的连接和神经元,降低了模型的复杂度,提高了运行效率。合理的参数调整则进一步优化了模型的性能,使其在不同的任务和数据集上表现更加出色。原创 2025-02-13 20:16:04 · 2310 阅读 · 42 评论 -
DeepSeek模型:从压缩到实战,性能飞升全攻略(2/18)
在移动端的深度学习应用中,CPU、GPU 和 NPU 作为主要的计算硬件,各自凭借独特的架构特点和工作原理,在模型推理中扮演着不可或缺的角色。CPU(中央处理器)作为计算机系统的核心部件,其基本原理基于冯・诺依曼架构,主要由控制单元、运算单元和高速缓存组成。控制单元负责指令的读取、译码和执行控制,如同整个系统的指挥官,协调各个部件的工作;运算单元则承担着基本的算术和逻辑运算任务,是数据处理的核心;高速缓存则用于存储频繁访问的数据和指令,以提高数据访问速度,减少 CPU 与内存之间的数据传输延迟。原创 2025-02-13 16:22:48 · 1253 阅读 · 1 评论 -
深度揭秘DeepSeek:核心技术架构剖析与未来展望(1/18)
DeepSeek 是一家专注于开发先进大语言模型(LLM)和相关技术的研究公司,由知名量化资管巨头幻方量化于 2023 年 7 月 17 日创立。自成立以来,DeepSeek 凭借其在大语言模型领域的创新与突破,迅速在 AI 领域崭露头角。2024 年 1 月 5 日,DeepSeek 发布首个包含 670 亿参数的大模型 DeepSeek LLM,该模型从零开始在一个包含 2 万亿 token 的数据集上进行训练,数据集涵盖中英文。原创 2025-02-12 10:18:41 · 2508 阅读 · 5 评论 -
智算云巅,DeepSeek启航:平台上部署实操秘籍
在蓝耘智算平台上使用 DeepSeek 模型,为我们开启了一扇通往人工智能创新应用的大门。从平台的注册登录、资源申请,到环境搭建、模型的加载与推理、训练与优化,再到模型的部署与应用,每一个环节都紧密相扣,共同构成了一个完整的 AI 开发流程。蓝耘智算平台凭借其强大的算力资源、灵活的功能特性以及贴心的服务,为 DeepSeek 模型的运行提供了坚实的保障;而 DeepSeek 模型则以其卓越的性能、创新的技术架构以及丰富的开源生态,为用户带来了无限的创新可能。原创 2025-02-11 12:30:02 · 3016 阅读 · 55 评论 -
DeepSeek开启程序员副业增收新通道,财富密码大公开!
DeepSeek 是一款基于深度学习技术的人工智能平台,它具备强大的自然语言处理能力,能够理解人类语言的复杂语义和语境,实现高质量的文本生成、问答系统、翻译等功能。例如,在文本生成方面,它可以根据给定的主题或提示,生成逻辑清晰、内容丰富的文章、故事、报告等,其生成的内容不仅语法正确,还能在风格和语气上符合用户的要求。在代码生成领域,DeepSeek 更是表现出色,它支持多种编程语言,如 Python、Java、C++ 等,能够根据自然语言描述的功能需求,快速生成相应的代码片段,大大提高了编程效率。原创 2025-02-11 11:28:18 · 1371 阅读 · 1 评论
分享