- 博客(414)
- 资源 (1)
- 收藏
- 关注

原创 狠狠收藏!关于Deepseek,看这一篇就足够了
最近,AI界黑马DeepSeek爆火。AI圈、科技博主、职场人,甚至连朋友圈的宝妈群都在聊——“DeepSeek太强了!”“国产GPT之光!”“中文能力碾压!但Deepseek这个名词对部分人来说还比较陌生,怎么高效使用也是一个未知数,今天,就让我们一起走进DeepSeek的世界,看看它到底有多厉害!顺便再给你个DeepSeek万能使用模板,让你彻底摆脱提示词焦虑,让AI真正成为你的“最强大脑”!
2025-02-04 11:58:09
8546
原创 没开玩笑!我厦这个团队手把手教你成为AI能力者!
厦门大学数据库实验室团队早在2月便推出了Deepseek相关科普PPT,并以针对性报告的形式,用“硬核知识+趣味设计”的组合拳。让原本晦涩难懂的大模型知识,变得像短视频一样“上头”!无论你是学术研究者、企业实践者或是对大模型一无所知的“小白”,都能借助这些PPT搭建出独属于此外,PPT还讲解了本地部署大模型的方法与AIGC的应用场景。包括如何准确以及等。面向高校的PPT则聚焦教学如何用AI制作脑图 快速阅览论文在智能文献检索 学术写作与报告生成数据分析与挖掘等方面。
2025-04-05 10:30:00
366
原创 深度体验高德地图mcp,5分钟打造一份全方位旅游攻略
前面介绍过地图mcp之后,随着一波倒春寒过去,看着窗外的春暖花开,笔者有些按耐不住,想要来趟说走就走的旅行。智能化时代,旅行规划当然也要智能化,干脆试一试最新的地图mcp,直接用高德地图mcp生成一份智能规划。两个操作大同小异,都是先要获取api,方法也很简单,登录高德开放平台,注册账号,登录之后,点击左侧我的应用,创建应用。(最好认证为开发者)。记住这里的API key,后面要用到。打开cursor,点击右上方齿轮,点击MCP,进入mcp设置。设置也很简单。点击添加mcp服务器。
2025-04-05 07:45:00
630
原创 一文搞懂⼤模型的训练:完整的代码演示
大模型训练整体上分为三个阶段:预训练、SFT(监督微调)以及RLHF(基于⼈类反馈的强化学习) 预训练的过程类似于从婴⼉成⻓为中学⽣的阶段,在这个阶段我们会学习各种各样的知识,我们的语⾔习惯、知识体系等重要部分都会形成;对于⼤模型来说,在这个阶段它会学习各种不同种类的语料,学习到语⾔的统计规律和⼀般知识 SFT的过程类似于从中学⽣成⻓为⼤学⽣的阶段,在这个阶段我们会学习到专业知识,⽐如⾦融、法律等领域,我们的头脑会更专注于特定领域。
2025-04-04 10:30:00
1675
原创 大模型入门超全指南来了!人大团队力作,内附一线开发经验
2025年,DeepSeek-R1的发布在国内AI领域掀起了一场前所未有的开源风暴。作为一款性能卓越的开源大模型,它不仅开放了模型的获取权限,还主动分享算法细节以及优化策略,激发了整个行业的开放共享热潮。与此同时,科研论文、技术博客和开源社区的讨论如雨后春笋般涌现,这种开放透明的氛围极大地推动了AI科研知识的共享与传播,吸引了更多研究者和开发者参与到大模型的创新与应用中。不过,对于刚刚入门大模型的初学者而言,这些论文、研究中涉及的诸多高阶概念或许意味着较高的认知挑战。
2025-04-04 07:00:00
420
原创 一文搞懂:大模型是怎么被训练出来的?AI大模型落地必读
从整体上看,训练LLM主要包括两个关键阶段:预训练(Pre-training)后训练(Post-training):微调、RL和RLHF。上述流程整合了预训练、微调、RLHF等核心阶段,适用于自然语言处理和多模态大模型:1.
2025-04-03 10:01:39
871
原创 DeepSeek R1 实现本地化部署 + 可视化访问,真的太香了!
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。我个人电脑配置比较低,只能装1.5b的,大家可以根据自己的电脑配置,装一个比较大的模型。对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。天道酬勤,你越努力,就会成为越优秀的自己。
2025-04-03 09:51:04
756
原创 Deepseek+Echarts,5分钟轻松制作图表,真的太好用了!
你有没有遇到过这种情况:领导催着要报表,结果你打开Excel,发现满屏的数据就像天书一样,脑袋直接当机。想做个图表吧,结果一看到代码,心里默念“告辞”,直接放弃治疗。别慌,今天我来教你一个“拯救数据恐惧症”的组合技——Deepseek和Echarts。听着名字是不是有点高大上?别怕,我保证讲得通俗易懂,哪怕你是个代码小白,照样能分分钟搞定一张专业级的图表。先来说说Echarts,它是个开源的可视化工具,简单理解就是“图表自动贩卖机”。
2025-04-02 10:13:18
935
原创 大模型入门:私有化部署问答助手术语、工具和解决方案
目前的大语言模型,几乎都是以聊天的方式来和用户进行交互的,这也是为什么OpenAI开发的大模型产品叫ChatGPT,核心就是Chat。而我们基于大语言模型LLM落地应用,核心就是利用大模型的语义理解能力和推理能力,帮我们解决一些难以用“标准流程”去解决的问题,比如理解非结构化数据、分析推理、归纳总结等。LLM真正的长处是它的理解、推理和对于问题的泛化能力,如果能把它运用到具体业务中,让它学习业务知识,则能发挥巨大的价值。
2025-04-02 10:05:03
627
原创 《从DeepSeek R1到DeepDoctor:逐步微调之旅》
AI领域正经历着快速变化,开源社区正在崛起,挑战着专有模型的地位。开源的LLM正在变得更加优秀、更快速、更高效,使得在较低的计算和内存资源下微调它们变得比以往更加容易。本教程通过探讨DeepSeek R1推理模型,并学习如何对其精简版进行微调以应用于医学问答任务,展示了开源AI的无限潜力。微调后的推理模型不仅提升了性能,还使其能够广泛应用于医学、急救服务和医疗等关键领域。
2025-04-01 09:59:44
821
原创 要想吃透大模型,不实操怎么行?来一起探索~
batch_size 是每次训练时输入模型的样本数量。控制每次更新模型参数时使用的数据量。batch_size 决定了每次从数据集中加载多少样本。例如,CIFAR-10 训练集有 50,000 张图像,batch_size=64 表示每次加载 64 张图像。常见取值范围通常为 32、64、128、256 等,具体取决于显存大小和数据集规模。如下两图所示,当设置不同的batchsize大小时,很明显的时GPU的利用率会存在较大的差异。
2025-04-01 09:55:52
1158
原创 AI大模型太多,傻傻分不清?一文整理国内外主流大模型
自从2022年12月OpenAI 推出 ChatGPT 后,所有人都惊讶于它的能力,同时也关注到了其背后的大模型,于是全世界各大互联网公司都开始拼命卷模型,生怕掉队。今天各类 AI 新闻中常常会出现不同公司的模型,但由于模型类型和版本过多,我经常分不清谁是谁。于是花了点时间,将国内外主流模型做了整理,方便理解。先放一张,方便理解不同模型之间的时间线。
2025-03-31 14:02:36
1605
原创 DeepSeek接入Excel后,所有做数据分析的全崩溃:Excel白学了!
DeepSeek带动的ai风暴已有两个月,如果你还在以为这只是卖噱头,好看不实用就Out了。今天让你见识一下DeepSeek接入Excel后功能有多强大。下周即将开放的DeepSeek数据面板功能,一分钟让表格生成高质量的数据分析面板销售表生成的销售数据面板:(有图表有详细的分析文字,而且图表全是动态图表)广告费分析面板资产负债分析面板产品分析面板生成数据分析面板的内容可以私人订制,配色可以自选,版式自选。这个数据面板功能还需一周详细测试,争取下周日更新上线。
2025-03-31 13:58:30
1065
原创 DeepSeek V3版本重磅升级:编程能力直逼Claude 3.7,这些行业应用案例让人惊艳!
2025年3月26日,国产AI大模型DeepSeek迎来重大更新——V3-0324版本正式发布!这次升级不仅大幅提升了模型的推理性能,更在前端开发技能和工具使用智能度上实现了质的飞跃。作为长期关注AI技术发展的科技博主,我第一时间对这款"国产狠货"进行了深度测评,结果令人惊喜不已!本文将全面解析DeepSeek V3-0324的核心升级优势,并分享多个真实行业应用案例,带您领略这款"中国智造"AI模型的强大实力。
2025-03-29 09:46:07
1001
原创 【AI大模型应用开发】DeepSeek API接入详细步骤和简单应用
DeepSeek很火,相信大家都知道了。DeepSeek对话和APP相信大家也都或多或少的用过或见别人用过了。今天,让我们更进一步,来上手DeepSeek API的使用。
2025-03-28 09:46:52
1126
原创 从阿里腾讯看AI大模型:现状、应用与未来蓝图
AI 大模型的发展如同一股汹涌澎湃的浪潮,席卷了全球科技领域。从巨头纷纷入局的激烈竞争,到市场规模的爆发式增长;从技术的不断突破,到应用领域的广泛拓展,AI 大模型正以前所未有的速度改变着我们的生活和工作方式。作为科技领域的重要变革力量,AI 大模型的未来充满无限可能。让我们保持关注,积极参与,共同见证 AI 大模型时代的辉煌!
2025-03-28 09:42:16
990
原创 Agentic RAG 目前最强大的RAG实现方式
RAG 作为一种提升生成式 AI 模型表现的框架,通过检索外部知识源,增强生成内容的准确性与丰富度。AI Agent 则是具备感知、推理、行动和学习能力的自主软件系统,能在复杂环境中完成任务。二者结合,让 AI 系统拥有更强大的功能。传统 RAG 存在检索时机难定、文档质量不佳、易生成错误信息等问题。Agentic RAG 系统有效解决了这些痛点,在客户支持、内容创作、研究辅助、工作流自动化等场景广泛应用。例如在客户支持中,它能快速检索实时数据,精准回应客户咨询;
2025-03-27 09:43:22
611
原创 还要脸不?OpenAI 奥特曼说:DeepSeek 爆火不是因为模型能力,而是展示思维链…
当OpenAI CEO山姆·奥特曼将DeepSeek的全球现象级爆火归因为“展示思维链”时,硅谷的傲慢与焦虑已无处遁形。从技术突破到开源革命,从成本碾压到资本地震,DeepSeek用铁证狠狠打脸:中国AI的崛起,从来不是靠“花拳绣腿”,而是硬核技术与开放生态的降维打击!奥特曼轻描淡写的“思维链表演论”,仿佛DeepSeek的成功只是一场精心设计的“魔术秀”。
2025-03-27 09:38:22
753
原创 牛马型or全能型?你最想用哪款LLM?
选择LLM需根据具体任务和需求。OpenAI和Claude适合技术任务和代码生成,DeepSeek和Llama在开放性和定制化上占优,而OLMo则为研究LLM内部机制提供了透明平台。随着AI工具的不断进化,科研人员将有更多选择,但也要综合考虑法律和伦理风险。
2025-03-26 10:22:40
949
原创 太香了,通过DeepSeek打造小红书爆款!
现在做小红书内容的朋友们都知道,这个平台已经成为流量密码的关键。但是,光靠努力可不够,还得有点“黑科技”加持。今天就来聊聊DeepSeek这个神器,如何帮你打造高转化的小红书内容矩阵,让你的账号爆单不断!大家都知道,标题就是门面,吸引用户点进去是关键。如果标题不够吸引人,再好的内容都没人看。传统的方法要不停调试各种Prompt,既麻烦又不稳定。举个例子,你是一名健身教练,主要服务25-35岁的职场女性,提供私教课程、饮食计划等。
2025-03-26 09:29:37
982
原创 实操干货!MCP 全解析,手把手教你基于 MCP 开发 Agent
随着 Manus 推动 Agent 应用的火爆,MCP(模型上下文协议)成为众多社区热议的焦点。今天,我们将深入解析 MCP 并提供实操应用指南。相信读完这篇文章,你就能立刻上手 MCP。
2025-03-25 10:15:05
1484
原创 DeepSeek基础:PPO、DPO、GRPO概念详解
DeepSeek在强化学习(RL)优化中采用了多种算法,包括PPO、DPO和GRPO,这些算法在不同场景下提升了模型的性能和训练效率。
2025-03-25 09:31:21
1271
原创 要想搞懂AI产品的开发流程,看这篇就够了
AI(Artificial Intelligence 人工智能)是通过机器来模拟人类认识能力的一种科技能力。AI最核心的能力就是根据给定的输入做出判断或预测。当年的图灵实验就是要区分到底是人还是机器回答,图灵实验如今已经无法区分到底是人还是AI回答,AI已具有了人类的认知能力。人工智能(AI)的核心是根据给定的输入信息来做出决策、判断或预测。这种能力是通过机器学习算法、深度学习网络和其他相关技术实现的。AI系统能够处理和分析大量数据,从中学习模式和规律,然后根据这些学习到的知识来做出响应。
2025-03-24 10:17:18
1097
原创 清华大学2025年 DeepSeek政务应用场景与解决方案
DeepSeek政务应用场景与解决方案》是由清华大学新闻与传播学院新媒体研究中心及人工智能学院联合发布的报告。该报告聚焦于人工智能在政务领域的深度应用,提出了从电子政务到AI+政务的三阶段演进路径。报告详细阐述了AI在政务办公、城市治理、民生服务和辅助决策四大方向的多样化应用场景,包括公文写作、行政审批、司法行政、城市治理、教育资源匹配、就业推荐、舆情研判等。同时,报告介绍了DeepSeek的技术方案,如本地知识库、模型微调、联邦学习等,以及针对数据安全和隐私保护的架构设计。
2025-03-24 09:45:22
1402
原创 每周一问大模型 | 大模型一体机是一种好的商业模式吗?
近段时间以来,据不完全统计,包括华为、联想等大企业在内,已有超过60家企业基于DeepSeek推出大模型一体机。大模型一体机,通过将计算硬件和AI大模型及相关支持软件,紧耦合封装在一起,方便客户使用大模型来实现AI应用,可以看作是AI版的“卖盒子”,它是一种好的商业模式吗?让我们听听大模型们怎么说?
2025-03-22 10:16:40
971
原创 深度解析 DeepSeek 技术原理 —— 探索高效 AI 背后的创新之路
DeepSeek 以其独特的混合专家架构、多头潜在注意力、FP8 混合精度训练以及创新的“冷启动+强化学习”训练流程,展示了如何在降低成本的同时实现高性能模型。正是这些技术突破,为 AI 模型的高效训练和普及应用开辟了全新路径。未来,我们有理由期待,随着这些技术的不断成熟和推广,整个 AI 行业将迎来一场由高效、低成本驱动的革命,为更多企业和个人提供强大而便捷的智能工具。
2025-03-22 09:38:36
2391
原创 一文搞懂大模型微调原理以及使用方法
微调是指在预训练模型的基础上,使用特定领域或任务的数据进一步训练模型,使其能够更好地适应特定应用场景的过程。大型语言模型如GPT、BERT和LLAMA通常经历两个主要阶段:预训练和微调。预训练阶段,模型在海量通用文本数据上学习语言的基本特性和规律,掌握语法结构、常识知识和推理能力等。而微调阶段则是针对特定任务或领域进行"定制化训练",使模型能够更精准地理解和生成特定领域的内容。
2025-03-21 10:25:16
972
原创 一文读懂DeepSeek R1论文中的三大科研创新成果!
DeepSeek-R1-Zero是首个完全依赖大规模强化学习(RL)训练的大型语言模型(LLM),无需任何监督微调(SFT)阶段。该模型通过RL算法()自主演化出复杂的推理行为,包括自我验证、反思和生成长链思维(CoT),打破了传统依赖海量标注数据的训练范式。GRPO算法省去了通常与策略模型同等大小的评价模型(Critic Model),并通过群体得分来估算基准(Baseline)。而奖励是训练信号的来源,决定的RL优化的方向,那么R1-Zero采用的是什么奖励规则呢?
2025-03-21 09:31:58
925
原创 来不及了!最稳定的deepseek免费入口...
超越o1,吊打GPT!近期可谓是风头正盛,各行各业都在激烈讨论其广泛的应用价值。可奈何各种因素限制,如此强大的模型在官网上,不禁令人抓耳挠腮。
2025-03-20 09:44:08
414
原创 DeepSeek大模型原创核心技术解读
具体而言,DeepSeek-R1与Llama3.1相比,“智力水平”得分高出近一倍,具备更精准的理解、更强的创造力、更可靠的决策支持、更自然的交互、更强的学习能力,以及更高效的工作表现。安全度测评发现,DeepSeek-R1在伦理道德、偏见歧视方面的得分总体高于Llama3.1,而在高强度对抗测评数据集中,由于DeepSeek-R1呈现了深度思考和推理的完整过程,在此过程中导致有害内容的输出,存在需要补强的安全缺陷。具体是向小模型输入大量大模型解决问题的示例,使小模型学习大模型的推理和决策方式。
2025-03-20 09:40:47
982
原创 DeepSeek+AI论文写作系统,帮学生快速拿捏论文初稿!
凌晨三点还在死磕第 8 版初稿,咖啡续到第 5 杯,导师的批注依然满屏飘红 ——“逻辑断裂”“核心议题模糊”“文献关联性不足”…… 这场景是不是过于熟悉?更窒息的是,6月份答辩的DDL(最后期限)正在以肉眼可见的速度逼近!眼睁睁地看着还没写完的论文,学生们除了干着急却没有别的办法!别着急,王炸来了!DeepSeek+AI论文系统,这两个任选其一都可以帮学生大幅提升论文写作效率!首先是DeepSeek, 作为最近炙手可热的国产大模型,结合学术论文提示词即可提升学生们的写作效率!
2025-03-19 10:55:46
630
原创 大模型“特工”时代来了!一个你可能错过的重磅消息
Anthropic公司最近提出了一个新定义:特工型LLM是一种能动态自主地决定自己的任务流程和工具使用方式,并始终掌控任务进展的系统。对比之下,目前广泛流行的“工作流”(Workflow)式的AI,比如最近爆红的Manus AI,本质上就是一套预先设计好的规则与Prompt脚本:模型始终被锁定在固定的思维路径上,只能机械执行预设的指令。一旦遇到意外或新奇的任务,它们就很容易卡顿,甚至彻底“迷失方向”。工作流式LLM遇到问题时的表现是:“哎呀,这题我没见过,我放弃了!
2025-03-19 10:50:20
501
原创 图解 LangChain,刷完文档只为你构建AI应用
管理模型调用处理上下文记忆连接外部数据源构建智能代理系统玩转 LangChain,从"我想做个AI应用"到"看我做出来了"只差这篇文章的距离。来试试?说不定下个爆款AI应用就是你做的!
2025-03-18 09:51:50
863
原创 零代码基础也能玩转AI!老师用DeepSeek三分钟打造趣味随机点名系统,课堂氛围UP!
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。生成成功啦,点击开始就可以开始随机点名,需要优化的地方可以继续跟Deepseek对话,比如:我希望界面更好看,我希望加上倒计时的功能等。
2025-03-18 09:46:19
777
原创 RAG新SOTA!港中深发布Graph-based RAG统一框架,深度评估现有Graph-based RAG框架!
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。4、检索与生成阶段,首先将用户输入的问题转化为检索原语,通过配置好的操作符从图中检索信息,再与问题一同输入 LLM 生成答案。
2025-03-17 10:39:10
606
原创 DeepSeek蒸馏技术学习笔记
DeepSeek 的蒸馏技术本质是"授人以渔"的过程,通过系统性优化,让小模型既能保持轻量化,又能继承大模型的"内功心法"。这种技术不是简单的模型缩小,而是对知识的重新编码和高效传递。
2025-03-17 10:36:01
1049
原创 深度探索:Deepseek-r1、Tavily 与 LangGraph 的推理和递归检索技术融合
DeepSeek-R1(Paper Review: DeepSeek-R1——强化学习驱动的大语言模型推理能力提升)模型的发布标志着推理能力的显著提升。这款基于强化学习的开源推理模型不仅在数学、代码和自然语言推理任务上表现出色,还通过其独特的递归检索与推理能力,为信息检索增强生成(RAG)系统带来了革新。本文将深入探讨DeepSeek-R1与Tavily、LangGraph等技术结合,在实现复杂查询处理和高级信息检索方面的潜力与应用。
2025-03-15 09:45:00
901
原创 DeepSeek-R1|集智百科
实验结果是,大规模强化学习后得到的版本,DeepSeek-R1-Zero-Qwen-32B,与目前32B最强的推理模型QwQ-32B-Preview能力相似,然而从Deepseek-R1蒸馏得到的DeepSeek-R1-Distill-Qwen-32B表现却远超前两者。对用于提升其推理能力的数据,可以遵循DeepSeek-R1-Zero的方法获得,而用于提升有用性和无害性的数据,就需要收集模型对于prompt的回答并人工分析,标注出有害部分的数据,使用这些标注好的数据去做强化学习。
2025-03-14 10:27:17
754
原创 颠覆智能助手的游戏规则!LangGraph MCP助你构建通用AI助手!
但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。
2025-03-14 10:15:17
909
Java架构面试真题Spring篇
2020-04-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人