- 博客(1196)
- 收藏
- 关注
原创 DeepSeek-V3.1震撼发布,全球开源编程登顶!R1/V3首度合体,训练量暴增10倍
DeepSeek-V3.1官宣了,作为首款「混合推理」模型,将开启智能体新时代。新模型共有671B参数,编码实力碾压DeepSeek-R1、Claude 4 Opus,登顶编程开源第一。官宣了!刚刚,DeepSeek正式上线DeepSeek-V3.1,这是迈向智能体时代第一步。新版V3.1采用了「混合推理」,一个模型,两种模型:思考与非思考(自主切换)。
2025-08-22 11:53:34
198
原创 【AI大模型】一文详解Transformer 模型工作流程,零基础小白收藏这一篇就够了!!
Transformer 在翻译时,会对每一个词进行处理,判断它和句中其他词的相关性(注意力)。这就需要 Q、K、V 三个向量来建模这种「相关性」。假设我们现在在翻译“book”,模型要知道“book”与其它单词(比如“the”、“is”、“on”)的关系,这时就引入了 Q、K、V 向量:
2025-08-22 11:34:16
465
原创 AI大模型微调之后还能做什么?一文讲清后训练,收藏这一篇就够了!!
本文探讨了后训练的重要性、方法以及最新进展。文章将包含理论分析与实际操作指南,适合希望深入了解并应用这些技术的开发者。什么是后训练?后训练(Post-Training)是指在预训练模型的基础上,针对特定的任务或数据集进行额外的训练。这个阶段通常涉及到微调(Fine-tuning)和对齐 (Alignment),即调整预训练模型的参数以适应新的任务。
2025-08-22 10:53:03
380
原创 AI Agent 核心原理全拆解:LLM 如何通过工具、记忆与规划实现自主智能?
我发现独立Agent一般都“高调登场”,尽其所能向全世界宣布“我来了!”而大厂现有产品中的Agent功能上线普遍比较“低调”,一定会经过长时间的内测、灰度,才会小范围上线,例如“淘宝AI万能搜”至少是在半年前就听说在做,至今才上线。
2025-08-21 14:28:38
427
原创 【AI大模型】一文了解提示词、提示词工程和上下文工程,收藏这一篇就够了!!
单纯的提示词 -> 不满足于生成的效果。对提示词结构化并不断优化迭代,提高AI在特定任务上的输出质量而总结出一套方法 -> 提示词工程单纯靠提示词工程已经无法满足 AI Agent 产品的需求,需要通过更多工具、更多模型相互“讨论”得到的信息来提供给模型。-> 上下文工程。
2025-08-21 11:57:41
413
原创 一文搞懂大模型的知识蒸馏(Knowledge Distillation),零基础小白收藏这一篇就够了!!
你刚买了最新的iPhone,兴奋地想要在手机上运行GPT、Qwen、DeepSeek等主流大模型。然而现实却给了你一记重锤——即使是最强的手机芯片,也根本跑不动那个拥有1750亿参数的庞然大物。能不能让小模型拥有大模型的智慧?这就是知识蒸馏要解决的问题。就像武功传承一样——让高手(大模型)把经验传授给徒弟(小模型)。
2025-08-21 11:03:52
206
原创 【Dify实战】Dify 工作流一键生成发票申请预览,对接开票系统超简单,建议收藏!!
发票申请单是指企业在进行交易或服务提供时,向税务机关或指定机构申请开具发票的正式文件或流程。它通常用于记录交易信息、申请人信息、发票类型、金额等关键内容,以确保交易的合法性和合规性。
2025-08-20 14:40:52
533
原创 【大模型实战】手把手从 0 到 1 带你搭建 LLM 智能简历筛选 Agent 系统,建议收藏!!
招聘流程中的简历筛选是核心环节。传统方法严重依赖人工,效率低下且容易遗漏。本文将尝试设计和实现一个基于LLM的智能简历匹配系统,通过多维度多层次的评估,理解真实的招聘需求,实现自然语言交互的、智能化、可量化的简历筛选过程。
2025-08-20 11:46:26
394
原创 【DeepSeek实战】Dify + Ollama 搭建本地大模型全攻略,包含详细步骤、踩坑记录与经验总结,帮你少走弯路
本文记录了我在本地用 Dify 调用 Ollama 里的 DeepSeek 大模型 的全过程,包含详细步骤、踩坑记录与经验总结,帮你少走弯路。
2025-08-20 10:53:41
644
原创 【大模型实战】本地 OLLAMA 向量 + 插件外挂知识库,RAG 体验翻倍提升!建议收藏!!
当下,⼈⼯智能市场迎来了爆发期,并逐渐进⼊以⼈⼯通⽤智能(AGI)为主导的新时代。企业纷纷官宣“ AI+ ”战略,为新兴技术⼈才创造丰富的就业机会,⼈才缺⼝将达 400 万!DeepSeek问世以来,生成式AI和大模型技术爆发式增长,让很多岗位重新成了炙手可热的新星,岗位薪资远超很多后端岗位,在程序员中稳居前列。
2025-08-19 11:36:32
469
原创 【新手友好版】手把手教你用 LangGraph + Qwen 打造属于你的聊天机器人,建议收藏!!
本文手把手教你用 LangGraph 和通义 Qwen 大模型,快速实现一个能“记住你说过什么”的中文对话机器人。代码简单,思路清晰,适合任何想入门 AI 聊天机器人的朋友。
2025-08-19 11:11:27
908
原创 【最强总结】39种Dify常见报错及解决方案汇总,看到就是赚到,建议收藏!!
Dify 作为一个强大的开源 LLM 应用开发平台,在安装部署、插件开发、日常运维及 API 调用等环节中可能会遇到各种问题。本指南旨在全面梳理 Dify 用户的常见错误,提供详尽的报错信息、问题分析及解决方案,帮助开发者快速定位并解决问题,提升开发效率与使用体验。
2025-08-18 22:14:09
723
原创 【AI大模型】图解8种 RAG 架构设计,超级详细且生动,小白看了也能轻松学会!!
本文通过图解的方式详细剖析 RAG 的8种架构:简单 RAG、多模态 RAG、HyDE、校正型 RAG、图 RAG、混合 RAG、自适应 RAG、智能体型 RAG。
2025-08-18 21:50:29
645
原创 谷歌出品!详解“小而美” 的LangExtract:轻量却强大的结构化信息提取神器
在数据驱动的时代,大量有价值的信息隐藏在非结构化文本中—比如详尽的临床记录、冗长的法律文件、大量客户反馈与评价等。很多时候我们需要把其抽取成更结构化的内容。这是因为结构化信息:更易于被索引与查询、更适合统计分析与挖掘,也更易于被软件集成(RPA、API、工作流等)。
2025-08-18 21:06:41
545
原创 一文带你搞懂!AI 本地部署中的 ollama 是什么?零基础小白收藏这一篇就够了!!
Ollama 是一个开源工具,专为在本地计算机上高效运行大型语言模型(LLM,如 deepseek-r1、qwen2.5 等)而设计。它简化了模型的下载、部署和管理流程,让用户无需复杂配置即可在本地体验和开发基于大语言模型的应用。
2025-08-17 08:00:00
788
原创 打工人狂喜!DeepSeek 竟能一键生成 Word/PDF/Excel 文档!!
Word、Excel、PDF这三个,简直是我们打工人的日常标配,平时用DeepSeek时,我都习惯手动复制内容到Word,再调整格式,总感觉有些麻烦。不过最近写文章时发现,DeepSeek 生成的内容是可以直接导出为 Word、PDF、Excel 格式的文档,这实用性直接拉满了!
2025-08-16 11:44:17
927
原创 在AI大模型时代如何拥有属于自己的知识库?本篇文章带你快速搭建,建议收藏!!
知识库就是一个专门为 AI 建立的结构化的、易于查询的信息仓库,它不是 AI 大脑里死记硬背的东西,而是放在外面随时可以查阅的“参考书”。值得注意的是你可以随时往这个图书馆里添加新书(新知识)或者撤下旧书(过时知识),而不需要重新训练整个 AI 模型(这通常很贵很费时)。
2025-08-16 11:24:21
726
原创 如何在企业中找到Ai落地的场景?看完这篇文章你就知道了!建议收藏!!
企业中,哪些地方适合用Ai来落地呢?下面是我自己门店在探索Ai落地时的一些心得,主要是找到3个关键的场景:
2025-08-16 10:51:16
512
原创 【小白必看】一文详解大语言模型(LLM)相关术语Transformer、GPT、Bert、预训练、微调、深度学习、Token,建议收藏!
大语言模型(LLM,Large Language Model):字面意思,就是“规模很大的语言模型”。它能像人一样理解文字、生成文字,甚至做简单推理(比如“因为下雨,所以出门要带伞”)。深度学习(Deep Learning):LLM的“底层技术”,模仿人脑神经元的工作方式,用多层“神经网络”处理信息。就像多层滤网,一层一层提炼数据里的规律。
2025-08-15 11:59:08
794
原创 AI 应用开发,还需要意图识别吗?看完这一篇你就知道了!!
在大语言模型(LLM)快速发展的今天,传统的意图识别技术面临着新的挑战和机遇。本文将深入分析意图识别在不同应用场景下的必要性,探讨 LLM 对传统意图识别的影响,并从技术维度和场景维度提供实用的技术选型和实施建议。
2025-08-15 11:37:50
820
原创 收藏=学会!20张图说透大模型应用架构!小白也能看懂的AI落地指南,快学起来!!
当下,⼈⼯智能市场迎来了爆发期,并逐渐进⼊以⼈⼯通⽤智能(AGI)为主导的新时代。企业纷纷官宣“ AI+ ”战略,为新兴技术⼈才创造丰富的就业机会,⼈才缺⼝将达 400 万!DeepSeek问世以来,生成式AI和大模型技术爆发式增长,让很多岗位重新成了炙手可热的新星,岗位薪资远超很多后端岗位,在程序员中稳居前列。
2025-08-15 10:39:34
453
原创 一文讲清不同段位的RAG该如何选择?零基础小白收藏这一篇就够了!!
当下,⼈⼯智能市场迎来了爆发期,并逐渐进⼊以⼈⼯通⽤智能(AGI)为主导的新时代。企业纷纷官宣“ AI+ ”战略,为新兴技术⼈才创造丰富的就业机会,⼈才缺⼝将达 400 万!
2025-08-14 19:23:26
436
原创 AI大模型从检索到行动,Agentic RAG让大模型真正“干活”的技术全解,建议收藏!!
听说过 RAG 吗?你可能觉得:“挺酷,能帮我找资料。” 没错——但这只是故事的一半。现在登场的是 Agentic RAG。与传统 RAG 不同,它不仅能 检索信息,更能 把信息用起来,帮你把事情真正搞定。我们用最通俗的语言拆解一下。
2025-08-14 19:05:03
752
原创 CrewAI vs LangGraph:多智能体编排该选谁?一篇讲清,小白也能懂!
CrewAI 和 LangGraph 都是智能体编排相关的开源框架,前者采用代码优先的编排方式,后者则提供可视化编排能力。
2025-08-14 11:50:02
861
原创 【AI开发必看】告别“搜不到、搜不准”,用这套查询优化,让你的RAG检索召回率飙升,看到就是赚到!!
在AI的世界里,有句老话叫“Garbage In, Garbage Out”。对于RAG系统而言,检索环节就是那个“In”,如果检索不到精准、全面的信息,那么即便是最强的LLM也只能望“材”兴叹,甚至开始一本正经地“胡说八道”,俗称产生幻觉。 本篇将聚焦于检索前和检索中的优化,从数据的源头和查询的入口解决“找不到”和“找不准”的核心痛点。
2025-08-13 14:06:46
829
原创 AI大模型面试真题:如何量化评估大模型输出稳定性(Consistency)?
如何量化评估大模型输出稳定性(Consistency)?大模型输出稳定性,就是“对同一个问题,回答是不是一致”。比如问“1+1=?”,第一次答“2”,第二次答“3”,就不稳定;如果每次都答“2”,就稳定。量化评估就是“用数字衡量稳定性”,避免主观判断。
2025-08-13 11:31:55
899
原创 【AI大模型】深入浅出讲解LangChain核心概念“链”,零基础小白收藏这一篇就够了!!
本期分享我们一起来学习LangChain最核心思想——搭建Chains,也就是所谓链式调用的核心方法。顾名思义,LangChain之所以被称为LangChain,其核心概念就是Chain。只要掌握了Chain的搭建方法,我们就掌握了LangChain搭建智能体的核心技巧。
2025-08-13 10:48:17
548
原创 做了两年AI Agent,我发现99%的AI Agent项目都死在了Message Flow设计上
最近和几个AI创业的朋友聊天,发现一个有趣的现象:大家都在搞Agent,但聊起具体实现时,基本都在Message Flow这个环节栽过跟头。说实话,我自己也踩过这个坑。两年前刚开始做Agent产品时,觉得不就是让模型调用几个API嘛,有多难?结果发现,真正的难点不在模型调用,而在于如何设计一个稳定、可扩展的消息流架构。今天想跟大家聊聊这个话题,算是给准备入坑或者正在坑里的朋友们一些参考。
2025-08-12 13:41:56
980
原创 为什么你的模型不听使唤?可能少了这一步:监督微调(SFT)零基础小白收藏这一篇就够了!!
微调按照训练的参数范围可以分为全参数微调(Full Fine-Tuning)和部分参数微调(Partial Fine-Tuning)。参数高效微调PEFT(Parameter-Efficient Fine-Tuning)则是一系列具体的高效微调的方法和策略,有的资料中直接分为了全参数微调和高效参数微调两类。
2025-08-12 11:11:05
718
原创 Prompt 已经卷不动了!AI Agent 落地的真正卡点,90% 人都搞错了
随着LLM性能的进步,人们不再需要为了想出一个像咒语一样的prompt而绞尽脑汁了。但是,随着Agent的发展和任务场景的高度复杂化,如何把正确的信息给到LLM,已经不再是一件显而易见的事情。我们的挑战逐渐从“如何写好一个prompt”,升级成为了“如何为Agent的每一步,动态组装一个正确、完整且高效的Context”。
2025-08-12 10:30:01
640
原创 【RAG落地利器】向量数据库Weaviate部署与使用教程,看到就是赚到,建议收藏!!
Weaviate 是一种开源的向量搜索引擎数据库,允许以类属性的方式存储 JSON 文档,并将机器学习向量附加到这些文档上,以在向量空间中表示它们。Weaviate 支持语义搜索、问答提取、分类等功能,并且可以通过 GraphQL-API 轻松访问数据。
2025-08-10 08:00:00
1548
原创 一文告诉你AI模型训练到底在训练什么!零基础小白收藏这一篇就够了!!
AI 模型训练是指通过数据驱动的方式,让人工智能(AI)系统从经验中学习,以便在给定的任务上进行预测、分类或生成等操作。这个过程通过优化模型的参数(如神经网络的权重和偏置)来最小化预测误差或损失,从而使模型能够在新数据上做出准确的判断,本文将介绍AI模型中神经网络和神经元的构造,以及AI训练的原理。
2025-08-09 08:00:00
1118
原创 【喂饭教程】一文详解AI大模型Agent智能体设计范式,从小白到入门,收藏这一篇就够了!!
在2024年红杉资本人工智能峰会上,著名的人工智能专家吴恩达发表了一场备受关注的演讲,深入探讨了智能代理(agent)的四大范式。这四大范式代表了当前AI技术在不同应用领域中的核心方法和实践,分别是反思(Reflection)、工具使用(Tool Use)、规划(Planning)和多代理协作(Multi-Agent)。
2025-08-08 11:42:02
472
原创 从单Agent到多Agent:面向领域场景的React框架设计与演进,收藏这一篇就够了!!
基于大模型的领域场景开发,说到底无非是借助基座模型对语义的理解推理能力,将通用AI变为专有AI工具的过程。但仅仅只做模型调用,来实现复杂类需求,对生产力的提升并没有太大帮助。因此在围绕提升研发生产力的过程,从大模型问世到现在,卷出了各种大模型工程规范。从最早的提示词工程到RAG,再到流程编排模式,每个阶段无疑都是对研发生产力的不断提升。
2025-08-08 11:17:26
724
原创 【打工人神器】用Coze工作流一键分析表格并生成可视化图表,别太好用!!
你是不是也经常遇到这种情况:领导突然让你根据几份excel做个数据分析,还要配上各种高大上的图表还要提供一份报表?面对满屏密密麻麻的表格数据时,你是不是也常犯迷糊?明明花了两小时整理得整整齐齐,领导扫一眼就问:“核心增长点在哪?”;熬了大夜做的报表,客户翻两页只说“太复杂,说重点”其实数据不会说谎,但藏在表格里的“黄金信息”,这时候就需要使用到图表去可视化展示数据
2025-08-08 10:22:16
808
原创 【AI大模型实战】AI记忆太短?Dify实战帮你实现长记忆对话!全程干货,小白也能学会
Dify 的对话长期记忆,本质是把机器的 “无差别响应” 变成人的 “专属服务”。现在,打开 Dify 工作台,拨动那个记忆滑块,让你的 AI 助手真正 “活” 起来吧 —— 毕竟,谁会喜欢和一个 “健忘症患者” 聊天呢?
2025-08-07 14:14:26
998
原创 告别“喂”数据时代:MCP-Zero让Agent主动调用工具,节省98%算力,看到就是赚到!!
当AI需要“外挂”(工具),麻烦来了!想象一下,你家的超级AI助手ChatGPT不仅会聊天写诗,还能帮你订外卖、查股票、改代码!这靠的是让它调用外部工具(API),就像给它装上了“外挂”。但问题来了:现在“外挂”成千上万,怎么告诉AI哪个能用呢?
2025-08-07 11:50:54
711
原创 99%的人没真懂Transformer绝对位置编码,看完这篇文章你就能超越他们!!
Transformer 模型的自注意力机制是其核心组件,极大地推动了自然语言处理领域的发展。然而,自注意力机制具有排列等变性(permutation-equivariant),即无论输入序列的词元顺序如何变化,输出的表示保持一致。这意味着,模型无法天然区分序列中相同词元在不同位置的独特含义。
2025-08-07 11:01:19
735
原创 【AI大模型入门教程】手把手带你从 0 到 1 搭建基于 LangGraph 的 AI Agent,零基础小白收藏这一篇就够了!!
今天我们将引入当前 Agent 生态中非常热门的框架——LangGraph。它基于“有向图”模型,将 Agent 的运行流程抽象为“节点 + 状态流转”,具备结构清晰、易扩展、原生支持多工具/多轮调用等显著优势。通过与上一节手写 Agent 的对比学习,你将切实体会到:借助 LangGraph,我们可以用更高效、更优雅的方式构建复杂智能体系统。
2025-08-06 19:04:54
980
原创 【AI大模型】看完这一篇帮你将你的 RAG 检索召回率从 50% 提高到 95% 以上!收藏就对了!!
在本文中,我会分享一些改进 RAG(检索增强生成)应用程序中检索的出色技术。最近在一个客户项目中使用了这些技术,将系统的召回率从大约 50-60% 一直提高到 95% 及以上。召回率对于任何 RAG 应用程序来说都是一个非常重要的指标。它虽然只是衡量检索系统为给定用户问题进行搜索或找到正确文档的能力。但是,这会强烈影响生成的结果的好坏——无论我们是在构建聊天机器人还是其他类似的应用。
2025-08-06 13:55:55
772
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人