自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1033)
  • 收藏
  • 关注

原创 MCP 和 Function Calling 架构设计对比剖析

Function Calling 是一种强大的工具,它为大语言模型提供了与外部工具和服务交互的能力,从而解决了大模型知识更新停滞的问题。然而,它的局限性在于缺乏跨模型的一致性和平台依赖性。尽管如此,Function Calling 仍然是一个重要的技术,尤其是在需要快速实现特定功能时。未来,随着技术的不断发展,我们期待看到更多能够克服这些局限性的解决方案。

2025-06-13 11:04:30 618

原创 来了来了!爆火AI工具Dify怎么玩?这绝对是全网最详细的教程(下)

承接上一篇《来了来了!爆火AI工具Dify怎么玩?这绝对是全网最详细的教程(上)》,今天继续给大家详细介绍下Dify如何使用。先回顾上一篇都讲了什么:1、Dify的安装和启动2、使用Dify前的一些必要配置。3、Dify核心功能介绍。4、知识库实战1:如何在Dify中创建知识库5、知识库实战2:如何在Dify中外连知识库RAGFlow6、智能体实战1:最简单的聊天模式7、智能体实战2:Agent模式8、智能体实战3:整合MCP下面继续开启智能体的其他实战部分。

2025-06-12 10:44:45 721

原创 为什么说,2025年是产品经理加入AI赛道的最佳时机?(附福利)

在AI的浪潮中,不懂AI的产品经理,终将成为时代的旁观者!1AI时代,产品经理的核心竞争力是什么?嗨,作为产品经理,并且还没被辞退的小伙伴们,现在每天上班都在干嘛呢?还在画原型吗?来看看这款“滴滴打人”产品的界面,让你设计的话,你需要多久?什么,你告诉我,作为一个初级产品经理,你需要搞一天?作为一个高级产品经理,你需要搞俩小时?然而,在AI时代,请问,你还怎么混。。。好,你说产品设计那是大学刚毕业的时候搞玩意,太low了,你的核心技能是你告诉我,你是怎么分析的?

2025-06-10 11:54:05 636

原创 大模型微调(fine-tune)最强学习笔记,看这一篇轻松拿下大模型微调!

PEFT(Parameter Efficient Fine-Tuning):只训练大模型的极少数参数:将大模型的参数固定住,添加少量的需要学习的参数,极大地降低训练成本。下图是PEFT模型微调方法的类型,本文中介绍的是图中最后一个微调方法:低秩微调方法 LoRA(Low-Rank Adaptation)

2025-06-10 09:00:00 855

原创 Qwen3深夜开源新系列:文本表征模型,3种尺寸可选,超越商业API拿下SOTA

它专为文本表征、检索与排序任务设计,旨在将文本(如句子、段落)转换为高质量的向量表示,以便在语义搜索、问答系统、推荐引擎等应用中更有效地处理和理解自然语言。可用于等任务。它在Qwen3基础模型上训练而来,充分发挥Qwen3的多语言优势。一共有0.6B/4B/8B三种尺寸,,性能超越一众商业API服务。有人就表示,0.6B版本不就是为了手机RAG准备的吗?期待苹果WWDC了。今年阿里巴巴确认与苹果合作,承接Apple Intelligenc在中国的服务。

2025-06-09 21:34:49 632

原创 一文讲清楚大模型中6个关键词及原理:LLM、Transformer、Bert、预训练、微调FineTuning、机器学习

大语言模型(large language model,LLM,简称大模型)是一种用于理解、生成和响应类似人类语言文本的神经网络。这类模型属于深度神经网络(deep neural network),通过大规模文本数据训练而成,其训练资料甚至可能涵盖了互联网上大部分公开的文本。大语言模型在理解、生成和解释人类语言方面拥有出色的能力。当我们谈论语言模型的“理解”能力时,实际上是指它们能够处理和生成看似连贯且符合语境的文本,而这并不意味着它们真的拥有像人类一样的意识或理解能力。

2025-06-09 21:28:51 742

原创 从零开始构建大模型:LLMs-from-scratch(附PDF)

这本书通过清晰的文字、图表和实例,详细解释了构建大型语言模型的每一个阶段,从最初的设计和创建,到使用通用语料库进行预训练,直至针对特定任务进行微调。书中具体讲解了如何规划和编码LLM的所有部分、准备适合LLM训练的数据集、使用自己的数据微调LLM、应用指令调整方法来确保LLM遵循指令以及将预训练权重加载到LLM中。

2025-06-05 11:54:59 985

原创 4份Agent必读报告:从技术路线、落地实践到主流厂商全景图

AI Agent是一种具有自主性或半自主性的智能实体,能够利用人工智能技术在数字或物理环境中感知、决策、采取行动并实现目标。与Copilot、聊天机器人等相比,AI Agent能够自主规划和行动,实现用户预设的目标。伴随着人工智能技术的迭代,AI Agent也经历了多个发展阶段。从2024年开始,基于大模型(主要是指“大语言模型LLM”)的AI Agent正在成为企业落地AI应用/解决方案时的必备功能。2025年是“智能体元年”,AI Agent将迎来规模化落地浪潮。

2025-06-04 12:08:54 1060

原创 6000字!混合专家模型中的Top-k策略:原理、公式与优化

混合专家模型(Mixture of Experts,MoE)是一种基于分而治之策略的机器学习架构,它将复杂的任务分解为多个子任务,每个子任务由一个专家网络(Expert Network)负责处理。这些专家网络通常是深度神经网络,它们在训练过程中学习如何处理特定类型的输入数据。混合专家模型的核心在于如何选择和组合这些专家网络的输出,以达到最优的性能。混合专家模型的基本架构包括三个主要部分:专家网络、门控网络(Gating Network)和混合层(Mixture Layer)。

2025-06-04 12:03:36 567

原创 【万字长文】大模型开源开发全景与趋势解读

当我们看到这些数据趋势的时候,一个词浮现在我的眼前——黑客松(Hackathon),AI 领域的项目,快速地出现、快速地停更,他们似乎在做一场真实市场里的黑客松,那么,什么领域涌现了最多项目,哪些方面是停更的重灾区,哪些项目幸存了,激烈竞争的项目们如今怎么样了,我们都尝试着在这份趋势报告里叙述一二。从近十年来 AI、云原生、数据库、前端、操作系统这五大技术领域的发展曲线来看,AI 类项目在近些年得到了快速发展,尤其在 2022 年后发展迅猛。

2025-06-03 21:54:11 953

原创 AI应用实战:DeepSeek+Dify构建知识库、Agent、工作流与聊天助手

在我第一篇关于AI的文章中《[【AI】初体验AI大模型应用平台]》,我有简单提到Dify,那个时候对于Dify的理解是一款大语言模型的应用开发平台,就是类似一个微信的小程序开发平台,每个个体,每个公司都可以在上面开发属于自己的应用。最近深入了解之后,又对其有了更进一步的理解。昨天看到一个网友说"不会使用DeepSeek,那么这东西到普通人手里,就是百度Plus版",这么说也不无道理。

2025-05-31 08:00:00 535

原创 AI大模型赋能:构建智能化企业知识库

在AI大模型的赋能下,企业知识库正迎来前所未有的发展机遇。通过深入理解知识库的价值、选择合适的AI大模型、制定合理的建设步骤和策略以及持续优化和维护知识库,我们可以打造一个高效、智能、安全的企业知识库,为企业的发展提供有力支持。希望我的分享能够为您在企业知识库建设过程中提供有益的参考和帮助。

2025-05-28 11:30:49 655

原创 大模型是什么?大模型可以在哪些场景应用落地?

大模型是什么?大模型是指模型具有庞大的参数规模和复杂程度的机器学习模型。在深度学习领域,大模型通常是指具有数百万到数十亿参数的神经网络模型。大模型是指模型具有庞大的参数规模和复杂程度的机器学习模型。在深度学习领域,大模型通常是指具有数百万到数十亿参数的神经网络模型。这些模型需要大量的计算资源和存储空间来训练和存储,并且往往需要进行分布式计算和特殊的硬件加速技术。大模型的设计和训练旨在提供更强大、更准确的模型性能,以应对更复杂、更庞大的数据集或任务。

2025-05-28 11:21:40 902

原创 知识图谱、大模型与幻觉:自然语言处理的视角

大型语言模型(LLMs)已经彻底改变了基于自然语言处理(NLP)的应用,包括自动化文本生成、问答系统、聊天机器人等。然而,它们面临一个重大挑战:产生幻觉,即模型生成听起来合理但实际上错误的内容。这削弱了信任,并限制了LLMs在不同领域的适用性。另一方面,知识图谱(KGs)提供了结构化的互联事实集合,以实体(节点)及其关系(边)表示。

2025-05-27 19:06:27 632

原创 一战封神还是虚火?Claude 4 对决 Gemini 2.5 Pro,谁才是你的下一个 AI 搭档?

尽管 Claude 4 的表现令人惊艳,但这仍是刚发布的产品,实际部署中还需更多场景验证。特别是上下文窗口管理、稳定性与企业 API 支持等方面,建议等待更多独立评测与长期使用反馈再下结论。现在,是时候结合你的使用场景,选择真正适合你的下一款 AI 伙伴了。

2025-05-27 18:08:00 945

原创 Stardog-基于知识图谱的企业级人机协同Agent智能体

以大型语言模型(LLM)为核心的智能代理需要通过知识图谱和本体获取民主化且高质量的企业数据,才能像人类一样有效且可靠地工作。然而,人类具备不可替代的责任感,这点机器无法企及。

2025-05-24 14:06:34 615

原创 斯坦福大佬笔记曝光!带你彻底搞懂 Transformer 与 LLM 大语言模型

想象一下你在阅读一句话:“我今天下午在公园里看到一只可爱的泰迪熊在看书。过去的模型(比如 RNN、LSTM) 就像一个眼神不太好的人,从左到右一个词一个词地读,读到后面的词就可能忘了前面的细节,而且一次只能处理一个词,效率不高。处理长句子时,它可能只记得“看书”,但忘了是谁在看书(泰迪熊)。Transformer 模型 就像一个拥有“全局视野”和“重点关注”能力的人。它能同时看到句子里的所有词,并且知道哪些词之间关系更密切。它会特别关注“泰迪熊”和“看书”之间的联系,即使它们在句子中隔了几个词。

2025-05-16 11:56:41 715

原创 新书速递|一口气上新 5 本!大模型重磅新作强势来袭!

大模型季度新书接踵而至,大模型领域的重磅好书即将登场!无论你是追求理论深度,还是渴望快速上手实战,这些即将上市的新书都会成为你大模型之路上的得力助手。准备好一探究竟了吗?✨重磅新作,即将上市:这 2 本书内容硬核,获得全网关注,值得提前锁定;🔥畅销新作,持续热卖:这 3 本书口碑极佳,销量持续飙升,不容错过!立即关注,跟随这些大模型新书一起快速成长吧!《图解大模型:生成式AI原理与实战》[沙特] 杰伊·阿拉马尔,[荷] 马尔滕·格鲁滕多斯特 | 著李博杰 | 译。

2025-05-15 15:06:35 630

原创 120页WORD方案 | 2025企业数字化转型AI大模型数字底座项目设计方案

这份文档是一份关于企业数字化转型AI大模型数字底座项目的设计方案,涵盖了从项目概述、业务需求分析到技术架构设计等多个方面。它详细阐述了企业为何需要构建AI大模型底座,以及如何通过这一底座实现智能化决策支持、业务流程优化和客户体验提升。方案中不仅分析了企业当前的数字化水平和业务痛点,还明确了AI大模型的应用场景和预期目标,比如在客户服务领域实现智能客服,在生产制造领域进行预测性维护等。

2025-05-15 12:07:53 634

原创 一文彻底看懂大模型MCP原理及应用

更通俗一点地讲之前大模型想接入各种不同的外部数据、工具都要有一一对应的“接头暗号”现在,MCP就像一个**“万能插座”**让各种需求都能通过标准化的接口和大模型对接实现“即插即用”MCP这个“万能插座”包含多个组件核心是。

2025-05-14 11:39:04 878

原创 大模型入门指南 - Prompt Engineering:小白也能看懂的“提示词工程”全解析

规避通用型废话,提升行业针对性,适用场景:法律文书生成、医疗报告撰写、营销文案创作。【角色】你现在是拥有10年经验的母婴电商运营。

2025-05-14 11:35:11 1372

原创 RAG-MCP:解决大语言模型工具选择中的提示膨胀难题

大语言模型(LLMs)在自然对话、推理甚至代码生成方面展现了卓越的能力。然而,它们本质上受到参数中编码的知识和在推理时可用的固定上下文窗口的限制。一个没有外部访问权限的LLM只能依赖其训练数据,无法轻松更新知识或执行超出其内置能力的操作。为了克服这一限制,最近的研究工作集中于通过外部工具和函数调用能力来增强LLMs。通过调用工具(例如网络搜索、数据库、计算器)通过定义的函数或API,LLM可以获取最新信息并执行超出其内置能力的复杂操作。

2025-05-13 12:00:00 687

原创 我们需要学会对大模型祛魅,大模型没有大家想象中的那么复杂

大模型虽然看起来很复杂,但我们只要具备工具思想,那么就可以轻松地玩转大模型。在对大模型的了解和应用过程中发现一个问题,就是很多人对大模型抱着神秘和高大上的想法;认为搞大模型的都是技术大拿或者高学历的精英人才,甚至有些人会认为大模型无所不能。但事实上,大模型没有大家想象中的那么神秘和复杂;大模型也有自己的能力边界,它也无法做到超出它能力范围的事;而且现在大模型也存在各种各样的问题,否则大模型技术就不再需要发展了。大模型祛魅首先从纯粹的技术理论来讲,大模型本身就是一个模仿人脑神经网络的数学模型;

2025-05-13 06:45:00 918

原创 零基础小白,三分钟入门智能体并学会用Coze搭建自己的第一个智能体(新手必看)

Coze是字节开发的一款智能体平台,拥有丰富的插件,各类资源丰富,用户居多,不需要任何编程基础,简单通过搭积木一样的拖、拉、拽就可以实现智能体的搭建。有人会有疑问,为什么选择Coze,不选择其他的百炼、讯飞、智谱等,选择Coze的原因主要还是人数居多,资源居多,作为刚入门的小白,自然还是以降低难度为主,如果后续对其他平台感兴趣,也可以去平台开发智能体,大体上是一样的。这里引用网上的一张图片,详细介绍了coze平台的优势。

2025-05-12 16:30:00 1849

原创 3分钟了解Coze!手把手教你零基础搭建专属AI智能体

简单来说,智能体就是一个超级聪明、能干活的AI小助手。它就像你请的“数字员工”,可以根据你设定的任务进行聊天、回答问题、处理信息,甚至实现自动化操作。例如,你可以拥有一个帮你推荐电影的AI,或是一个能自动整理新闻并发送到微信群的工具,这些都属于智能体的应用场景。智能体开发平台最早于2022年在国外出现,主要面向开发者,需要通过编程语言进行开发,技术门槛较高。随着平台不断进化,智能体开发逐渐向可视化、零代码方向发展。以国内的Coze为例,其在功能和生态等方面已经相当成熟。

2025-05-12 09:00:00 1588

原创 零基础Coze搭建AI智能体,小白也能学会的保姆级教程(新手必备)

有一天,老板需要你参考爆款小红书视频写一条文案,往常处理这个需求,就算你用AI工具,也需要多个流程:先用工具A把视频下载下来—再用工具B提取文案—把文案发给工具C参考撰写新的文案,这一套流程下来至少需要20分钟!

2025-05-10 11:56:58 990

原创 基于milvus向量数据库的相似度检索问题——稀疏-密集向量检索和混合搜索

不同的向量类型可能会得到不同的检索结果,因此需要根据不同的场景选择合适的检索策略相似度检索是目前人工智能领域一个非常重要的应用场景,其不仅仅应用于人工智能技术,同样应用于搜索技术;比如搜索引擎,电商搜索等多种技术领域。因此,向量数据库也成为现在技术领域不可缺少的一个中间件;虽然说向量检索主要就是进行向量计算,不管是余弦,还是欧式距离等算法,目的都是通过计算向量之间的位置关系来确定相似度。但这里就产生了一个问题,使用稠密向量和稀疏向量检索会得到不一样的结果;而使用混合搜索技术又会产生另一种结果。

2025-05-10 11:45:00 1088

原创 比清华版更全面、更落地?369页大任智库第3篇《DeepSeek+政务办公创新突围讲义精华全版》,一文速览!

DeepSeek+政务办公创新突围讲义精华全版》该文档由大任智库AI应用创新团队联合编写,聚焦政务智能化转型核心场景,提供从理论框架到实践落地的全景指南。,本篇为第3篇,涵盖AI大模型技术原理、政务场景应用案例、组织变革方法论等维度,旨在帮助政府机构构建智能化办公新范式。各章节内容主要如下:01 特征价值篇- 技术演进:解析信息化→网络化→智能化的三阶段技术跃迁,对比电子政务与智能政务的本质差异。

2025-05-09 11:56:39 765

原创 财务管理领域的AI智能体协作平台,重塑企业财务管理生产力

智能协作,重塑企业财务管理生产力。

2025-05-09 11:49:08 568

原创 火爆全网的厦大团队又出手,177页《DeepSeek等大模型工具使用手册》,质量如何大家自己来评!

介绍AIGC的基本概念、核心技术、发展历程及行业影响,解析其与大模型的关系,列举主流工具(如DeepSeek、文心一言等),并总结提示词设计技巧。

2025-05-08 11:39:07 1609

原创 多模态关系网络在金融风控中的应用和落地实践

导读本次分享的课题是多模态关系网络在金融风控中的应用和落地实践。*主要内容包括以下四大部分:*\1. 多模态关系网络在风控中的应用背景\2. 多模态关系网络关键技术\3. 风控中的应用案例\4. 总结与展望01多模态关系网络在风控中的应用背景关系网络也称之为社会网络,是人和企业、企业和企业,以及设备和设备等等之间的联系。关系网络在金融领域的应用非常广泛,基本上每家企业都会将关系网络应用于风控等场景中。传统的关系网络是基于人的基本信息、手机的基本信息等一些结构化数据,这些数据对识别风险的作用相对有限。用户在

2025-05-08 11:25:11 873

原创 斯坦福大学《2025年人工智能指数报告》

八大维度呈现 “创新极化、矛盾激化、融合深化” 特征:研发与技术领域,工业界与学术界、中美之间形成 “量质分野”;责任与经济领域,风险与机遇、投入与产出倒逼治理与转型;科医与政策领域,突破与布局重塑全球竞争规则;教育与公众领域,需求与认知推动体系与共识重构。未来需破解 “创新过剩” 与 “治理赤字”,构建技术、伦理、社会协同的共生生态,方能实现 AI 从 “工具革命” 到 “价值共建” 的跃升。

2025-05-06 14:45:06 1491

原创 如何微调你的第一个领域大模型?

微调(Fine-tuning)大模型,就像是给一个已经学富五车的大脑(预训练的基础大模型),

2025-05-06 11:55:59 845

原创 GNN-RAG:用于大型语言模型推理的图神经网络检索

Year: 2024大语言模型凭借其卓越的自然语言理解能力,已成为众多NLP任务的标杆技术。其核心能力源于对海量文本数据的预训练,从而习得通用的人类知识。然而,由于预训练成本高昂且耗时,LLM难以快速适应新知识或领域专有知识,且易产生“幻觉”。知识图谱以结构化形式存储信息,支持动态更新。KG通过图结构捕捉实体间的复杂交互(如多跳关系),广泛应用于知识密集型任务(如问答系统)。RAG通过向LLM输入上下文注入来自知识图谱(KG)的实时准确信息,缓解LLM的幻觉问题。:多跳问题需遍历复杂路径。

2025-04-18 11:19:10 872

原创 开源零标注Agent工业检测(附论文源码)

吴恩达团队最近开源的 Agentic Object Detection(AOD)技术通过智能代理(Agent)系统,实现了无需标注数据的目标检测。AOD 仅需用户输入文字提示,即可精准识别图像中的目标并定位其位置和属性。例如,用户可以输入指令“帮我找到图中所有未成熟的草莓”,其就会识别图像或视频中所有符合条件的目标。

2025-04-12 11:31:53 733

原创 吴恩达的翻译Agent项目,复现教程来了!

LangGraph是一个用于构建有状态、多角色应用程序的库,特别适用于与大型语言模型(LLMs)一起使用。它扩展了LangChain表达式语言,允许以循环方式协调多个链或角色,其灵感来源于Pregel和Apache Beam,并借鉴了NetworkX的接口。吴恩达老师的项目地址:https://github.com/andrewyng/translation-agentTranslation Agent 是一个基于大型语言模型(LLM)的翻译工具,它采用反思工作流来提升翻译质量。

2025-04-12 11:31:15 993

原创 多智能体协作困境如何破解?谷歌 A2A 协议让 AI 代理“无障碍沟通“

多智能体系统是由多个能够感知环境、做出决策并相互协作的智能代理组成的网络。例如,在智能工厂中,不同 AI 代理分别负责生产调度、质量控制和设备维护,共同优化整体运营。

2025-04-11 14:16:39 1085

原创 一文搞懂大模型数据标注(Label Studio)

* Label Studio是一个开源的数据标注和数据管理平台,由Human Signal开发并维护。它旨在提供一个直观、灵活且可扩展的平台,**

2025-04-11 12:03:04 1954

原创 一文带你了解RAG(检索增强生成) | 概念理论介绍+ 代码实操

RAG(Retrieval Augmented Generation, 检索增强生成)是一种技术框架,其核心在于当 LLM 面对解答问题或创作文本任务时,首先会在大规模文档库中搜索并筛选出与任务紧密相关的素材,继而依据这些素材精准指导后续的回答生成或文本构造过程,旨在通过此种方式提升模型输出的准确性和可靠性。RAG 技术架构图介绍:富文本 主要存储于 txt 文件中,因为排版比较整洁,所以获取方式比较简单【版面分析——富文本txt读取】

2025-04-10 11:38:09 870

原创 Java + LangChain = 王炸!

在本教程中,我们将详细探讨。

2025-04-09 11:59:46 946

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除