自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

老皮的博客

一位在移动开发领域苦苦前行者

  • 博客(976)
  • 收藏
  • 关注

原创 DeepSeek新手必看!全功能详解与实操指南

对于有特定需求的用户,DeepSeek还支持上传文件建立自定义知识库。将与自己工作、学习相关的文档、资料上传后,DeepSeek就能基于这些知识为你提供更个性化、针对性更强的回答和建议。例如,企业用户可以上传公司的内部规章制度、业务资料等,让DeepSeek成为企业内部的智能助手;学生可以上传自己的学习笔记、专业文献等,帮助自己更好地学习和复习。

2025-02-05 18:05:20 19145

原创 一文带你搞懂什么是生成式人工智能(GenAI)

AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!

2024-11-13 11:43:32 7814

原创 工业大模型市场图谱:53个工业大模型全面梳理(通用、行业、场景大模型)看这一篇就够了!

AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!

2024-09-21 10:11:41 5486

原创 AI大模型之Prompt工程指南:什么是Prompt工程?Prompt工程的格式与要求

Prompt是一种基于人工智能(AI)指令的技术,通过明确而具体的指导语言模型的输出。在提示词工程中,Prompt的定义涵盖了任务、指令和角色三个主要元素,以确保模型生成符合用户需求的文本。Prompt明确而简洁地陈述了用户要求模型生成的内容。这包括在特定应用场景中,用户希望模型完成的任务或生成的文本类型。模型在生成文本时应遵循的指令是Prompt中的关键要素之一。这些指令具体规定了模型生成文本的方式,通过清晰的语言来引导模型以获得所需的输出。Prompt中还包括模型在生成文本时应扮演的角色。

2024-08-01 22:18:51 19494

原创 一文读懂AI Agent:什么是AI智能体?AI Agent的应用场景、AI Agent的未来趋势

想象一下,你的手机里住着一个“数字生命”——它能读懂你的聊天记录,预判你明天开会需要准备的资料;当你随口说“想周末去露营”,它能立刻筛选出适合的营地、打包行李清单,甚至根据天气调整计划。这就是:一个能感知环境、独立决策、主动行动的智能系统。整个ai agent具备以下能力。

2025-04-04 08:30:00 924

原创 大模型微调技术:监督微调、参数高效微调、基于人类反馈的强化学习微调

是机器学习中迁移学习的一种关键技术,指在预训练模型的基础上,针对特定任务或数据集进行进一步训练调整的过程。其核心在于利用预训练模型已学习到的通用特征,通过少量数据和计算资源,使模型适应新任务的特定需求。

2025-04-03 15:18:41 668

原创 一步步教你弄懂两大基础协议及工作原理,深入MCP Remote模式

既然是用来简化集成、提高互操作性的标准,首当其中的是消息协议。这就像一个国际交流会议,大家说相同的”语言“,效率才会更高。在MCP中规定了唯一的标准消息格式,就是JSON-RPC 2.0。JSON-RPC 2.0是一种轻量级的、用于远程过程调用(RPC)的消息交换协议,使用JSON作为数据格式。注意:它不是一个底层通信协议,只是一个应用层的消息格式标准。形象的说,就像两个人需要交换包裹,它规定了包裹应该如何打包、内部如何分区、如何贴标签等,但它不规定包裹如何运送。比如,你需要调用MCP Server上的一个

2025-03-31 22:31:40 570

原创 2025大模型就业 | 自然语言处理NLP就业方向指南(附自然语言处理书籍推荐)

自然语言处理(NLP,Natural Language Processing)是人工智能技术的一种,目的是让计算机能够理解、生成和处理人类的自然语言。作为人工智能的重要组成部分,NLP的应用场景很广,像智能客服、金融分析、舆情监控、医疗诊断、教育、内容推荐等领域都对NLP有旺盛的需求。由于NLP涉及到高端算法,所以相关岗位的薪资通常比较高,总体优于其他IT岗位。在一线城市、高科技公司和金融公司中,薪资优势更明显。具体到应届生,年薪范围大概在15~40万之间。

2025-03-18 15:46:28 1122

原创 大模型 | 告别Agentic工作流?推理模型+行动链学习=Agent模型

Agent 模型是在推理模型基础上通过端到端的面向任务的工具增强训练得到的。它能够自动生成耦合的CoT思维链和CoA行动链序列。其中每个动作调用工具与外部环境交互,交互得到的反馈指导后续的推理和动作,直至任务完成。Agent 模型增强了使用工具的能力,这要求模型不局限于自身内部的推理行为,而能与外部环境进行交互。Chatbot和Reasoner仅关注人与模型之间的二元交互。

2025-03-14 10:40:51 856

原创 KGGen用语言模型从纯文本中提取知识图谱

斯坦福最新工作KGGen【文献1】,利用大语言模型(LLM)从非结构化文本中自动生成高质量知识图谱,等于从LLM提取出语义。

2025-03-12 18:35:22 1058

原创 大模型论文 | 2025年十大必读RAG论文

RAG(Retrieval-Augmented Generation, 检索增强生成)正在迅速发展,变得更加高效、准确,最新的研究正为其未来发展奠定基础,越来越多的公司正在采用RAG来提升组织的性能和效率。在2025年2月发布的108篇与RAG相关的ArXiv论文中,我们精选了10篇最具影响力的研究。这些论文介绍了创新的RAG框架、改进的检索策略以及新的评估基准——不断优化AI如何整合外部知识,以实现更可靠、更具上下文感知能力且可扩展的生成。让我们深入了解这些突破性的研究!

2025-03-12 15:50:43 759

原创 大模型技术干货 | 深入浅出 AI 智能体(AI Agent)

随着人工智能技术的飞速发展,智能体(AI Agents)正逐渐成为人与大模型(如大语言模型)交互的主要方式。智能体是能够执行任务、解决问题并提供服务的 AI 系统,它们通过模拟人类的行为和决策过程,使得与大模型的交互更加自然、高效和个性化。智能体作为人与大模型交互的桥梁,不仅提高了交互的效率和质量,还扩展了大模型的应用范围。随着技术的不断进步,智能体将更加深入地融入我们的日常生活,成为不可或缺的智能伙伴。

2025-03-09 08:00:00 948

原创 大模型论文 | RAG vs. GraphRAG:谁才是 AI 问答的终极答案?

在查询摘要任务中,RAG 和 GraphRAG 的表现因任务类型而异。RAG 在多文档摘要任务中表现最佳,能够捕捉到更多的细节信息。例如,在 ODSum-story 数据集上,RAG 生成的摘要更接近真实答案,因为它直接从多个文档中提取关键信息。GraphRAG 则在全局摘要任务中表现更佳,能够生成更多样化和多角度的摘要。例如,在 QMSum 数据集上,GraphRAG 通过分析文档的全局结构,生成更全面的摘要,适合需要整体视角的任务。

2025-03-08 13:59:35 624

原创 大模型 | AI Agent设计模式:事件驱动

AI 代理即将通过自主解决问题、自适应工作流程和可扩展性彻底改变企业的运营模式。然而,真正的挑战并非构建更好的模型,而是如何让代理在复杂的系统中高效运行。代理需要访问数据、工具,并能够跨系统共享信息,其输出还需可供多种服务(包括其他代理)使用。这并非单纯的 AI 问题,而是基础设施和数据互操作性问题。我们需要的不仅仅是简单的命令链,而是一个由数据流驱动的事件驱动架构(EDA)。正如 HubSpot 首席技术官 Dharmesh Shah 所说:“代理就是新的应用。

2025-03-08 11:47:42 889

原创 深入理解RAG:什么是Embedding Model?Embedding Model的作用,RAG引擎中的工作流

在学习嵌入模型之前,我们需要先了解什么是Embedding。简单来说,Embedding是一种将离散的非结构化数据(如文本中的单词、句子或文档)转换为连续向量的技术。在自然语言处理(NLP)领域,Embedding通常用于将文本映射为固定长度的实数向量,以便计算机能够更好地处理和理解这些数据。每个单词或句子都可以用一个包含其语义信息的向量来表示。Embedding常用于将文本数据映射为固定长度的实数向量,从而使计算机能够更好地处理和理解这些数据。每个单词或句子都可以用一个包含其语义信息的实数向量来表示。

2025-03-06 18:20:31 639

原创 MoE架构 | 如何解决深度学习中的五大痛点

MoE 架构的潜力在于其动态扩展和适应的能力。然而,实际部署揭示了一个复杂的工程挑战格局——从路由失衡和通信瓶颈到内存碎片化和退化的探索。迭代测试和监控:采用逐步扩展、实时监控和自适应阈值,以保持平衡。混合优化技术:结合多种策略——如双路由网络、先进的压缩算法和混合内存管理——以有效应对每个陷阱。协作工程:促进算法开发人员、系统架构师和运维专家之间的协作。这种跨学科的协同作用对于推动研究边界和确保实际可部署的解决方案至关重要。

2025-03-06 18:17:01 918

原创 大模型微调爆出致命漏洞:可导致模型“黑化”

GoUpSec点评:大模型微调作为当前AI应用落地的热点,正推动AI技术在各行业的深度融合。然而,一个与微调相关的巨大风险逐渐浮出水面:大模型微调不当,不仅会影响目标功能,还可能引发模型在其他领域发生紊乱,输出异常甚至有害的结果,导致整个大模型的黑化。这一发现凸显了大模型对齐的脆弱性,以及大模型微调的潜在风险,为AI开发敲响了警钟,值得行业高度关注。近日,来自Truthful AI与伦敦大学学院的联合团队发现:看似人畜无害的代码微调,竟能让顶尖大模型集体"黑化",在非相关领域爆发系统性安全危机。

2025-03-05 15:18:30 449

原创 2025核心概念 AI Agent:什么是AI Agent?AI Agent 与大模型的区别

经过以上的分享,大家都直观感受到了AI Agent的重要意义。。DeepSeek,Qwen等强力大模型的出现为AI Agent提供了良好的模型基础,使其可以构建更大更强的智能体系统。AI Agent的发展又让AGI(通用人工智能,旨在创造一个能像人类一样思考、学习、执行多种任务的系统)的美好愿景逐渐成为现实,未来的世界一定是人工智能的世界!

2025-03-05 11:45:55 1708

原创 大模型入门到精通:深入探讨大模型是如何构建、训练和微调(二)

现在,我们将深入探讨下一个主要阶段:RL(Reinforcement Learning,强化学习)。尽管预训练和SFT已经是成熟的方法,但RL仍在不断发展,并且已成为训练流程中的关键环节。

2025-03-04 16:03:51 980

原创 大模型入门到精通:深入探讨大模型是如何构建、训练和微调(一)

2025年年初随着DeepSeek的爆火,人们对LLM(Large Language Model,大语言模型)兴趣与日激增,很多人觉得LLM常常显得近乎魔法般神奇。接下来我们就来揭开LLM的神秘面纱。我想退一步,拆解一下LLM的基本原理——深入探讨这些模型是如何构建、训练和微调,最终成为我们今天所使用的AI系统的。在LLM能够生成文本之前,它首先必须学习语言的工作方式,而这一过程就是预训练——一个极其计算密集的任务。训练LLM的第一步是收集尽可能多的高质量文本数据。

2025-03-04 16:00:36 1022

原创 一篇了解AI产品经理的分类和主要职责

通过上述示例,我们可以清晰地了解到不同类型的AI产品经理在各自的领域中所扮演的角色以及他们具体的工作内容。无论是专注于底层技术的研究还是面向特定行业的应用,AI产品经理都需要具备深厚的技术背景、敏锐的市场洞察力以及强大的跨部门协作能力。

2025-03-04 14:40:03 619

原创 AI产品经理,为什么不懂数据、算法、算力就寸步难行?

数据决定了产品的上限。AI模型是“数据驱动”的技术,数据质量直接影响产品性能。

2025-03-03 14:48:15 947

原创 Agent(智能体)架构(三)Agent架构示例

本文介绍了智能架构。讨论了作为基础构建块的组件以及可以组合成整体架构的底层模式。根据你的使用案例的复杂性,我们首先讨论了单Agent架构与多Agent架构的优缺点。如果任务相对简单,单一Agent方法通常是最佳选择。然而,对于更复杂的任务,多Agent架构提供了更好的质量和灵活性。接下来,我们探讨了一些常见的多Agent架构设计模式以及每种模式的优缺点。我们还看了一些面向检索密集型系统的智能架构示例,以及如何通过单一Agent设置来克服简单RAG的局限性。

2025-03-03 14:43:18 1162

原创 Agent(智能体)架构(二)多Agent系统中的模式

行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。,以动态、形象的方式展示技术概念,

2025-03-03 14:24:29 936

原创 Agent(智能体)架构(一)AI Agent的组成部分,单Agent vs.多Agent架构

且。

2025-03-03 13:59:22 912

原创 OpenAI揭秘,端到端训练是AI Agent的未来!

从OpenAI Deep Research的成功可以看出,端到端训练正在成为构建高性能AI Agent的关键方法。这不仅是技术路线的选择,更是对AI发展方向的重要指引。Josh Tobin提到:“机器学习的第一课是,你得到的是你优化的结果。如果你能够设置系统,直接针对你想要的结果进行优化,结果将比拼凑未经端到端优化的模型好得多。

2025-03-02 09:30:00 631

原创 一文搞懂基于知识图谱的多模态推理

知识图谱是一种结构化的知识库,它以图的形式表示和存储现实世界中的实体、概念及其相互关系。这些实体可以是具体的人、地点、事物,也可以是抽象的概念或思想。

2025-03-01 08:15:00 1526

原创 什么是 AI 智能体?AI 智能体系统中的关键模式,五种 AI 智能体模式的比较

AI 智能体是利用 LLM 处理信息、与工具交互并执行任务的系统。工作流(Workflow)LLM 与外部工具按照预定义的执行路径进行结构化序列操作。此类系统注重可预测性,适用于定义明确且可重复的任务。智能体(Agent)更具动态性和自主性的系统,LLM 可自主决定流程、选择工具并确定任务完成方式。这种方式提供了更大的灵活性和适应性。选择工作流还是智能体取决于问题领域:工作流在结构化自动化任务中表现出色,而智能体则更适合需要大规模动态决策的场景。

2025-02-28 14:56:55 842 1

原创 DeepSeek开源革命:FlashMLA技术引爆大模型推理效率

2025年2月24日,中国AI领军企业DeepSeek正式启动“开源周”,在首日发布重磅项目FlashMLA:一款面向Hopper GPU的高效MLA解码内核,并针对可变长度序列的服务场景进行了优化。开源地址: https://github.com/deepseek-ai/FlashMLA这一开源动作被业界称为“推理加速的Linux时刻”,仅上线45分钟即登顶GitHub热榜,已收获超5000 Star。技术解析:FlashMLA的核心突破。

2025-02-28 12:00:11 1033

原创 GRPO训练:如何将你的模型变成推理模型?

理解策略梯度是基础, 就很容易看懂 PPO 和 GRPO,懂了 PPO 自然就明白 GRPO。对于弄懂损失的计算 和 损失计算的实现比较重要。当然还有 还有 MLA (多头潜在注意力), MOE (混合专家模型)等等。

2025-02-28 10:46:31 665

原创 扣子(Coze) | 什么是工作流? 扣子怎么搭建工作流?

提示词是「让AI理解某个具体问题」,而工作流是「让企业级业务在AI驱动下可靠运转」。正如螺丝钉(Prompt)和自动化生产线(Workflow)的关系——单个零件的精密度再高,也需要系统设计才能实现规模化价值输出。

2025-02-26 12:00:35 3316

原创 比GraphRAG更懂“思考”,微软又开源PIKE-RAG:主打复杂私域知识理解和推理

继GraphRAG之后,微软又发布,主打在中私域知识能力,PIKE-RAG 已在工业制造、采矿、制药等领域进行了测试,显著提升了问答准确率。RAG系统在满足现实世界应用的复杂和多样化需求方面仍然面临挑战。仅依靠直接检索不足以从专业语料库中提取深度领域特定知识并进行逻辑推理。基于此,微软亚洲研究院提出了。

2025-02-26 11:30:29 535

原创 dify案例分享 | ECharts打造上证综指5日K线可视化,超详细教程来袭

今天主要带大家了解了如何基于 Dify 的 Workflow 引擎构建上证综指 5 日 K 线可视化组件,详细介绍了使用 ECharts 实现股票价格趋势显示的工作流制作过程。介绍了 ECharts 作为百度开源的可视化解决方案的强大功能及技术特性。通过定义开始节点、使用文档提取器、配置 LLM 大语言模型、进行 echarts 代码转换生成以及直接回复等步骤,完成了工作流的搭建,并进行了验证和测试。还给出了项目体验地址及相关资料文档的开源项目地址。

2025-02-26 10:54:56 1911

原创 NebulaGraph + DeepSeek 轻松看懂《哪吒2》人物关系

难道你还想改变这世界?“我想试试。《哪吒2》票房已破百亿大关,并成功问顶全球动画电影票榜首,这不仅标志着中国动画电影在商业上的巨大成功,更是中国文化自信的有力体现。电影中人物较多,且属性颇多,你可还记得殷夫人的气象属性?太乙真人又属于哪个阵营?本文将带大家通过和带大家盘一盘《哪吒2》中的人物关系和属性。对于影视 IP 的人物关系,如《哪吒》中的人物,虽然可以用传统的行列表格进行展示。但是对于多重关系,比如“曾经恋人,现在敌对”或者“明面霸总,暗面大哥”,表格这种展示方式显然不如图结构来的直观、清晰。

2025-02-25 19:54:21 887

原创 Paper Reading | HedgeAgents: 多agent多资产对冲,3年累计收益400%

现有的基于人工智能的金融交易模型,如LLMs和基于agent的模型,在实际应用中缺乏足够的鲁棒性,难以承受现实世界金融市场的波动,存在风险管理机制缺失的问题。本文旨在开发一种基于“对冲”概念的多agent金融交易系统,以提高系统的稳定性、可靠性和投资回报率。单个agent包含一系列金融分析工具T,以及定义配置文件、动作A、记忆和反思。其中有23种工具,动作包含8种类型,记忆分为3种类型:基本市场信息记忆M_{MI}、投资反思M_{IR}和一般经验M_{GE}。

2025-02-25 19:31:17 618

原创 推理模型+Multi-Agent,可能就是deep research的全貌!

继谷歌、OpenAI和Perplexity相继发布各自的Deep Research后,牛津大学发布了一个 “Agentic Reasoning: Reasoning LLMs with Tools for the Deep Research”的工作,并且了,今天咱们来详细看看他们的 deepresearch 的玩法~这个框架,不仅在PhD级别的科学推理测试(GPQA)上超越了现有的RAG系统和闭源大模型, 而且在金融、医疗和法律等领域的深度研究任务中,击败了谷歌的Gemini Deep Research。

2025-02-25 19:04:13 873

原创 重磅!4000+实验揭秘:如何在512个GPU上训练大语言模型?

想知道ChatGPT这样的大语言模型是如何炼成的吗?今天带你揭开大模型训练的神秘面纱,看看在数百个GPU上协同训练大语言模型的技术秘密。

2025-02-24 17:17:02 769

原创 DeepSeek+dify知识库,查询数据库的两种方式(api+直连)

怎么让在个ai应用客户端直接连接数据库查询。dify官方没有现成的组件可以直接用。当时我想的是两种方式,一种是基于代码执行模块直接查询数据库,一种是基于Http请求,调用自己封装接口来查询数据库。

2025-02-24 16:49:33 3027

原创 大模型 | RAG 范式、技术和趋势

RAG (检索增强生成)的出现主要是因为传统的LLM存在一些不足之处:幻觉(生成虚假信息)过时的信息参数化知识效率低缺乏专业领域的深入知识推理能力弱对于企业应用来说,还需要综合考虑:领域支持的精准回答数据频繁更新的需求生成内容需要可追溯、可解释可控的成本隐私数据保护因此,RAG的核心思想是:在生成答案时,首先从大量文档中检索相关信息,再基于这些信息进行答案生成。通过附加外部知识库,避免了为每个特定任务重新训练整个大型模型。这使得RAG特别适用于知识密集型任务。RAG与Fine-tuning (FT) 的比较

2025-02-24 15:55:16 1070

原创 大模型 | 从零开始优化 RAG 流程的终极指南

本文讨论了优化 RAG 管道各个部分并增强整体 RAG 性能的各种技术。你可以在 RAG 管道中使用其中一种或多种技术,使其更加准确和高效。希望这些技术能够帮助你为你的应用程序构建一个更强大的 RAG 管道。参考资料:https://luv-bansal.medium.com/advance-rag-improve-rag-performance-208ffad5bb6a。

2025-02-24 15:39:58 922

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除