自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1730)
  • 收藏
  • 关注

原创 无需网络,轻松在手机上离线布署本地大模型

一旦模型加载完成,进入“聊天”页面并开始与加载的模型对话!生成性能指标也会显示。如果感兴趣,可以通过观察聊天气泡查看实时性能指标:每秒令牌数和每个令牌的毫秒数。AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源。

2024-11-16 11:30:00 8315 1

原创 大模型LLM | 一文彻底搞懂大模型Agent(智能体):Agent、Agent + RAG

AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!

2024-10-16 19:58:47 44913 1

原创 大模型 | 一文彻底搞懂预训练和微调(Pre-training vs Fine-tuning)

AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!

2024-08-19 09:46:08 15543

原创 大模型论文 | 利用DeepSeek&知识图谱辅助预防和减轻灾害应急响应系统框架 — 应急管理部等

我们提出了一个GenAI辅助的自然灾害综合预防和应急响应框架,利用DeepSeek大型语言模型(LLM)推进地质灾害管理中的智能决策。我们系统地分析了在灾害场景中部署LLM的技术路径,强调三个突破方向:**(1)知识图谱驱动的动态风险建模,(2)强化学习优化的应急决策系统,以及(3)安全的本地部署架构。**DeepSeek模型通过其独特的混合推理机制,结合语义分析和地理空间模式识别,展现了显著的优势。该机制能够对历史灾害记录、实时物联网传感器数据和社会环境参数等多源数据进行成本效益高的处理。

2025-06-13 18:02:33 501

原创 大模型论文 | GNN-RAG:用于大型语言模型推理的图神经网络检索

Year: 2024大语言模型凭借其卓越的自然语言理解能力,已成为众多NLP任务的标杆技术。其核心能力源于对海量文本数据的预训练,从而习得通用的人类知识。然而,由于预训练成本高昂且耗时,LLM难以快速适应新知识或领域专有知识,且易产生“幻觉”。知识图谱以结构化形式存储信息,支持动态更新。KG通过图结构捕捉实体间的复杂交互(如多跳关系),广泛应用于知识密集型任务(如问答系统)。RAG通过向LLM输入上下文注入来自知识图谱(KG)的实时准确信息,缓解LLM的幻觉问题。

2025-06-12 20:20:50 521

原创 最新世界大模型开源了!Meta发布了最新的开源世界模型V-JEPA 2

刚刚,Meta发布了Meta副总裁、首席AI科学家杨立昆(Yann LeCun)亲自发布了该模型,他在官方视频中提到,在世界模型的帮助下,这可以极大提升效率。比如AI会预测我们舀出一勺东西是要放入另一个容器中:AI甚至可以理解运动员的复杂跳水动作,并进行动作拆解:据Meta测试数据,来进行自监督学习训练。在Meta看来,物理推理能力对于构建在现实世界中运作的AI agents、实现高级机器智能(AMI)非常重要,可以此外,Meta还发布了三个新的基准测试,用于评估现有模型从视频中推理物理世界的能力。

2025-06-12 11:26:02 906

原创 大模型论文 | MALADE:基于大模型Agent智能体与RAG技术进行药物警戒的不良事件AE识别

在大型语言模型(LLMs)的时代,鉴于它们卓越的文本理解和生成能力,开发基于LLMs的新方法用于可信医学知识的综合、提取和总结是前所未有的机遇。本文关注药物警戒(PhV)问题,其重要性和挑战在于从多样化的文本资源(如医学文献、临床笔记和药品标签)中识别不良药物事件(ADEs)。不幸的是,这一任务受到多种因素的阻碍,包括药物和结果的术语差异,以及ADEs描述通常淹没在大量叙述性文本中。我们提出了MALADE,首个有效利用大型语言模型与检索增强生成技术进行药品标签数据中ADEs提取的协作多代理系统。

2025-06-11 19:36:24 759

原创 大模型论文 | 最新12种GraphRAG技术全面评测

6月有两篇关于GraphRAG技术评测的最新论文,涉及12种GraphRAG技术:HippoRAG、HippoRAG2、LightRAG、Fast-GraphRAG、RAPTOR、MGraphRAG、KGP、GraphRAG 、G-Retriever、DALK、ToG、GFM-RAG是一种扩展的 RAG 范式,通过构建图结构来组织背景知识,其中节点代表实体、事件或主题,边代表它们之间的逻辑、因果或关联关系。它不仅检索直接相关的节点,还会遍历图以捕获相互连接的子图,从而发现隐藏的模式。提出的。

2025-06-11 19:09:50 629

原创 《自然语言处理:大模型理论与实战》仅499页!吃透大语言大模型(附PDF)

自然语言处理一直是人工智能最热门的应用研究领域,对科学技术、文化教育、经济社会的发展各个方面都具有极其重大的意义。近年以来,以ChatGPT 为代表的生成式预训练对话人工智能技术(即大语言模型,简称大模型)取得了令人瞩目的进展,给基于统计方法的自然语言处理技术带来了前所未有的进步。

2025-06-11 12:02:43 885

原创 大模型论文 | Qwen3开源最新Embedding模型

当前最优性能(MTEB、MMTEB、CMTEB、MTEB-Code)多语言、多任务、多规模适配多阶段训练策略提升泛化能力全模型规模(0.6B / 4B / 8B)已开源,Apache 2.0 协议适用于语义检索、跨语言匹配、代码检索、RAG 系统等多种实际场景。

2025-06-10 20:00:00 1111

原创 一文详解AI 智能体的五种任务规划与执行模式!

大语言模型(LLM)驱动的 AI 智能体,特别是在借助Tools(工具)来完成复杂任务执行的过程中展现出了巨大的潜力。然而,让智能体能够合理规划任务步骤与执行、避免盲目行动是确保其高效可靠完成目标的关键。本篇将探讨多种。

2025-06-10 14:17:42 626

原创 大模型论文 | RAG技术的三大范式(基础RAG、高级RAG、模块化RAG)和技术演进

大模型的技术原理是不断预测下一个Token,且每一个已经生成的Token都会影响下一个Token的生成。简单来说,大模型就是一个概率预测机器,同样的Prompt会产生不同的答案,这就是所谓的信息幻觉问题。换个容易理解的说法,针对同一个或同一组Prompt,大模型的结果不具备幂等性。从2022年底ChatGPT横空出世以来,大模型的信息幻觉(生成错误信息)、知识过时、推理过程不透明等问题,一直困扰着业内各方技术人员,直至RAG技术出现,才算缓解了这个难题。

2025-06-07 11:29:58 624

原创 什么是 Graphiti?为什么选择 Graphiti?Graphiti快速入门指南

•。

2025-06-06 20:00:00 756

原创 大模型论文 | AutoThink: 让大模型自主决定何时思考

大模型的“思维能力”日益重要,如何让模型在“难”的问题上展开推理、深入思考,而不是事无巨细地“想个不停”?自动化所研究团队的一项新研究,可以。该研究成果集成于,并将用于训练ScienceOne的基座大模型。在大模型快速发展的今天,越来越多的模型开始具备“深度思考能力”。比如,DeepSeek-R1系列模型通过引入特别的提示词结构:先,再,使得模型在回答问题之前先进行“深度思考”,生成一整段包含反复自我反思、自我验证的推理过程,然后再给出答案。这一过程显著提升了模型解决复杂问题的能力,但也同时。

2025-06-06 10:12:20 623

原创 AI Agent智能体产品详解(一)AI Agent的5个级别

OpenAI发布了其根据自身技术研发与产品开发的通往AGI的五级量表。OpenAI 将 AI 开发分为五个阶段,每个阶段代表更高级的能力水平:目前OpenAI向多Agent系统迈进与第三阶段的目标一致,其中 AI Agent应代表用户执行操作,从而提高他们的能力和效率。按照现在AI的发展速度,GUI-Agent将能够快速接管一定的企业流程自动化,加上RAG技术的快速迭代翻新,5年之后差不多能够实现。但实现这个目标,却不一定能够实现AGI的目标。

2025-06-05 19:30:00 1360

原创 AI Agent智能体产品详解(三)自主工作的六个层次

AI Agent不只影响了企业数字化技术的应用,更影响了广大组织的业务架构与作业方式。Agent的终极发展目标是Autonomous Agent能够实现主动响应和自主运行,所以在Agentic AI影响下的工作最终也将发展成为自主工作(autonomous work)。未来十年不断改进的AI资源将对企业和人类劳动力产生双重影响。AI将产生广泛的增强效应,接管低价值的任务,并使人类能够将精力集中在更具战略性和创造性的工作上。

2025-06-04 20:30:00 1451

原创 AI Agent智能体产品详解(二)智能体自动化的五个级别

在五级AI Agent的基础上,自动化领域开始探索智能体自动化(Agentic Automation,也称作代理自动化)。而一旦Agent成为元宇宙一样的流行词汇,也意味着更多人并不了真正解它。所以为了消除这些噪音并帮助更多公司设定他们的目标,Semae.ai引入了一种根据AI Agent功能和结果对AI Agent进行分类的方法。这也是一个智能体分类方法,不过角度换到了自动化。如下:下面,是对于每一级智能体自动化的具体解读。在基层,固定自动化不代表真正的Agent行为。

2025-06-04 20:00:00 653

原创 一文深度解析 AllReduce,分布式训练的“同步神器

在深度学习的分布式训练中,如何高效地同步梯度并更新模型参数,一直是困扰研究人员的关键问题。AllReduce 操作以其高效、去中心化的特性,成为了分布式训练中的“同步神器”。本文将深入剖析 AllReduce 的工作原理、实现步骤以及其在深度学习中的应用场景,带你一探究竟,解锁分布式训练的高效秘诀!

2025-06-03 20:23:01 922

原创 一文搞懂推理大模型!什么是推理模型?推理大模型与普通大模型的区别是什么?什么时候使用推理大模型?

当下,“推理大模型” 成为一个备受瞩目的热门词汇。那么,推理大模型究竟是什么呢?它和我们熟知的普通大模型又有何区别?在实际应用中,我们又该如何选择呢?今天,就让我们一同深入浅出地揭开推理大模型的神秘面纱。我们先来认识一下推理大模型。简单来说,推理大模型是一种在海量数据基础上训练而成,具备强大逻辑推理能力的人工智能模型。它就像是一位 “逻辑高手”,能够对输入的信息进行深度的分析、推理和判断,从而得出具有逻辑性和合理性的结论。

2025-05-29 09:15:00 479

原创 一文剖析MCP 架构设计,基于 MCP 实现客服智能体案例

最近,AI Agent 和外部工具之间的互动变得越来越流行。,大家都在努力让 AI 模型能更有效地调用外部的功能。不过,目前这些集成方式还是比较分散,开发者需要为每个服务手动设置接口、处理认证和逻辑,而且不同平台之间还互不兼容,确实挺麻烦的。就在这种情况下,Anthropic 在2024年底推出了一个叫做模型上下文协议(Model Context Protocol,简称 MCP)的新东西。

2025-05-29 09:00:00 893

原创 万字详解!AI Agent框架:Google ADK、Autogen、Langchain与CrewAI

ADK 在与 Google 服务(例如 Google 搜索、Vertex AI 工具)的轻松集成方面表现突出,利用其与 GCP 的对齐。它支持通过 Python 函数(通过文档字符串定义功能)实现自定义工具,并可能支持 OpenAPI 规范以实现结构化工具定义,尽管这方面的文档较少。"""返回当前日期和时间的 ISO 格式。"""# 文档字符串解释工具功能instruction="如果被问到,告知当前时间。",tools=[get_current_iso_time]# 直接传递函数。

2025-05-28 11:40:35 654

原创 一文搞懂智能体设计!详细拆解从需求分析到智能体开发、再到测试与运营的完整流程

电信套餐推荐只是智能体应用的一个缩影,它告诉我们:业务目标始终是第一位的,技术只是服务于业务的工具。从需求分析到运营优化,每一步都需紧扣“让用户高效完成任务”这一核心。如果没有对业务流程的深入理解、对用户旅程的精准把握、对交互细节的精心打磨,任何智能体都难以发挥价值。这样的智能体,才是企业数字化转型的“得力助手”。如果你所在的企业正考虑构建智能体系统,不妨从一个典型业务场景出发,像打造一个优秀的客服一样,打造一个优秀的数字助理!

2025-05-28 11:03:17 768

原创 从零开始构建大语言模型(一)什么是 LLM?构建和使用LLM

LLM,即大型语言模型,是一种设计用于理解、生成和回应类似人类文本的神经网络。这些模型是在大量文本数据上训练的深度神经网络,有时包括互联网上整个可公开获取文本的大部分内容。"大型"语言模型中的"大"既指模型在参数方面的规模,也指其所训练的庞大数据集。这样的模型通常具有数百亿甚至数百亿个参数,这些参数是网络中的可调权重,在训练过程中进行优化,以预测序列中的下一个词。下一个词的预测是合理的,因为它利用了语言固有的顺序性质来训练模型,使其理解文本中的上下文、结构和关系。

2025-05-23 19:53:29 852

原创 大模型实战开发 | 从零部署Qwen大模型(非常详细)看这一篇就够了!

在人工智能技术飞速发展的今天,大型语言模型(LLM)已成为技术创新的核心驱动力。本文将手把手教你使用高性能推理引擎vLLM部署Qwen大模型,并提供Python和Java两种语言的实现代码,帮助不同技术背景的开发者快速上手。

2025-05-19 21:57:52 849

原创 2025年零基础转行大模型,零成本快速入门AI大模型,系统学习掌握大模型(非常详细)看这一篇就够了!

随着 AI 技术赋能千行百业,今年,关于 AI 人才的需求大大增加,薪资待遇也水涨船高。智联招聘数据显示,2025 年春招首周,AI 行业求职人数同比增速 33.4%,位居行业第一,人工智能工程师以 69.6% 的求职增速也位居职业榜首。在招聘端,人工智能行业招聘增长,人工智能工程师以 21319 元的平均招聘月薪领跑职业第一。不夸张地说,无论是从技术趋势、市场需求、提升解决问题的竞争力,又或是职业发展各方面考虑,但知道是一回事,做又是另一回事,绝大部分人还不知道该如何上手去学习大模型。

2025-05-16 11:55:06 400

原创 大模型论文 | 如何构建行业LLM基准评测

导读:这是一篇写得比较全面的基准数据集构建论文,论文附录还开源了人工标注说明、模型评测实验软硬件环境、详细的系统和用户提示词等,希望对大家有帮助。论文和数据集链接见文末近年来,大语言模型(LLMs)以其强大的语言理解和生成能力席卷全球,从智能助手到学术研究,无处不在。然而,当这些模型被应用于公共卫生领域时,一个关键问题浮现:它们能否准确检索并理解权威的公共卫生信息?特别是政府发布的公共卫生指导意见,其不仅是居民健康决策的重要依据,也是专业人员和医疗机构的核心参考。

2025-05-15 19:52:55 680

原创 大模型论文 | MoA:协作的力量重塑语言模型

Mixture-of-Agents 技术的诞生标志着语言模型从单打独斗走向团队协作的新时代。通过巧妙的分层架构和角色分工,MoA 将多个模型的智慧融为一体,创造了超越单一模型的惊人性能。无论是 AlpacaEval 2.0 的霸榜表现,还是在成本效益上的突破,MoA 都向我们展示了协作的力量。未来,随着更多模型的加入和架构的优化,MoA 有望进一步释放语言模型的潜能,为 AI 应用带来更多可能性。

2025-05-13 20:02:01 884

原创 一文解析大模型的5种Agent模式(反射模式、工具使用模式、ReAct模式、规划模式、多智能体模式)

这种模式通常用于提高大型语言模型的交互性和准确性,通过用户反馈不断优化模型的输出。

2025-05-06 17:40:33 1125

原创 新人小白如何快速系统的入门大模型?(非常详细)从入门到精通!看这一篇就够了!

大模型目前在人工智能领域可以说正处于一种“炙手可热”的状态,吸引了很多人的关注和兴趣,也有很多新人小白想要学习入门大模型,下面给大家分享一份2025最新版的大模型学习路线,帮助新人小白更系统、更快速的学习大模型!

2025-05-05 19:44:47 438

原创 AI Agent智能体入门到精通(二)AI Agent的工作流程、AI Agent的分类、AI Agent的应用场景

AI Agent代表了人工智能从"工具"向"助手"再到"代理"的进化过程,标志着AI正逐步从被动响应走向主动行动。随着技术的不断发展,AI Agent将在更多领域发挥作用,为人类提供更智能、更高效的服务。尽管AI Agent技术前景广阔,但我们也需要正视其面临的挑战,包括数据隐私、伦理问题以及技术可靠性等。未来的发展方向应是建立人机协作的模式,让AI Agent成为人类的得力助手,而非替代者。

2025-05-04 08:30:00 1736

原创 AI Agent智能体入门到精通(一)什么是AI Agent(智能体)?智能体与大语言模型的关系,AI Agent的核心组件

AI Agent(智能体)是一种能够感知环境、进行决策并采取行动的智能系统,旨在达成特定目标。与传统的大型语言模型(LLM)相比,AI Agent不仅具备理解和生成文本的能力,还能够主动规划、实施行动并与环境进行交互。

2025-05-03 09:00:00 760

原创 代理工作流(Agentic Workflows)从入门到精通(三)Agent工作流应用场景、Agent工作流实际应用案例

考虑到围绕代理AI的兴奋、期待和期望,分清炒作与现实之间的差距,理解其真正的能力与局限性变得困难。在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。每个代理工作流都采用了独特的模式和工具组合,赋予代理不同程度的自主性和决策能力,并依赖于不同水平的人类反馈和参与。可以说是最科学最系统的学习成长路线。需要注意的是,AI代理仍然是新兴技术,随着研究人员和用户发现将代理融入工作流的新方式,以上优势列表可能会不断扩展。

2025-05-02 08:15:00 817

原创 代理工作流(Agentic Workflows)从入门到精通(二)什么是Agent工作流?Agent工作流组成、Agent工作流模式

在一般情况下,

2025-05-01 08:00:00 1015

原创 代理工作流(Agentic Workflows)从入门到精通(一)什么是 AI Agent?AI Agent的组成部分

Agent、Agentic AI、Agent架构和Agent工作流等概念如今备受关注,但它们究竟是什么?它们能做什么?新技术常常伴随着混乱的术语和炒作。本文将深入解析代理型AI的关键概念——代理工作流(Agentic Workflows)。

2025-04-30 17:37:16 930

原创 大模型论文 | 34个RAG评估框架教你如何评估RAG效果!

行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。可以说是最科学最系统的学习成长路线。书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。

2025-04-29 11:06:08 1146

原创 大模型RAG 技术 | 为什么需要RAG?传统 RAG、Graph RAG、DeepSearcher的区别解析

大型模型如 GPT-4 的训练数据有时间限制(仅更新至2023年),而 RAG 能够实时检索最新文档(如科研论文或新闻),从而动态扩展模型的知识库。纯生成模型容易产生错误信息(即“幻觉”),RAG 则先进行相关证据文档的检索,确保模型基于检索结果生成内容,大幅降低错误率。传统的微调(Fine-tuning)需要大量标注数据和计算资源,而 RAG 只需构建领域文档库,就能让通用模型生成专业领域的内容(如法律、医疗)。

2025-04-29 10:24:50 754

原创 大模型论文 | 强化学习真能提升大语言模型推理能力?研究发现可能并非如此!

在采样次数较少(k值较小)时,强化学习训练的模型表现优于基础模型,但在所有基准测试中,随着k值增大,基础模型始终超越它们,甚至能获得更高的pass@k分数。通过人工检查发现,基础模型可以通过生成多样化的推理路径来解决那些原本认为需要强化学习训练才能解决的问题,每个问题至少能找到一个正确的解决方案。这表明,与基础模型进行大量采样相比,强化学习训练并没有增强,甚至可能限制了大语言模型的推理潜力。

2025-04-28 11:59:11 430

原创 大模型论文 | 一篇搞懂!最新11种新型 RAG 类型

新一代 RAG 正在以更智能、更结构化的方式,成为 LLM 在推理、问答、规划领域的“超级大脑”。如果你是从事大模型应用的开发者、研究者,这些 RAG 的演进路径无疑提供了大量创新灵感。

2025-04-25 20:04:14 875

原创 大模型论文 | 在监督微调后LLM能做什么、仍不能做什么

近一两年来,大语言模型(LLMs)在数学推理任务中的长进令人瞩目。近日,来自加州大学伯克利分校和 Allen Institute for AI 的研究团队发表了一篇引人注目的论文,题为《Climbing the Ladder of Reasoning: What LLMs Can—and Still Can’t—Solve after SFT?》(攀登推理阶梯:在监督微调后LLM能做什么、仍不能做什么)(论文链接文末)。这篇研究通过对 AIME24 数据集的深入分析,揭示了经过监督微调(SFT)的LLMs在

2025-04-22 19:31:38 672

原创 大模型论文浅读 | 大模型推理系统之 BlendServe:创新资源感知批处理策略,以提升硬件利用率与推理吞吐量

以其独特的资源感知批处理策略,成功突破了离线推理中的资源调度瓶颈,为多模态任务和大规模推理服务带来了显著的性能提升。未来,随着更多应用场景的落地,这一技术有望成为 AI 推理领域的核心工具之一,为行业带来更大的变革力量。👉 论文链接:第一作者。

2025-04-21 17:01:50 946

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除