- 博客(1309)
- 收藏
- 关注
原创 图提示在图学习模型中的应用:近期进展与未来方向
图学习模型在从大规模图数据中学习表达性表示方面展现了强大的能力,并在各种真实世界的应用场景中取得了显著成效。作为一种训练强大图学习模型的常见策略,"预训练、适应"方案首先以自监督方式在未标注的图数据上预训练图学习模型,然后将其适应于特定的下游任务。在适应阶段,图提示作为一种有前景的方法应运而生,它在保持预训练图学习模型不变的情况下,学习可训练的提示。在本文中,我们对图提示的最新进展进行了系统综述。首先,我们介绍了作为图提示基础步骤的代表性图预训练方法。接下来,我们回顾了图提示中的主流技术,并详细阐述了它们如
2025-06-22 10:45:00
434
原创 Graph-RAG全面综述:如何用知识图谱+大模型解决信息检索难题?
本文为《Graph Retrieval-Augmented Generation: A Survey》的深度精读,对论文内容进行了总结与提炼,希望帮助读者快速把握核心要点。在关键部分还附有拓展阅读建议,以引导进一步深入学习。由于部分内容基于基础概念之上展开,因此文中对相关基础知识有所略过。
2025-06-21 19:57:52
395
原创 突破传统限制:AutoSchemaKG如何实现全自动知识图谱构建
我们提出了AutoSchemaKG,一个完全自主的知识图谱构建框架,无需预定义模式。我们的系统利用大型语言模型同时提取知识三元组和直接从文本中归纳全面的模式,对实体和事件进行建模,并在使用概念化将实例组织成语义类别的同时进行建模。处理超过5000万份文档后,我们构建了ATLAS(自动化三元链接和模式归纳),一系列拥有9亿多个节点和59亿多条边的知识图谱。这种方法在多跳问答任务上优于最先进的基线,并增强了大型语言模型的事实验实性。值得注意的是,我们的模式归纳实现了与人工制定的模式95%的语义对齐,且零手动干预
2025-06-21 19:55:14
209
原创 清华:首个具身R1来了!协同框架下RL激活基座模型的视频空间推理能力,性能提升超10%!
受OpenAI-o1/o3、DeepSeek-R1等推理模型的启发,本论文提出了首个基于连续视觉感知的具身空间推理框架Embodied-R,通过强化学习(RL, Reinforcement Learning)和大小模型协同,将R1推理训练范式拓宽至具身智能领域。
2025-06-20 22:48:10
254
原创 北航李伯虎院士任磊教授团队 | 工业大模型IFMsys架构,打造智能制造新范式
工业大模型已成为国内外产学研各界关注的前沿焦点方向。然而,工业大模型并不是通用大语言模型在工业的简单落地应用,其底层架构和应用逻辑存在本质差异。在李伯虎院士、国际建模仿真学会原主席张霖教授指导下,北京航空航天大学任磊教授带领青年教师和研究生自2022年起开始探索这一前沿方向,当前在《IEEE Transactions on Cybernetics》提出工业大模型体系架构IFMsys,提出工业大模型应用框架,并推出工业大模型原型系统MetaIndux。
2025-06-19 20:17:37
873
原创 一网打尽:AI 大模型应用架构图终极合集
人工智能已然成为推动各行业变革的核心力量。而 AI 大模型,更是以其强大的通用性和适应性,开创了智能应用的新纪元。从精准营销到智能安防,从医疗诊断到工业制造,AI 大模型正深度融入各个领域,重塑行业生态。
2025-06-19 20:15:52
907
原创 工业维护新趋势:生成式 AI 六阶段框架落地指南
生成式人工智能(AI)通过在故障中断生产之前识别故障、减少停机时间并优化资产性能,正在改变工业维护。传统的维护方法,无论是被动的、预防性的还是早期预测性的,往往缺乏精确性,导致不必要的维修、漏检和成本增加。
2025-06-19 20:14:13
979
原创 10min让你用Dify零代码搭建一个属于你的大模型知识库
通过学习能得到什么?可以得到一个简单的应用可以更深入了解大模型知识库的工作流大家有兴趣,可以跳到文末先看效果
2025-06-19 20:12:38
895
原创 一键式训练端到端Agent,Qwen3+MCP工具集高效集成!
RLFactory能够让你通过低代码的方式快速训练你的端到端Agent模型,以Qwen3等最新的模型为基座调用你的MCP工具集!
2025-06-18 19:55:11
710
原创 RAG-MCP:通过检索增强生成和模型上下文协议增强AI代理
随着基础模型能力的提升,现实世界的应用需求日益增长,要求AI具备上下文感知、检索增强和代理驱动的特性。这正是RAG-MCP大放异彩的地方。
2025-06-18 19:53:35
766
原创 本地私有化RAG知识库搭建心得总结
2025年2月,国内AI领域迎来现象级事件-DeepSeek突然全网爆红。引发指数级用户增长。面对激增的访问压力,平台服务器多次出现服务中断,"请求失败"的提示界面成为用户高频讨论话题,由此掀起了一场自建AI私有部署的热潮。
2025-06-18 19:52:00
884
原创 Agent也能蒸馏了!性能超好
大模型的困境:能力越强,成本越高!LLM 虽然能解数学题、答冷知识,但运行成本极高,好比“雇一个年薪百万的博士随时待命”。
2025-06-18 19:50:25
874
原创 什么是AI Agents?什么是Agentic AI?他们有何不同?
目前,AI Agents 和 Agentic AI 是近年来备受瞩目的新兴概念。随着生成式人工智能模型(如 ChatGPT)的兴起,AI Agents 和 Agentic AI 的研究和应用迅速扩展。本文将详细探讨 AI Agents 和 Agentic AI 的定义、特性、架构、应用领域以及它们之间的区别,并提供一个专业的对比分析。
2025-06-17 20:36:15
771
原创 LLaMA Factory 微调教程:如何构建高质量数据集?
在开始学习之前,首先我们先补充演示一下,我们整体这次微调教程中,微调案例的一个最终效果。在本教程中,我们微调的基础模型是 Qwen2.5-7B-Instruct ,目标是微调后让其在特定场景下具备一定的推理能力,并且在 Web 安全领域具备专家级水准。
2025-06-17 20:34:41
768
原创 无需标注和奖励模型!仅靠自信度RL,16个样本训练20步,效果飙升21%!
这篇论文提出了RLSC(基于自信心的强化学习),让大语言模型用自身答案的置信度作为奖励信号。就像学生通过检查自己的解题把握来提升成绩,完全摆脱对人类标注的依赖。
2025-06-17 20:31:34
595
原创 大模型公司挖墙脚哪家强?报告:Anthropic人才吸引力是OpenAI的8倍,留存率达80%
大模型公司挖墙脚哪家强,Anthropic才是最大赢家?不仅顶尖AI人才的留*存率达到80*%,而且工程师从OpenAI跳槽到Anthropic的可能性是从Anthropic转投OpenAI的8倍。
2025-06-16 21:13:17
839
原创 遥感论文 | GRSM | ImageRAG:基于VLM和RAG的遥感图像上下文检索机制,有效解决遥感影像问答难题
超高分辨率(UHR)遥感影像(RSI)(例如10000×10000像素)对当前的遥感视觉语言模型(RSVLMs)提出了重大挑战。如果选择将超高分辨率图像调整为标准输入图像大小,其包含的大量空间和上下文信息将会被忽略。
2025-06-16 21:11:22
699
原创 乖乖,太能打了!多模态融合目标检测新SOTA性能起飞!
为解决传统目标检测在复杂环境下效果不佳等问题,研究者们提出了多模态融合目标检测。通过整合来自多个传感器的数据,充分利用不同传感器的优点,多模态融合目标检测能够更全面地捕捉目标信息,显著提高检测的准确性和鲁棒性,以及模型在各种环境条件下的适应能力。
2025-06-15 10:45:00
899
原创 Nat Commun | DrBioRight 2.0:由大语言模型驱动的、进行癌症功能蛋白质组学分析的生物信息学聊天机器人
Nat Commun | DrBioRight 2.0:由大语言模型驱动的、进行癌症功能蛋白质组学分析的生物信息学聊天机器人
2025-06-14 10:45:00
729
原创 迟来!解读Qwen开源的Embedding模型中的细节!附实测结果!
上周五,Qwen团队又开源了Embedding模型,真是人民需要什么,它开源什么呀!
2025-06-13 22:54:51
1001
原创 MCP 和 A2A 之后又一 AI Agent 协议刷屏了:AG-UI 协议架构设计剖析
随着 AI Agent 在企业中应用越来越广,AI Agent 在落地过程中,MCP 解决了 AI Agent 到 Tools 之间的通信标准,A2A 解决了 AI Agent 到 AI Agent 之间的通信标准。但是仍缺少一块:用户到 AI Agent 的通信协议。
2025-06-12 21:11:20
805
原创 实战|Spring +Milvus,Java也能实现的企业级文档问答RAG
在企业数字化转型的浪潮中,PDF、Word 等海量文档往往沉睡在各个业务系统中,形成“数据孤岛”,难以被智能系统高效利用。那么,如何构建一个真正面向企业场景落地的 AI 应用,让 AI 成为企业的“智能助手”?本项目提供一套基于 Spring 框架的完整解决方案,结合文档 ETL、向量检索与 RAG 问答技术,覆盖从数据导入到智能对话的全链路实践。
2025-06-12 21:07:38
631
原创 Agentic的模式和实现代码
这个是一个workflow的Agent 模式,一个 LLM 调用的输出依次进入下一个 LLM 调用的输入。这种模式将任务分解为一系列固定的步骤。每一步都由一个 LLM 调用处理前一步LLM处理的输出。这种模式适用于可清晰分解为可预测的顺序子任务的任务。
2025-06-11 19:42:27
617
原创 Qwen3模型架构、训练方法梳理
Dense 模型结构改进:GQA、SwiGLU、RoPE、RMSNorm with pre-normalization与Qwen2.5 相似。移除了 Qwen2 中的 移除QKV偏置,减少模型复杂性,在注意力机制中引入 QK-Norm 来确保稳定训练。
2025-06-11 19:40:26
1164
原创 RAG新选择!阿里开源向量大模型Qwen-Embedding和重排序大模型,评分超谷歌向量模型,检索排行榜第一!完全免费开源
阿里巴巴Qwen团队发布了全新的Qwen3 Embedding系列模型,这是一套基于Qwen3基础模型构建的专用文本向量与重排(Reranking)模型。该系列模型凭借Qwen3强大的多语言理解能力,在多项文本向量与重排任务的Benchmark上达到了SOTA水平,其中8B尺寸的向量模型在MTEB多语言排行榜上排名第一。Qwen3 Reranker模型在多个评测基准上同样大幅超越了现有的主流开源竞品。
2025-06-11 19:38:47
748
原创 ICML 2025 | 无需训练,即时对齐大模型偏好
为了让大模型(LLM)的行为更符合人类预期,一系列训练时对齐方法(例如RLHF和DPO)通过微调模型参数来实现偏好优化。然而,这种“训练时对齐”模式不仅耗时耗力,而且一旦偏好发生变化(比如安全标准更新),就得从头开始再训练一次。这种方式在应对变化需求时显得十分被动。
2025-06-11 19:37:10
865
原创 DeepSeek基础:模型预训练概念与技术详解
预训练技术的本质是让AI先建立语言世界的“通用知识地图”,再通过少量标注快速定位“任务目的地”。这种范式突破使得AI首次展现出接近人类的语言理解和创造能力。本文将从以下方面介绍:
2025-06-10 20:22:26
1104
原创 【大模型基座】Qwen3技术报告发布
模型架构:Qwen3系列包括6个密集模型(Qwen3-0.6B到Qwen3-32B)和2个MoE模型(Qwen3-30B-A3B和Qwen3-235B-A22B)。这些模型的架构类似于Qwen2.5,但进行了优化和改进,包括使用GroupedQueryAttention、SwiGLU、Rotary Positional Embeddings和RMSNorm等。
2025-06-10 20:20:44
1038
原创 多模态数据融合又冲上Nature!确定不来了解一下?
众所周知,多模态在如今是越发的火爆了,而多模态数据融合作为其中的关键技术,自然也就成为研究的热门!且还在上升期,出创新点的机会很多。主要在于,其能够整合来自不同模态的数据,减少单一数据源可能带来的误差和不确定性,从而提高信息处理的准确性和可靠性。此外,不同模态的数据还可能受到不同的噪声和干扰,通过融合,有助于模型摒除干扰,提高鲁棒性。这些特性对于医疗诊断、自动驾驶、人机交互等都至关重要!
2025-06-10 20:18:47
746
原创 理解 RAG 第三部分:融合检索与重新排序
我们之前介绍了什么是 RAG、它在大型语言模型 (LLM) 中的重要性,以及 RAG 的经典检索器、生成器系统是什么样的,本系列的第三篇文章探讨了一种构建 RAG 系统的升级方法:融合检索。
2025-06-10 20:17:10
762
原创 SFT+RL双阶训练突破LLM自我监督!人大DeepCritic实现AI批判自主进化
大语言模型(LLM)通过大规模地学习人类数据并从人类监督反馈中不断进化,在许多任务上展现出卓越的性能。然而,随着模型智能的不断增强,依赖人工监督的方式也面临着越来越高饿成本和难度。如何以更高效、可扩展的方式对日益进化的模型进行监督,成为非常重要且亟待解决的关键问题。
2025-06-09 20:51:12
815
原创 开源大模型网关:One API实现主流AI模型API的统一管理与分发
One API是一个使用go语言开发的大语言模型 API 管理与分发系统支持Docker一键快速部署,且资源占用小,高性能开箱支持多平台大模型快速接入,包括OpenAI、Gemini、xAI、Grop、Anthropic Claude、Ollama、Deepseek、智谱AI、豆包、文心一言等等
2025-06-09 20:48:52
878
原创 从表面到深入:利用知识图谱和大模型整合外部知识以生成跟进问题 - 东南大学&中国移动研究院
在对话系统中,基于上下文动态生成跟进问题可以帮助用户探索信息并提供更好的用户体验。人类通常能够提出涉及一些普遍生活知识的问题,并展示出更高阶的认知技能。然而,现有方法生成的问题常常局限于浅层的上下文问题,这些问题的启发性不足,与人类水平存在较大差距。本文提出了一种三阶段的外部知识增强的跟进问题生成方法,该方法通过识别上下文主题、在线构建知识图谱(KG),最后将其与大型语言模型结合来生成最终问题。该模型通过引入外部常识知识并执行知识融合操作,生成信息丰富且具有探索性的跟进问题。实验表明,与基线模型相比,我们的
2025-06-09 20:46:29
821
原创 两大 智能体框架 Dify vs Langchain 怎么选 ? 来一个彻底、全面、深入的分析
在 AI 智能体应用 开发的世界里,选择一个合适的框架是至关重要的。选对智能体 平台非常关键, 它直接影响你的AI应用的效率、可扩展性和整体表现。
2025-06-09 20:44:46
811
原创 中国AI医疗大模型七强—病理大模型
今天小医和大家来聊聊AI医疗领域一个非常硬核且意义重大的方向——AI病理诊断大模型。病理诊断被誉为疾病诊断的“金标准”,但传统模式下,病理医生培养周期长、工作负荷大,且存在一定的主观性。现在,中国的AI力量正试图用“大模型”这把利器,为病理诊断带来一场智慧革命!
2025-06-08 10:45:00
940
原创 给MCP加上RAG,工具准确率提升200%,起飞~
大型语言模型(LLMs)在有效利用越来越多的外部工具(如模型上下文协议(MCP)所定义的工具)方面存在困难,这是由于提示膨胀和选择复杂性造成的。因此引入了RAG-MCP,这是一个检索增强生成框架,通过卸载工具发现来克服这一挑战。
2025-06-07 19:33:02
978
原创 从单 Agent 到多 Agent 的案例落地实践
关于 Agent 的定义目前还没有形成共识,目前有3个代表性的定义:流行最广的是前 OpenAI 研究与安全副总裁 Lilian Weng 对 Agent 的定义:Agent = LLM + Planning + Tools + Memory。
2025-06-07 19:31:28
1035
原创 人工智能和知识图谱七:知识图谱在人工智能系统中的优势
知识图谱融入 AI 解决方案后,将带来诸多优势。这些优势涵盖互操作性、查询功能等技术改进以及可解释性、可信度、减少开发工作量等更高层次的关注点。本文概述了知识图谱的主要优势,以及它如何补充机器学习模型,助力打造更值得信赖的 AI。
2025-06-06 19:32:30
946
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人