- 博客(1322)
- 收藏
- 关注
原创 多模态任务大一统!蚂蚁推出Ming-Omni:图像、文本、语音三模态无缝融合,一网打尽复杂任务!
Ming-lite-omni 是 Ming-omni 的轻量版本,源自 Ling-lite,具有28亿激活参数。Ming-lite-omni 是一个统一的多模态模型,能够处理图像、文本、音频和视频,并在语音和图像生成方面表现出强大的能力。
2025-06-26 21:11:44
525
原创 论文浅尝 | LightPROF:一种用于基于知识图谱的大语言模型的轻量级推理框架(AAAI2025)
大语言模型(LLMs)在文本理解和零样本推理方面表现出令人瞩目的能力。然而,知识更新的延迟可能导致它们推理错误或产生有害结果。知识图谱(KGs)通过对广泛的实体和关系进行结构化组织和连接,为大语言模型的推理过程提供丰富且可靠的上下文信息。现有的基于知识图谱的大语言模型推理方法仅以文本形式将知识图谱的知识注入提示中,忽略了其结构信息。此外,它们大多依赖于闭源模型或大参数的开源模型,这对高资源消耗提出了挑战。为解决这些问题,作者提出了一种新颖的轻量级且高效的用于知识图谱问答(KGQA)的提示学习推理框架(Lig
2025-06-26 21:10:31
533
原创 大模型私有部署的最优解:构建企业级大模型统一能力底座
企业在推进AI大模型私有化部署时,往往会陷入从算力选型适配到系统配置的多重困境,真正限制落地效率的并非单一技术点,而是多环节间的耦合与不确定性,构建企业级大模型统一能力平台针对这一全链条复杂性,提供平台化解耦方案,可以帮助企业缩短部署周期,降低尝试门槛。
2025-06-26 21:09:03
356
原创 GraphRAG变种:HippoRAG进化到HippoRAG2.0,提升多跳复杂推理性能
HippoRAG2生成的图更为密集,提高了信息连接性和覆盖范围。并且这种变种的GraphRAG在需要多跳推理和上下文综合的任务中表现优异。
2025-06-26 21:07:20
465
原创 图解AI:RAG分块策略
RAG作为大模型入门级的应用,在处理策略上要比写提示语好落地的很多。刚刚经历了一个AI落地大项目的上线,提示语写了将近5000字。比起写提示语我还是更愿意写crud。
2025-06-25 20:15:10
483
原创 GraphRAG + DeepSearch: 下一代企业级人机协同大模型推理架构及医药法律等领域Agent深度详解
深度图谱检索增强生成(GraphRAG)系统正在推动专业问答、知识管理与自动化研究的边界。本文全面介绍了GraphRAG + DeepSearch系统的核心架构、技术细节和关键实现,并通过图文并茂的方式深入剖析其多智能体、知识图谱、搜索与推理体系,以及工程化的数据流和界面实现,助力专业人士全方位理解和落地先进的知识驱动问答平台。
2025-06-25 20:13:33
364
原创 RAG的2025趋势重点及RAG+抽取场景的来源定位问题思考
为什么在实际落地过程中,比如信息抽取、RAG 等,会有引文生成、来源定位这些需求?底层的逻辑是什么?有哪些实际的例子?在技术上如何做?
2025-06-24 21:15:05
589
原创 TTRL(Test-Time RL)微调新方法:极简版RL,效果吊打SFT
聚焦:提出的TTRL(Test-Time强化学习)给出了答案:*让AI自己生成答案,通过“投票”选出共识,再用共识作为奖励信号驱动学习。*
2025-06-24 20:47:13
923
原创 多模态大模型中的视觉表征定律
本文在多模态大语言模型(MLLMs)中提出了"视觉表征定律",揭示了跨模态对齐、视觉表征一致性及模型整体性能之间的强相关性。为量化这一关系,我们定义了跨模态对齐度(分数)与表征一致度(分数)两项指标。通过在15种不同视觉表征配置下的系统性实验,并结合8个基准测试的评估,我们发现分数与分数与模型性能呈现二次函数关系。基于这一规律,我们能够直接筛选并训练出最优视觉表征方案,在无需反复微调语言模型的情况下,实现计算成本降低99.7%的显著效果。
2025-06-24 20:45:37
931
原创 Tool-Star:赋予大模型结合多工具推理的能力
大型语言模型(LLMs)通过大规模强化学习(RL)展现了卓越的推理能力。然而,利用RL算法赋能LLMs进行有效的多工具协作推理仍然是一个开放性挑战。为了解决这一问题,我们提出了 Tool-Star ,一个基于强化学习的框架,旨在引导大模型逐步高效掌握调用多种工具的能力,从而提升其处理复杂推理任务的泛化性。我们的实验表明,Tool-Star框架能够在复杂计算型推理任务(AIME24、AIME25、MATH、MATH500等),以及知识型推理任务上(WebWalker、MuSiQue、Bamboogle等)同时
2025-06-23 21:15:16
1005
原创 一文搞懂大模型的智能体开发平台(FastGPT和Dify)
在大模型智能体快速发展的今天,FastGPT和Dify作为两个最具代表性的开源智能体开发平台。FastGPT专注于知识库问答和RAG场景的深度优化,而Dify则致力于构建基于LLM的Agent智能体应用程序,降低开发门槛,支持多种应用类型。
2025-06-23 21:11:20
691
原创 颠覆传统奖励验证!抛弃第三方打分,大模型自证式推理训练法
一句话概括:穷哥们的强化学习指南——不用额外算力养裁判模型,靠参考答案的"自信即真理"也能弯道超车
2025-06-23 21:09:13
1019
原创 图提示在图学习模型中的应用:近期进展与未来方向
图学习模型在从大规模图数据中学习表达性表示方面展现了强大的能力,并在各种真实世界的应用场景中取得了显著成效。作为一种训练强大图学习模型的常见策略,"预训练、适应"方案首先以自监督方式在未标注的图数据上预训练图学习模型,然后将其适应于特定的下游任务。在适应阶段,图提示作为一种有前景的方法应运而生,它在保持预训练图学习模型不变的情况下,学习可训练的提示。在本文中,我们对图提示的最新进展进行了系统综述。首先,我们介绍了作为图提示基础步骤的代表性图预训练方法。接下来,我们回顾了图提示中的主流技术,并详细阐述了它们如
2025-06-22 10:45:00
565
原创 Graph-RAG全面综述:如何用知识图谱+大模型解决信息检索难题?
本文为《Graph Retrieval-Augmented Generation: A Survey》的深度精读,对论文内容进行了总结与提炼,希望帮助读者快速把握核心要点。在关键部分还附有拓展阅读建议,以引导进一步深入学习。由于部分内容基于基础概念之上展开,因此文中对相关基础知识有所略过。
2025-06-21 19:57:52
738
原创 突破传统限制:AutoSchemaKG如何实现全自动知识图谱构建
我们提出了AutoSchemaKG,一个完全自主的知识图谱构建框架,无需预定义模式。我们的系统利用大型语言模型同时提取知识三元组和直接从文本中归纳全面的模式,对实体和事件进行建模,并在使用概念化将实例组织成语义类别的同时进行建模。处理超过5000万份文档后,我们构建了ATLAS(自动化三元链接和模式归纳),一系列拥有9亿多个节点和59亿多条边的知识图谱。这种方法在多跳问答任务上优于最先进的基线,并增强了大型语言模型的事实验实性。值得注意的是,我们的模式归纳实现了与人工制定的模式95%的语义对齐,且零手动干预
2025-06-21 19:55:14
418
原创 清华:首个具身R1来了!协同框架下RL激活基座模型的视频空间推理能力,性能提升超10%!
受OpenAI-o1/o3、DeepSeek-R1等推理模型的启发,本论文提出了首个基于连续视觉感知的具身空间推理框架Embodied-R,通过强化学习(RL, Reinforcement Learning)和大小模型协同,将R1推理训练范式拓宽至具身智能领域。
2025-06-20 22:48:10
306
原创 北航李伯虎院士任磊教授团队 | 工业大模型IFMsys架构,打造智能制造新范式
工业大模型已成为国内外产学研各界关注的前沿焦点方向。然而,工业大模型并不是通用大语言模型在工业的简单落地应用,其底层架构和应用逻辑存在本质差异。在李伯虎院士、国际建模仿真学会原主席张霖教授指导下,北京航空航天大学任磊教授带领青年教师和研究生自2022年起开始探索这一前沿方向,当前在《IEEE Transactions on Cybernetics》提出工业大模型体系架构IFMsys,提出工业大模型应用框架,并推出工业大模型原型系统MetaIndux。
2025-06-19 20:17:37
893
原创 一网打尽:AI 大模型应用架构图终极合集
人工智能已然成为推动各行业变革的核心力量。而 AI 大模型,更是以其强大的通用性和适应性,开创了智能应用的新纪元。从精准营销到智能安防,从医疗诊断到工业制造,AI 大模型正深度融入各个领域,重塑行业生态。
2025-06-19 20:15:52
938
原创 工业维护新趋势:生成式 AI 六阶段框架落地指南
生成式人工智能(AI)通过在故障中断生产之前识别故障、减少停机时间并优化资产性能,正在改变工业维护。传统的维护方法,无论是被动的、预防性的还是早期预测性的,往往缺乏精确性,导致不必要的维修、漏检和成本增加。
2025-06-19 20:14:13
1002
原创 10min让你用Dify零代码搭建一个属于你的大模型知识库
通过学习能得到什么?可以得到一个简单的应用可以更深入了解大模型知识库的工作流大家有兴趣,可以跳到文末先看效果
2025-06-19 20:12:38
933
原创 一键式训练端到端Agent,Qwen3+MCP工具集高效集成!
RLFactory能够让你通过低代码的方式快速训练你的端到端Agent模型,以Qwen3等最新的模型为基座调用你的MCP工具集!
2025-06-18 19:55:11
734
原创 RAG-MCP:通过检索增强生成和模型上下文协议增强AI代理
随着基础模型能力的提升,现实世界的应用需求日益增长,要求AI具备上下文感知、检索增强和代理驱动的特性。这正是RAG-MCP大放异彩的地方。
2025-06-18 19:53:35
775
原创 本地私有化RAG知识库搭建心得总结
2025年2月,国内AI领域迎来现象级事件-DeepSeek突然全网爆红。引发指数级用户增长。面对激增的访问压力,平台服务器多次出现服务中断,"请求失败"的提示界面成为用户高频讨论话题,由此掀起了一场自建AI私有部署的热潮。
2025-06-18 19:52:00
922
原创 Agent也能蒸馏了!性能超好
大模型的困境:能力越强,成本越高!LLM 虽然能解数学题、答冷知识,但运行成本极高,好比“雇一个年薪百万的博士随时待命”。
2025-06-18 19:50:25
878
原创 什么是AI Agents?什么是Agentic AI?他们有何不同?
目前,AI Agents 和 Agentic AI 是近年来备受瞩目的新兴概念。随着生成式人工智能模型(如 ChatGPT)的兴起,AI Agents 和 Agentic AI 的研究和应用迅速扩展。本文将详细探讨 AI Agents 和 Agentic AI 的定义、特性、架构、应用领域以及它们之间的区别,并提供一个专业的对比分析。
2025-06-17 20:36:15
797
原创 LLaMA Factory 微调教程:如何构建高质量数据集?
在开始学习之前,首先我们先补充演示一下,我们整体这次微调教程中,微调案例的一个最终效果。在本教程中,我们微调的基础模型是 Qwen2.5-7B-Instruct ,目标是微调后让其在特定场景下具备一定的推理能力,并且在 Web 安全领域具备专家级水准。
2025-06-17 20:34:41
803
原创 无需标注和奖励模型!仅靠自信度RL,16个样本训练20步,效果飙升21%!
这篇论文提出了RLSC(基于自信心的强化学习),让大语言模型用自身答案的置信度作为奖励信号。就像学生通过检查自己的解题把握来提升成绩,完全摆脱对人类标注的依赖。
2025-06-17 20:31:34
604
原创 大模型公司挖墙脚哪家强?报告:Anthropic人才吸引力是OpenAI的8倍,留存率达80%
大模型公司挖墙脚哪家强,Anthropic才是最大赢家?不仅顶尖AI人才的留*存率达到80*%,而且工程师从OpenAI跳槽到Anthropic的可能性是从Anthropic转投OpenAI的8倍。
2025-06-16 21:13:17
864
原创 遥感论文 | GRSM | ImageRAG:基于VLM和RAG的遥感图像上下文检索机制,有效解决遥感影像问答难题
超高分辨率(UHR)遥感影像(RSI)(例如10000×10000像素)对当前的遥感视觉语言模型(RSVLMs)提出了重大挑战。如果选择将超高分辨率图像调整为标准输入图像大小,其包含的大量空间和上下文信息将会被忽略。
2025-06-16 21:11:22
704
原创 乖乖,太能打了!多模态融合目标检测新SOTA性能起飞!
为解决传统目标检测在复杂环境下效果不佳等问题,研究者们提出了多模态融合目标检测。通过整合来自多个传感器的数据,充分利用不同传感器的优点,多模态融合目标检测能够更全面地捕捉目标信息,显著提高检测的准确性和鲁棒性,以及模型在各种环境条件下的适应能力。
2025-06-15 10:45:00
918
原创 Nat Commun | DrBioRight 2.0:由大语言模型驱动的、进行癌症功能蛋白质组学分析的生物信息学聊天机器人
Nat Commun | DrBioRight 2.0:由大语言模型驱动的、进行癌症功能蛋白质组学分析的生物信息学聊天机器人
2025-06-14 10:45:00
734
原创 迟来!解读Qwen开源的Embedding模型中的细节!附实测结果!
上周五,Qwen团队又开源了Embedding模型,真是人民需要什么,它开源什么呀!
2025-06-13 22:54:51
1127
原创 MCP 和 A2A 之后又一 AI Agent 协议刷屏了:AG-UI 协议架构设计剖析
随着 AI Agent 在企业中应用越来越广,AI Agent 在落地过程中,MCP 解决了 AI Agent 到 Tools 之间的通信标准,A2A 解决了 AI Agent 到 AI Agent 之间的通信标准。但是仍缺少一块:用户到 AI Agent 的通信协议。
2025-06-12 21:11:20
826
原创 实战|Spring +Milvus,Java也能实现的企业级文档问答RAG
在企业数字化转型的浪潮中,PDF、Word 等海量文档往往沉睡在各个业务系统中,形成“数据孤岛”,难以被智能系统高效利用。那么,如何构建一个真正面向企业场景落地的 AI 应用,让 AI 成为企业的“智能助手”?本项目提供一套基于 Spring 框架的完整解决方案,结合文档 ETL、向量检索与 RAG 问答技术,覆盖从数据导入到智能对话的全链路实践。
2025-06-12 21:07:38
644
原创 Agentic的模式和实现代码
这个是一个workflow的Agent 模式,一个 LLM 调用的输出依次进入下一个 LLM 调用的输入。这种模式将任务分解为一系列固定的步骤。每一步都由一个 LLM 调用处理前一步LLM处理的输出。这种模式适用于可清晰分解为可预测的顺序子任务的任务。
2025-06-11 19:42:27
620
原创 Qwen3模型架构、训练方法梳理
Dense 模型结构改进:GQA、SwiGLU、RoPE、RMSNorm with pre-normalization与Qwen2.5 相似。移除了 Qwen2 中的 移除QKV偏置,减少模型复杂性,在注意力机制中引入 QK-Norm 来确保稳定训练。
2025-06-11 19:40:26
1243
原创 RAG新选择!阿里开源向量大模型Qwen-Embedding和重排序大模型,评分超谷歌向量模型,检索排行榜第一!完全免费开源
阿里巴巴Qwen团队发布了全新的Qwen3 Embedding系列模型,这是一套基于Qwen3基础模型构建的专用文本向量与重排(Reranking)模型。该系列模型凭借Qwen3强大的多语言理解能力,在多项文本向量与重排任务的Benchmark上达到了SOTA水平,其中8B尺寸的向量模型在MTEB多语言排行榜上排名第一。Qwen3 Reranker模型在多个评测基准上同样大幅超越了现有的主流开源竞品。
2025-06-11 19:38:47
884
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人