自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1326)
  • 收藏
  • 关注

原创 开源界新王牌,多任务生成全屠榜!智源重磅开源OmniGen2:独创多模态反思机制

在原始的 OmniGen 框架中,本文采用了自回归建模用于文本生成,以及基于扩散的方法用于图像生成,二者都在以 phi-3 初始化的 Transformer 架构中实现。在 OmniGen 发布之后,本文进行了一系列后续实验。首先,本文将 phi-3 替换为更强大的 Qwen 模型。出人意料的是,尽管使用了更强的大语言模型(LLM),本文观察到图像生成质量有所下降。其次,本文探索了一种专家混合(MoE)策略,用于独立路由文本和图像参数,类似于 LMfusion 中的方法。本文的研究发现:将图像分支初始化为来

2025-06-27 20:24:52 379

原创 人工智能中医药进展I

摘要:处方建议对于中国传统医学(TCM)的临床决策支持至关重要,旨在根据患者的症状推荐一组草药。中医临床实践的核心原则是基于症状预测证候,以遵循四个步骤的渐进过程:症状到证候,治疗方法和草药。然而,现有模型过于简化了这一过程,忽略了治疗方法,直接将症状映射到草药或综合征映射到草药,导致信息丢失并降低推荐处方的有效性。此外,证候和治疗方法之间的隐含,稀缺和多对多的关系,再加上治疗方法和草药之间的非线性相互作用,进一步阻碍了整个中医辨证过程的建模。为了应对这些挑战,我们提出了一种新的四部图范式,明确模拟\**中

2025-06-27 20:23:45 420

原创 MCP 万字全解:从原理到实战,这篇最全,建议收藏

还记得 GPT-4 一出手,横扫千军的场景吗?模型越来越强,参数越来越大,大家也越来越疑惑:

2025-06-27 20:21:39 499

原创 GenRank: 小红书大规模生成式排序探索

TLDR:** 生成式推荐作为一种新兴范式,在信息检索领域展现出巨大潜力。然而,生成式排序系统在大规模工业环境中的有效性和可行性仍待深入研究。本文通过在小红书的“发现页”推荐系统中进行实验,提出了GenRank架构,显著提升了用户满意度,同时保持了与现有生产系统相当的计算资源消耗。

2025-06-27 20:20:49 271

原创 多模态任务大一统!蚂蚁推出Ming-Omni:图像、文本、语音三模态无缝融合,一网打尽复杂任务!

Ming-lite-omni 是 Ming-omni 的轻量版本,源自 Ling-lite,具有28亿激活参数。Ming-lite-omni 是一个统一的多模态模型,能够处理图像、文本、音频和视频,并在语音和图像生成方面表现出强大的能力。

2025-06-26 21:11:44 540

原创 论文浅尝 | LightPROF:一种用于基于知识图谱的大语言模型的轻量级推理框架(AAAI2025)

大语言模型(LLMs)在文本理解和零样本推理方面表现出令人瞩目的能力。然而,知识更新的延迟可能导致它们推理错误或产生有害结果。知识图谱(KGs)通过对广泛的实体和关系进行结构化组织和连接,为大语言模型的推理过程提供丰富且可靠的上下文信息。现有的基于知识图谱的大语言模型推理方法仅以文本形式将知识图谱的知识注入提示中,忽略了其结构信息。此外,它们大多依赖于闭源模型或大参数的开源模型,这对高资源消耗提出了挑战。为解决这些问题,作者提出了一种新颖的轻量级且高效的用于知识图谱问答(KGQA)的提示学习推理框架(Lig

2025-06-26 21:10:31 538

原创 大模型私有部署的最优解:构建企业级大模型统一能力底座

企业在推进AI大模型私有化部署时,往往会陷入从算力选型适配到系统配置的多重困境,真正限制落地效率的并非单一技术点,而是多环节间的耦合与不确定性,构建企业级大模型统一能力平台针对这一全链条复杂性,提供平台化解耦方案,可以帮助企业缩短部署周期,降低尝试门槛。

2025-06-26 21:09:03 525

原创 GraphRAG变种:HippoRAG进化到HippoRAG2.0,提升多跳复杂推理性能

HippoRAG2生成的图更为密集,提高了信息连接性和覆盖范围。并且这种变种的GraphRAG在需要多跳推理和上下文综合的任务中表现优异。

2025-06-26 21:07:20 470

原创 大模型微调前必须想清楚的5个问题:别让你的项目从入门到放弃

本文主要面向广大中小企业、传统行业的管理者和探索AI的“正规军”。

2025-06-25 20:17:43 571

原创 图解AI:RAG分块策略

RAG作为大模型入门级的应用,在处理策略上要比写提示语好落地的很多。刚刚经历了一个AI落地大项目的上线,提示语写了将近5000字。比起写提示语我还是更愿意写crud。

2025-06-25 20:15:10 625

原创 GraphRAG + DeepSearch: 下一代企业级人机协同大模型推理架构及医药法律等领域Agent深度详解

深度图谱检索增强生成(GraphRAG)系统正在推动专业问答、知识管理与自动化研究的边界。本文全面介绍了GraphRAG + DeepSearch系统的核心架构、技术细节和关键实现,并通过图文并茂的方式深入剖析其多智能体、知识图谱、搜索与推理体系,以及工程化的数据流和界面实现,助力专业人士全方位理解和落地先进的知识驱动问答平台。

2025-06-25 20:13:33 967

原创 RAG的2025趋势重点及RAG+抽取场景的来源定位问题思考

为什么在实际落地过程中,比如信息抽取、RAG 等,会有引文生成、来源定位这些需求?底层的逻辑是什么?有哪些实际的例子?在技术上如何做?

2025-06-24 21:15:05 596

原创 TTRL(Test-Time RL)微调新方法:极简版RL,效果吊打SFT

聚焦:提出的TTRL(Test-Time强化学习)给出了答案:*让AI自己生成答案,通过“投票”选出共识,再用共识作为奖励信号驱动学习。*

2025-06-24 20:47:13 926

原创 多模态大模型中的视觉表征定律

本文在多模态大语言模型(MLLMs)中提出了"视觉表征定律",揭示了跨模态对齐、视觉表征一致性及模型整体性能之间的强相关性。为量化这一关系,我们定义了跨模态对齐度(分数)与表征一致度(分数)两项指标。通过在15种不同视觉表征配置下的系统性实验,并结合8个基准测试的评估,我们发现分数与分数与模型性能呈现二次函数关系。基于这一规律,我们能够直接筛选并训练出最优视觉表征方案,在无需反复微调语言模型的情况下,实现计算成本降低99.7%的显著效果。

2025-06-24 20:45:37 985

原创 Tool-Star:赋予大模型结合多工具推理的能力

大型语言模型(LLMs)通过大规模强化学习(RL)展现了卓越的推理能力。然而,利用RL算法赋能LLMs进行有效的多工具协作推理仍然是一个开放性挑战。为了解决这一问题,我们提出了 Tool-Star ,一个基于强化学习的框架,旨在引导大模型逐步高效掌握调用多种工具的能力,从而提升其处理复杂推理任务的泛化性。我们的实验表明,Tool-Star框架能够在复杂计算型推理任务(AIME24、AIME25、MATH、MATH500等),以及知识型推理任务上(WebWalker、MuSiQue、Bamboogle等)同时

2025-06-23 21:15:16 1008

原创 一文搞懂大模型的智能体开发平台(FastGPT和Dify)

在大模型智能体快速发展的今天,FastGPT和Dify作为两个最具代表性的开源智能体开发平台。FastGPT专注于知识库问答和RAG场景的深度优化,而Dify则致力于构建基于LLM的Agent智能体应用程序,降低开发门槛,支持多种应用类型。

2025-06-23 21:11:20 697

原创 颠覆传统奖励验证!抛弃第三方打分,大模型自证式推理训练法

一句话概括:穷哥们的强化学习指南——不用额外算力养裁判模型,靠参考答案的"自信即真理"也能弯道超车

2025-06-23 21:09:13 1021

原创 图提示在图学习模型中的应用:近期进展与未来方向

图学习模型在从大规模图数据中学习表达性表示方面展现了强大的能力,并在各种真实世界的应用场景中取得了显著成效。作为一种训练强大图学习模型的常见策略,"预训练、适应"方案首先以自监督方式在未标注的图数据上预训练图学习模型,然后将其适应于特定的下游任务。在适应阶段,图提示作为一种有前景的方法应运而生,它在保持预训练图学习模型不变的情况下,学习可训练的提示。在本文中,我们对图提示的最新进展进行了系统综述。首先,我们介绍了作为图提示基础步骤的代表性图预训练方法。接下来,我们回顾了图提示中的主流技术,并详细阐述了它们如

2025-06-22 10:45:00 566

原创 Graph-RAG全面综述:如何用知识图谱+大模型解决信息检索难题?

本文为《Graph Retrieval-Augmented Generation: A Survey》的深度精读,对论文内容进行了总结与提炼,希望帮助读者快速把握核心要点。在关键部分还附有拓展阅读建议,以引导进一步深入学习。由于部分内容基于基础概念之上展开,因此文中对相关基础知识有所略过。

2025-06-21 19:57:52 741

原创 突破传统限制:AutoSchemaKG如何实现全自动知识图谱构建

我们提出了AutoSchemaKG,一个完全自主的知识图谱构建框架,无需预定义模式。我们的系统利用大型语言模型同时提取知识三元组和直接从文本中归纳全面的模式,对实体和事件进行建模,并在使用概念化将实例组织成语义类别的同时进行建模。处理超过5000万份文档后,我们构建了ATLAS(自动化三元链接和模式归纳),一系列拥有9亿多个节点和59亿多条边的知识图谱。这种方法在多跳问答任务上优于最先进的基线,并增强了大型语言模型的事实验实性。值得注意的是,我们的模式归纳实现了与人工制定的模式95%的语义对齐,且零手动干预

2025-06-21 19:55:14 427

原创 清华:首个具身R1来了!协同框架下RL激活基座模型的视频空间推理能力,性能提升超10%!

受OpenAI-o1/o3、DeepSeek-R1等推理模型的启发,本论文提出了首个基于连续视觉感知的具身空间推理框架Embodied-R,通过强化学习(RL, Reinforcement Learning)和大小模型协同,将R1推理训练范式拓宽至具身智能领域。

2025-06-20 22:48:10 307

原创 北航李伯虎院士任磊教授团队 | 工业大模型IFMsys架构,打造智能制造新范式

工业大模型已成为国内外产学研各界关注的前沿焦点方向。然而,工业大模型并不是通用大语言模型在工业的简单落地应用,其底层架构和应用逻辑存在本质差异。在李伯虎院士、国际建模仿真学会原主席张霖教授指导下,北京航空航天大学任磊教授带领青年教师和研究生自2022年起开始探索这一前沿方向,当前在《IEEE Transactions on Cybernetics》提出工业大模型体系架构IFMsys,提出工业大模型应用框架,并推出工业大模型原型系统MetaIndux。

2025-06-19 20:17:37 895

原创 一网打尽:AI 大模型应用架构图终极合集

人工智能已然成为推动各行业变革的核心力量。而 AI 大模型,更是以其强大的通用性和适应性,开创了智能应用的新纪元。从精准营销到智能安防,从医疗诊断到工业制造,AI 大模型正深度融入各个领域,重塑行业生态。

2025-06-19 20:15:52 940

原创 工业维护新趋势:生成式 AI 六阶段框架落地指南

生成式人工智能(AI)通过在故障中断生产之前识别故障、减少停机时间并优化资产性能,正在改变工业维护。传统的维护方法,无论是被动的、预防性的还是早期预测性的,往往缺乏精确性,导致不必要的维修、漏检和成本增加。

2025-06-19 20:14:13 1010

原创 10min让你用Dify零代码搭建一个属于你的大模型知识库

通过学习能得到什么?可以得到一个简单的应用可以更深入了解大模型知识库的工作流大家有兴趣,可以跳到文末先看效果

2025-06-19 20:12:38 938

原创 一键式训练端到端Agent,Qwen3+MCP工具集高效集成!

RLFactory能够让你通过低代码的方式快速训练你的端到端Agent模型,以Qwen3等最新的模型为基座调用你的MCP工具集!

2025-06-18 19:55:11 735

原创 RAG-MCP:通过检索增强生成和模型上下文协议增强AI代理

随着基础模型能力的提升,现实世界的应用需求日益增长,要求AI具备上下文感知、检索增强和代理驱动的特性。这正是RAG-MCP大放异彩的地方。

2025-06-18 19:53:35 775

原创 本地私有化RAG知识库搭建心得总结

2025年2月,国内AI领域迎来现象级事件-DeepSeek突然全网爆红。引发指数级用户增长。面对激增的访问压力,平台服务器多次出现服务中断,"请求失败"的提示界面成为用户高频讨论话题,由此掀起了一场自建AI私有部署的热潮。

2025-06-18 19:52:00 923

原创 Agent也能蒸馏了!性能超好

大模型的困境:能力越强,成本越高!LLM 虽然能解数学题、答冷知识,但运行成本极高,好比“雇一个年薪百万的博士随时待命”。

2025-06-18 19:50:25 878

原创 什么是AI Agents?什么是Agentic AI?他们有何不同?

目前,AI Agents 和 Agentic AI 是近年来备受瞩目的新兴概念。随着生成式人工智能模型(如 ChatGPT)的兴起,AI Agents 和 Agentic AI 的研究和应用迅速扩展。本文将详细探讨 AI Agents 和 Agentic AI 的定义、特性、架构、应用领域以及它们之间的区别,并提供一个专业的对比分析。

2025-06-17 20:36:15 811

原创 LLaMA Factory 微调教程:如何构建高质量数据集?

在开始学习之前,首先我们先补充演示一下,我们整体这次微调教程中,微调案例的一个最终效果。在本教程中,我们微调的基础模型是 Qwen2.5-7B-Instruct ,目标是微调后让其在特定场景下具备一定的推理能力,并且在 Web 安全领域具备专家级水准。

2025-06-17 20:34:41 806

原创 无需标注和奖励模型!仅靠自信度RL,16个样本训练20步,效果飙升21%!

这篇论文提出了RLSC(基于自信心的强化学习),让大语言模型用自身答案的置信度作为奖励信号。就像学生通过检查自己的解题把握来提升成绩,完全摆脱对人类标注的依赖。

2025-06-17 20:31:34 604

原创 新思路!如何在数据稀缺下构建高质量丰富数据集?

为什么微调之后,模型还是没学会新知识?在有限的数据场景下如何构建出更高质量、更丰富的数据集?

2025-06-16 21:17:47 1044

原创 大模型公司挖墙脚哪家强?报告:Anthropic人才吸引力是OpenAI的8倍,留存率达80%

大模型公司挖墙脚哪家强,Anthropic才是最大赢家?不仅顶尖AI人才的留*存率达到80*%,而且工程师从OpenAI跳槽到Anthropic的可能性是从Anthropic转投OpenAI的8倍。

2025-06-16 21:13:17 872

原创 遥感论文 | GRSM | ImageRAG:基于VLM和RAG的遥感图像上下文检索机制,有效解决遥感影像问答难题

超高分辨率(UHR)遥感影像(RSI)(例如10000×10000像素)对当前的遥感视觉语言模型(RSVLMs)提出了重大挑战。如果选择将超高分辨率图像调整为标准输入图像大小,其包含的大量空间和上下文信息将会被忽略。

2025-06-16 21:11:22 706

原创 乖乖,太能打了!多模态融合目标检测新SOTA性能起飞!

为解决传统目标检测在复杂环境下效果不佳等问题,研究者们提出了多模态融合目标检测。通过整合来自多个传感器的数据,充分利用不同传感器的优点,多模态融合目标检测能够更全面地捕捉目标信息,显著提高检测的准确性和鲁棒性,以及模型在各种环境条件下的适应能力。

2025-06-15 10:45:00 924

原创 Nat Commun | DrBioRight 2.0:由大语言模型驱动的、进行癌症功能蛋白质组学分析的生物信息学聊天机器人

Nat Commun | DrBioRight 2.0:由大语言模型驱动的、进行癌症功能蛋白质组学分析的生物信息学聊天机器人

2025-06-14 10:45:00 734

原创 迟来!解读Qwen开源的Embedding模型中的细节!附实测结果!

上周五,Qwen团队又开源了Embedding模型,真是人民需要什么,它开源什么呀!

2025-06-13 22:54:51 1132

原创 AI【简历评估】智能体:一个找“工作“的工作流

小伙伴,你很幸运!只要你能看完本期,你就解锁一个技术含金量很高的工作流。

2025-06-12 21:12:55 1020

原创 MCP 和 A2A 之后又一 AI Agent 协议刷屏了:AG-UI 协议架构设计剖析

随着 AI Agent 在企业中应用越来越广,AI Agent 在落地过程中,MCP 解决了 AI Agent 到 Tools 之间的通信标准,A2A 解决了 AI Agent 到 AI Agent 之间的通信标准。但是仍缺少一块:用户到 AI Agent 的通信协议。

2025-06-12 21:11:20 828

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除