自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1305)
  • 收藏
  • 关注

原创 北航李伯虎院士任磊教授团队 | 工业大模型IFMsys架构,打造智能制造新范式

工业大模型已成为国内外产学研各界关注的前沿焦点方向。然而,工业大模型并不是通用大语言模型在工业的简单落地应用,其底层架构和应用逻辑存在本质差异。在李伯虎院士、国际建模仿真学会原主席张霖教授指导下,北京航空航天大学任磊教授带领青年教师和研究生自2022年起开始探索这一前沿方向,当前在《IEEE Transactions on Cybernetics》提出工业大模型体系架构IFMsys,提出工业大模型应用框架,并推出工业大模型原型系统MetaIndux。

2025-06-19 20:17:37 66

原创 一网打尽:AI 大模型应用架构图终极合集

人工智能已然成为推动各行业变革的核心力量。而 AI 大模型,更是以其强大的通用性和适应性,开创了智能应用的新纪元。从精准营销到智能安防,从医疗诊断到工业制造,AI 大模型正深度融入各个领域,重塑行业生态。

2025-06-19 20:15:52 115

原创 工业维护新趋势:生成式 AI 六阶段框架落地指南

生成式人工智能(AI)通过在故障中断生产之前识别故障、减少停机时间并优化资产性能,正在改变工业维护。传统的维护方法,无论是被动的、预防性的还是早期预测性的,往往缺乏精确性,导致不必要的维修、漏检和成本增加。

2025-06-19 20:14:13 222

原创 10min让你用Dify零代码搭建一个属于你的大模型知识库

通过学习能得到什么?可以得到一个简单的应用可以更深入了解大模型知识库的工作流大家有兴趣,可以跳到文末先看效果

2025-06-19 20:12:38 74

原创 一键式训练端到端Agent,Qwen3+MCP工具集高效集成!

RLFactory能够让你通过低代码的方式快速训练你的端到端Agent模型,以Qwen3等最新的模型为基座调用你的MCP工具集!

2025-06-18 19:55:11 456

原创 RAG-MCP:通过检索增强生成和模型上下文协议增强AI代理

随着基础模型能力的提升,现实世界的应用需求日益增长,要求AI具备上下文感知、检索增强和代理驱动的特性。这正是RAG-MCP大放异彩的地方。

2025-06-18 19:53:35 601

原创 本地私有化RAG知识库搭建心得总结

2025年2月,国内AI领域迎来现象级事件-DeepSeek突然全网爆红。引发指数级用户增长。面对激增的访问压力,平台服务器多次出现服务中断,"请求失败"的提示界面成为用户高频讨论话题,由此掀起了一场自建AI私有部署的热潮。

2025-06-18 19:52:00 547

原创 Agent也能蒸馏了!性能超好

大模型的困境:能力越强,成本越高!LLM 虽然能解数学题、答冷知识,但运行成本极高,好比“雇一个年薪百万的博士随时待命”。

2025-06-18 19:50:25 603

原创 什么是AI Agents?什么是Agentic AI?他们有何不同?

目前,AI Agents 和 Agentic AI 是近年来备受瞩目的新兴概念。随着生成式人工智能模型(如 ChatGPT)的兴起,AI Agents 和 Agentic AI 的研究和应用迅速扩展。本文将详细探讨 AI Agents 和 Agentic AI 的定义、特性、架构、应用领域以及它们之间的区别,并提供一个专业的对比分析。

2025-06-17 20:36:15 658

原创 LLaMA Factory 微调教程:如何构建高质量数据集?

在开始学习之前,首先我们先补充演示一下,我们整体这次微调教程中,微调案例的一个最终效果。在本教程中,我们微调的基础模型是 Qwen2.5-7B-Instruct ,目标是微调后让其在特定场景下具备一定的推理能力,并且在 Web 安全领域具备专家级水准。

2025-06-17 20:34:41 668

原创 无需标注和奖励模型!仅靠自信度RL,16个样本训练20步,效果飙升21%!

这篇论文提出了RLSC(基于自信心的强化学习),让大语言模型用自身答案的置信度作为奖励信号。就像学生通过检查自己的解题把握来提升成绩,完全摆脱对人类标注的依赖。

2025-06-17 20:31:34 515

原创 新思路!如何在数据稀缺下构建高质量丰富数据集?

为什么微调之后,模型还是没学会新知识?在有限的数据场景下如何构建出更高质量、更丰富的数据集?

2025-06-16 21:17:47 1007

原创 大模型公司挖墙脚哪家强?报告:Anthropic人才吸引力是OpenAI的8倍,留存率达80%

大模型公司挖墙脚哪家强,Anthropic才是最大赢家?不仅顶尖AI人才的留*存率达到80*%,而且工程师从OpenAI跳槽到Anthropic的可能性是从Anthropic转投OpenAI的8倍。

2025-06-16 21:13:17 829

原创 遥感论文 | GRSM | ImageRAG:基于VLM和RAG的遥感图像上下文检索机制,有效解决遥感影像问答难题

超高分辨率(UHR)遥感影像(RSI)(例如10000×10000像素)对当前的遥感视觉语言模型(RSVLMs)提出了重大挑战。如果选择将超高分辨率图像调整为标准输入图像大小,其包含的大量空间和上下文信息将会被忽略。

2025-06-16 21:11:22 693

原创 乖乖,太能打了!多模态融合目标检测新SOTA性能起飞!

为解决传统目标检测在复杂环境下效果不佳等问题,研究者们提出了多模态融合目标检测。通过整合来自多个传感器的数据,充分利用不同传感器的优点,多模态融合目标检测能够更全面地捕捉目标信息,显著提高检测的准确性和鲁棒性,以及模型在各种环境条件下的适应能力。

2025-06-15 10:45:00 894

原创 Nat Commun | DrBioRight 2.0:由大语言模型驱动的、进行癌症功能蛋白质组学分析的生物信息学聊天机器人

Nat Commun | DrBioRight 2.0:由大语言模型驱动的、进行癌症功能蛋白质组学分析的生物信息学聊天机器人

2025-06-14 10:45:00 724

原创 迟来!解读Qwen开源的Embedding模型中的细节!附实测结果!

上周五,Qwen团队又开源了Embedding模型,真是人民需要什么,它开源什么呀!

2025-06-13 22:54:51 933

原创 AI【简历评估】智能体:一个找“工作“的工作流

小伙伴,你很幸运!只要你能看完本期,你就解锁一个技术含金量很高的工作流。

2025-06-12 21:12:55 1005

原创 MCP 和 A2A 之后又一 AI Agent 协议刷屏了:AG-UI 协议架构设计剖析

随着 AI Agent 在企业中应用越来越广,AI Agent 在落地过程中,MCP 解决了 AI Agent 到 Tools 之间的通信标准,A2A 解决了 AI Agent 到 AI Agent 之间的通信标准。但是仍缺少一块:用户到 AI Agent 的通信协议。

2025-06-12 21:11:20 786

原创 实战|Spring +Milvus,Java也能实现的企业级文档问答RAG

在企业数字化转型的浪潮中,PDF、Word 等海量文档往往沉睡在各个业务系统中,形成“数据孤岛”,难以被智能系统高效利用。那么,如何构建一个真正面向企业场景落地的 AI 应用,让 AI 成为企业的“智能助手”?本项目提供一套基于 Spring 框架的完整解决方案,结合文档 ETL、向量检索与 RAG 问答技术,覆盖从数据导入到智能对话的全链路实践。

2025-06-12 21:07:38 623

原创 Agentic的模式和实现代码

这个是一个workflow的Agent 模式,一个 LLM 调用的输出依次进入下一个 LLM 调用的输入。这种模式将任务分解为一系列固定的步骤。每一步都由一个 LLM 调用处理前一步LLM处理的输出。这种模式适用于可清晰分解为可预测的顺序子任务的任务。

2025-06-11 19:42:27 614

原创 Qwen3模型架构、训练方法梳理

Dense 模型结构改进:GQA、SwiGLU、RoPE、RMSNorm with pre-normalization与Qwen2.5 相似。移除了 Qwen2 中的 移除QKV偏置,减少模型复杂性,在注意力机制中引入 QK-Norm 来确保稳定训练。

2025-06-11 19:40:26 1075

原创 RAG新选择!阿里开源向量大模型Qwen-Embedding和重排序大模型,评分超谷歌向量模型,检索排行榜第一!完全免费开源

阿里巴巴Qwen团队发布了全新的Qwen3 Embedding系列模型,这是一套基于Qwen3基础模型构建的专用文本向量与重排(Reranking)模型。该系列模型凭借Qwen3强大的多语言理解能力,在多项文本向量与重排任务的Benchmark上达到了SOTA水平,其中8B尺寸的向量模型在MTEB多语言排行榜上排名第一。Qwen3 Reranker模型在多个评测基准上同样大幅超越了现有的主流开源竞品。

2025-06-11 19:38:47 693

原创 ICML 2025 | 无需训练,即时对齐大模型偏好

为了让大模型(LLM)的行为更符合人类预期,一系列训练时对齐方法(例如RLHF和DPO)通过微调模型参数来实现偏好优化。然而,这种“训练时对齐”模式不仅耗时耗力,而且一旦偏好发生变化(比如安全标准更新),就得从头开始再训练一次。这种方式在应对变化需求时显得十分被动。

2025-06-11 19:37:10 861

原创 DeepSeek基础:模型预训练概念与技术详解

预训练技术的本质是让AI先建立语言世界的“通用知识地图”,再通过少量标注快速定位“任务目的地”。这种范式突破使得AI首次展现出接近人类的语言理解和创造能力。本文将从以下方面介绍:

2025-06-10 20:22:26 1098

原创 【大模型基座】Qwen3技术报告发布

模型架构:Qwen3系列包括6个密集模型(Qwen3-0.6B到Qwen3-32B)和2个MoE模型(Qwen3-30B-A3B和Qwen3-235B-A22B)。这些模型的架构类似于Qwen2.5,但进行了优化和改进,包括使用GroupedQueryAttention、SwiGLU、Rotary Positional Embeddings和RMSNorm等。

2025-06-10 20:20:44 1023

原创 多模态数据融合又冲上Nature!确定不来了解一下?

众所周知,多模态在如今是越发的火爆了,而多模态数据融合作为其中的关键技术,自然也就成为研究的热门!且还在上升期,出创新点的机会很多。主要在于,其能够整合来自不同模态的数据,减少单一数据源可能带来的误差和不确定性,从而提高信息处理的准确性和可靠性。此外,不同模态的数据还可能受到不同的噪声和干扰,通过融合,有助于模型摒除干扰,提高鲁棒性。这些特性对于医疗诊断、自动驾驶、人机交互等都至关重要!

2025-06-10 20:18:47 741

原创 理解 RAG 第三部分:融合检索与重新排序

我们之前介绍了什么是 RAG、它在大型语言模型 (LLM) 中的重要性,以及 RAG 的经典检索器、生成器系统是什么样的,本系列的第三篇文章探讨了一种构建 RAG 系统的升级方法:融合检索。

2025-06-10 20:17:10 758

原创 SFT+RL双阶训练突破LLM自我监督!人大DeepCritic实现AI批判自主进化

大语言模型(LLM)通过大规模地学习人类数据并从人类监督反馈中不断进化,在许多任务上展现出卓越的性能。然而,随着模型智能的不断增强,依赖人工监督的方式也面临着越来越高饿成本和难度。如何以更高效、可扩展的方式对日益进化的模型进行监督,成为非常重要且亟待解决的关键问题。

2025-06-09 20:51:12 806

原创 开源大模型网关:One API实现主流AI模型API的统一管理与分发

One API是一个使用go语言开发的大语言模型 API 管理与分发系统支持Docker一键快速部署,且资源占用小,高性能开箱支持多平台大模型快速接入,包括OpenAI、Gemini、xAI、Grop、Anthropic Claude、Ollama、Deepseek、智谱AI、豆包、文心一言等等

2025-06-09 20:48:52 864

原创 从表面到深入:利用知识图谱和大模型整合外部知识以生成跟进问题 - 东南大学&中国移动研究院

在对话系统中,基于上下文动态生成跟进问题可以帮助用户探索信息并提供更好的用户体验。人类通常能够提出涉及一些普遍生活知识的问题,并展示出更高阶的认知技能。然而,现有方法生成的问题常常局限于浅层的上下文问题,这些问题的启发性不足,与人类水平存在较大差距。本文提出了一种三阶段的外部知识增强的跟进问题生成方法,该方法通过识别上下文主题、在线构建知识图谱(KG),最后将其与大型语言模型结合来生成最终问题。该模型通过引入外部常识知识并执行知识融合操作,生成信息丰富且具有探索性的跟进问题。实验表明,与基线模型相比,我们的

2025-06-09 20:46:29 818

原创 两大 智能体框架 Dify vs Langchain 怎么选 ? 来一个彻底、全面、深入的分析

在 AI 智能体应用 开发的世界里,选择一个合适的框架是至关重要的。选对智能体 平台非常关键, 它直接影响你的AI应用的效率、可扩展性和整体表现。

2025-06-09 20:44:46 797

原创 中国AI医疗大模型七强—病理大模型

今天小医和大家来聊聊AI医疗领域一个非常硬核且意义重大的方向——AI病理诊断大模型。病理诊断被誉为疾病诊断的“金标准”,但传统模式下,病理医生培养周期长、工作负荷大,且存在一定的主观性。现在,中国的AI力量正试图用“大模型”这把利器,为病理诊断带来一场智慧革命!

2025-06-08 10:45:00 936

原创 给MCP加上RAG,工具准确率提升200%,起飞~

大型语言模型(LLMs)在有效利用越来越多的外部工具(如模型上下文协议(MCP)所定义的工具)方面存在困难,这是由于提示膨胀和选择复杂性造成的。因此引入了RAG-MCP,这是一个检索增强生成框架,通过卸载工具发现来克服这一挑战。

2025-06-07 19:33:02 974

原创 从单 Agent 到多 Agent 的案例落地实践

关于 Agent 的定义目前还没有形成共识,目前有3个代表性的定义:流行最广的是前 OpenAI 研究与安全副总裁 Lilian Weng 对 Agent 的定义:Agent = LLM + Planning + Tools + Memory。

2025-06-07 19:31:28 1028

原创 人工智能和知识图谱七:知识图谱在人工智能系统中的优势

知识图谱融入 AI 解决方案后,将带来诸多优势。这些优势涵盖互操作性、查询功能等技术改进以及可解释性、可信度、减少开发工作量等更高层次的关注点。本文概述了知识图谱的主要优势,以及它如何补充机器学习模型,助力打造更值得信赖的 AI。

2025-06-06 19:32:30 937

原创 工业大模型体系架构、关键技术与典型应用研究总结报告

工业制造业正从数字化、网络化迈向智能化发展新阶段,大模型技术的兴起为工业智能化转型提供了全新可能。然而,通用大模型在工业应用中面临五大核心挑战,凸显了工业大模型独立研究的必要性:

2025-06-06 19:31:28 1090

原创 大模型驱动多智能体的军事需求生成框架研究报告

在现代战争形态向智能化、联合作战转型的背景下,军事需求生成作为联合作战体系设计的基础环节,面临着前所未有的挑战。传统军事需求生成方法主要依赖个体经验和多源文档,存在参与人员多、工作量庞大、效率低下等突出问题。随着战场信息呈现多模态、动态化特征,传统方法在处理视频、音频、文字等异构数据时,难以高效整合与分析,导致需求生成的完备性和精准性难以保证,严重制约了联合作战体系的快速构建与优化。

2025-06-06 19:28:53 781

原创 详解AI在制造业供应链管理的5大应用

制造业供应链覆盖企业从采购原材料到交付成品的全流程,包含采购、生产、物流、质量管控及售后服务等核心环节。在客户追求快速交付的竞争环境下,每个环节的高效衔接都直接影响产品交付速度和资源利用率。

2025-06-05 19:14:58 816

原创 个人向AI Coding全栈开发实践

把AI当作一个听你指挥和调派的助手,**怎么跟人沟通,就怎么跟AI沟通。有条理、无歧义地描述问题的能力越强,用起AI来就越得心应手。如果AI听不懂你的描述,那80%的人也听不懂。

2025-06-05 19:13:22 666

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除