- 博客(1289)
- 收藏
- 关注
原创 迟来!解读Qwen开源的Embedding模型中的细节!附实测结果!
上周五,Qwen团队又开源了Embedding模型,真是人民需要什么,它开源什么呀!
2025-06-13 22:54:51
468
原创 MCP 和 A2A 之后又一 AI Agent 协议刷屏了:AG-UI 协议架构设计剖析
随着 AI Agent 在企业中应用越来越广,AI Agent 在落地过程中,MCP 解决了 AI Agent 到 Tools 之间的通信标准,A2A 解决了 AI Agent 到 AI Agent 之间的通信标准。但是仍缺少一块:用户到 AI Agent 的通信协议。
2025-06-12 21:11:20
447
原创 实战|Spring +Milvus,Java也能实现的企业级文档问答RAG
在企业数字化转型的浪潮中,PDF、Word 等海量文档往往沉睡在各个业务系统中,形成“数据孤岛”,难以被智能系统高效利用。那么,如何构建一个真正面向企业场景落地的 AI 应用,让 AI 成为企业的“智能助手”?本项目提供一套基于 Spring 框架的完整解决方案,结合文档 ETL、向量检索与 RAG 问答技术,覆盖从数据导入到智能对话的全链路实践。
2025-06-12 21:07:38
406
原创 Agentic的模式和实现代码
这个是一个workflow的Agent 模式,一个 LLM 调用的输出依次进入下一个 LLM 调用的输入。这种模式将任务分解为一系列固定的步骤。每一步都由一个 LLM 调用处理前一步LLM处理的输出。这种模式适用于可清晰分解为可预测的顺序子任务的任务。
2025-06-11 19:42:27
548
原创 Qwen3模型架构、训练方法梳理
Dense 模型结构改进:GQA、SwiGLU、RoPE、RMSNorm with pre-normalization与Qwen2.5 相似。移除了 Qwen2 中的 移除QKV偏置,减少模型复杂性,在注意力机制中引入 QK-Norm 来确保稳定训练。
2025-06-11 19:40:26
666
原创 RAG新选择!阿里开源向量大模型Qwen-Embedding和重排序大模型,评分超谷歌向量模型,检索排行榜第一!完全免费开源
阿里巴巴Qwen团队发布了全新的Qwen3 Embedding系列模型,这是一套基于Qwen3基础模型构建的专用文本向量与重排(Reranking)模型。该系列模型凭借Qwen3强大的多语言理解能力,在多项文本向量与重排任务的Benchmark上达到了SOTA水平,其中8B尺寸的向量模型在MTEB多语言排行榜上排名第一。Qwen3 Reranker模型在多个评测基准上同样大幅超越了现有的主流开源竞品。
2025-06-11 19:38:47
478
原创 ICML 2025 | 无需训练,即时对齐大模型偏好
为了让大模型(LLM)的行为更符合人类预期,一系列训练时对齐方法(例如RLHF和DPO)通过微调模型参数来实现偏好优化。然而,这种“训练时对齐”模式不仅耗时耗力,而且一旦偏好发生变化(比如安全标准更新),就得从头开始再训练一次。这种方式在应对变化需求时显得十分被动。
2025-06-11 19:37:10
754
原创 DeepSeek基础:模型预训练概念与技术详解
预训练技术的本质是让AI先建立语言世界的“通用知识地图”,再通过少量标注快速定位“任务目的地”。这种范式突破使得AI首次展现出接近人类的语言理解和创造能力。本文将从以下方面介绍:
2025-06-10 20:22:26
1085
原创 【大模型基座】Qwen3技术报告发布
模型架构:Qwen3系列包括6个密集模型(Qwen3-0.6B到Qwen3-32B)和2个MoE模型(Qwen3-30B-A3B和Qwen3-235B-A22B)。这些模型的架构类似于Qwen2.5,但进行了优化和改进,包括使用GroupedQueryAttention、SwiGLU、Rotary Positional Embeddings和RMSNorm等。
2025-06-10 20:20:44
999
原创 多模态数据融合又冲上Nature!确定不来了解一下?
众所周知,多模态在如今是越发的火爆了,而多模态数据融合作为其中的关键技术,自然也就成为研究的热门!且还在上升期,出创新点的机会很多。主要在于,其能够整合来自不同模态的数据,减少单一数据源可能带来的误差和不确定性,从而提高信息处理的准确性和可靠性。此外,不同模态的数据还可能受到不同的噪声和干扰,通过融合,有助于模型摒除干扰,提高鲁棒性。这些特性对于医疗诊断、自动驾驶、人机交互等都至关重要!
2025-06-10 20:18:47
720
原创 理解 RAG 第三部分:融合检索与重新排序
我们之前介绍了什么是 RAG、它在大型语言模型 (LLM) 中的重要性,以及 RAG 的经典检索器、生成器系统是什么样的,本系列的第三篇文章探讨了一种构建 RAG 系统的升级方法:融合检索。
2025-06-10 20:17:10
748
原创 SFT+RL双阶训练突破LLM自我监督!人大DeepCritic实现AI批判自主进化
大语言模型(LLM)通过大规模地学习人类数据并从人类监督反馈中不断进化,在许多任务上展现出卓越的性能。然而,随着模型智能的不断增强,依赖人工监督的方式也面临着越来越高饿成本和难度。如何以更高效、可扩展的方式对日益进化的模型进行监督,成为非常重要且亟待解决的关键问题。
2025-06-09 20:51:12
802
原创 开源大模型网关:One API实现主流AI模型API的统一管理与分发
One API是一个使用go语言开发的大语言模型 API 管理与分发系统支持Docker一键快速部署,且资源占用小,高性能开箱支持多平台大模型快速接入,包括OpenAI、Gemini、xAI、Grop、Anthropic Claude、Ollama、Deepseek、智谱AI、豆包、文心一言等等
2025-06-09 20:48:52
825
原创 从表面到深入:利用知识图谱和大模型整合外部知识以生成跟进问题 - 东南大学&中国移动研究院
在对话系统中,基于上下文动态生成跟进问题可以帮助用户探索信息并提供更好的用户体验。人类通常能够提出涉及一些普遍生活知识的问题,并展示出更高阶的认知技能。然而,现有方法生成的问题常常局限于浅层的上下文问题,这些问题的启发性不足,与人类水平存在较大差距。本文提出了一种三阶段的外部知识增强的跟进问题生成方法,该方法通过识别上下文主题、在线构建知识图谱(KG),最后将其与大型语言模型结合来生成最终问题。该模型通过引入外部常识知识并执行知识融合操作,生成信息丰富且具有探索性的跟进问题。实验表明,与基线模型相比,我们的
2025-06-09 20:46:29
809
原创 两大 智能体框架 Dify vs Langchain 怎么选 ? 来一个彻底、全面、深入的分析
在 AI 智能体应用 开发的世界里,选择一个合适的框架是至关重要的。选对智能体 平台非常关键, 它直接影响你的AI应用的效率、可扩展性和整体表现。
2025-06-09 20:44:46
781
原创 中国AI医疗大模型七强—病理大模型
今天小医和大家来聊聊AI医疗领域一个非常硬核且意义重大的方向——AI病理诊断大模型。病理诊断被誉为疾病诊断的“金标准”,但传统模式下,病理医生培养周期长、工作负荷大,且存在一定的主观性。现在,中国的AI力量正试图用“大模型”这把利器,为病理诊断带来一场智慧革命!
2025-06-08 10:45:00
926
原创 给MCP加上RAG,工具准确率提升200%,起飞~
大型语言模型(LLMs)在有效利用越来越多的外部工具(如模型上下文协议(MCP)所定义的工具)方面存在困难,这是由于提示膨胀和选择复杂性造成的。因此引入了RAG-MCP,这是一个检索增强生成框架,通过卸载工具发现来克服这一挑战。
2025-06-07 19:33:02
962
原创 从单 Agent 到多 Agent 的案例落地实践
关于 Agent 的定义目前还没有形成共识,目前有3个代表性的定义:流行最广的是前 OpenAI 研究与安全副总裁 Lilian Weng 对 Agent 的定义:Agent = LLM + Planning + Tools + Memory。
2025-06-07 19:31:28
1021
原创 人工智能和知识图谱七:知识图谱在人工智能系统中的优势
知识图谱融入 AI 解决方案后,将带来诸多优势。这些优势涵盖互操作性、查询功能等技术改进以及可解释性、可信度、减少开发工作量等更高层次的关注点。本文概述了知识图谱的主要优势,以及它如何补充机器学习模型,助力打造更值得信赖的 AI。
2025-06-06 19:32:30
930
原创 工业大模型体系架构、关键技术与典型应用研究总结报告
工业制造业正从数字化、网络化迈向智能化发展新阶段,大模型技术的兴起为工业智能化转型提供了全新可能。然而,通用大模型在工业应用中面临五大核心挑战,凸显了工业大模型独立研究的必要性:
2025-06-06 19:31:28
1075
原创 大模型驱动多智能体的军事需求生成框架研究报告
在现代战争形态向智能化、联合作战转型的背景下,军事需求生成作为联合作战体系设计的基础环节,面临着前所未有的挑战。传统军事需求生成方法主要依赖个体经验和多源文档,存在参与人员多、工作量庞大、效率低下等突出问题。随着战场信息呈现多模态、动态化特征,传统方法在处理视频、音频、文字等异构数据时,难以高效整合与分析,导致需求生成的完备性和精准性难以保证,严重制约了联合作战体系的快速构建与优化。
2025-06-06 19:28:53
764
原创 详解AI在制造业供应链管理的5大应用
制造业供应链覆盖企业从采购原材料到交付成品的全流程,包含采购、生产、物流、质量管控及售后服务等核心环节。在客户追求快速交付的竞争环境下,每个环节的高效衔接都直接影响产品交付速度和资源利用率。
2025-06-05 19:14:58
736
原创 个人向AI Coding全栈开发实践
把AI当作一个听你指挥和调派的助手,**怎么跟人沟通,就怎么跟AI沟通。有条理、无歧义地描述问题的能力越强,用起AI来就越得心应手。如果AI听不懂你的描述,那80%的人也听不懂。
2025-06-05 19:13:22
663
原创 吴恩达对谈LangChain创始人:企业构建Agent系统的核心认知!
前阵子吴恩达的deeplearning.ai上线了,用langchain构建Agent的课程。 节前,吴恩达同LangChain联合创始人Harrison Chase进行了一场深度对话。今天帮家人们总结了核心要点,一起来看看有哪些能让你少走弯路!
2025-06-04 20:45:13
604
原创 大模型入门指南 - Distillation:小白也能看懂的“模型蒸馏”全解析
DeepSeek在模型轻量化与性能迁移领域展现出了卓越的技术实力,其核心创新在于数据蒸馏与知识蒸馏的协同应用。
2025-06-04 20:41:36
680
原创 AutoThink: 让大模型自主决定何时思考
大模型的“思维能力”日益重要,如何让模型在“难”的问题上展开推理、深入思考,而不是事无巨细地“想个不停”?自动化所研究团队的一项新研究,可以让大模型实现自主切换思考模式,避免“过度思考”。该研究成果集成于一站式智能科研平台ScienceOne,并将用于训练ScienceOne的基座大模型S1-Base。
2025-06-04 01:30:00
1294
原创 “SAM+多模态图像融合”这个idea一出,就有人用它发了CCF-A
SAM自推出以来,已经广泛应用于CV各任务,各种创新层出不穷。到了2025年,SAM仍然有相当大的优化空间,尤其是通过结合多模态图像融合,可以进一步提高分割精度和效率,增强适应性,大幅拓宽应用场景。
2025-06-03 21:10:31
903
原创 彻底说清 Human-in-the-Loop:企业级 Agent 系统的关键挑战与LangGraph解法
在LLM Agent的自动化流程中,Human-in-the-Loop(HITL,人类参与闭环)是常见的设计模式之一。特别在要求较高的企业级场景中,HITL可以让**人类**在流程中对Agent运行进行适时的监督与接入,从而提高系统的准确性、可信度和用户体验。
2025-06-02 10:45:00
925
原创 Qwen团队发布长上下文Reasoning模型QwenLong-L1,超越o3-mini
可以这么简单思考夏,你让一个学霸看完一本1000页的学术报告,然后回答一个复杂问题。学霸可能抓不住重点,或者中途走神——这就是当前大模型处理长文本的困境!
2025-06-01 10:45:00
692
原创 微软开源多智能体自定义自动化工作流系统,加速搭建基于AI的自动化系统
## 如何学习大模型 AI ?由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。但是具体到个人,只能说是:**“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。**这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各
2025-05-31 10:45:00
1054
原创 Agent 进入工程时代!吴恩达详解 AI Agent 构建全流程,核心不在模型,而是任务拆解与评估机制
在最新的 LangChain Interrupt 峰会上,AI Fund 创始人吴恩达与 LangChain 联合创始人 Harrison Chase 展开了一场对话。
2025-05-30 20:36:57
932
原创 Java集成LangChain:打造企业级AI大模型应用的终极指南
在人工智能快速发展的今天,大语言模型(LLM)已经成为改变企业技术格局的关键力量。作为企业技术栈的中流砥柱,Java语言如何高效地拥抱这一革命性技术变成了众多开发者和企业关注的焦点。本文将深入探讨Java与LangChain的集成之道,为您揭示如何在企业级Java应用中释放AI大模型的无限潜力。
2025-05-29 19:21:53
964
原创 什么是 AI 智能体?如何一步步构建属于你自己的智能体?
下一件大事?Gartner 认为:**AI 智能体(AI Agents)将是未来的关键技术**。OpenAI、Nvidia 和 Microsoft 正在大力投入,甚至像 Salesforce 这样在 AI 领域一向低调的公司,也已悄然下注。
2025-05-29 19:17:58
916
原创 2025 AI Agent+医疗行业研究报告 | 智药研究
医疗站在变革的关键节点,AI正渗透行业的每一个角落,为资源分布不均、诊疗效率不高等深层次难题提供解决方案。
2025-05-29 19:16:44
1200
原创 AI Agent & 多智能体系统:“单兵作战”到“团队协作”的进化
AI Agent(人工智能体)是一种具备自主思考、规划和行动能力的智能系统,它主要包括三个部分:
2025-05-28 19:11:34
864
原创 论文浅尝 | 基于关系感知锚点增强的知识图谱补全(AAAI2025)
利用预训练语言模型(PLM)增强具有详细文本描述的原始三元组的内在语义联系。该分支中的典型方法分别将输入查询(与实体和关系相关联的文本描述)及其候选实体映射到特征向量,然后最大化有效三元组的概率。 随着大型语言模型的快速发展,这些方法越来越受到人们的关注。根据语言模型的特性,输入查询提供的相关和具体的上下文信息越多,结果嵌入的判别性越强。在本文中,通过观察和验证,我们发现了一个被忽视的事实,即查询中头部实体的关系感知邻居可以作为更精确的链接预测的有效上下文。基于这一发现,我们提出了一种关系感知锚点增强知识图
2025-05-28 19:08:54
963
原创 Qwen2.5-VL技术解读和文档解析可行性验证
## 如何学习大模型 AI ?由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。但是具体到个人,只能说是:**“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。**这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各
2025-05-27 21:26:26
916
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人