自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(987)
  • 收藏
  • 关注

原创 Self-Ask:LLM Agent架构的思考模式 | 智能体推理框架与工具调用实践

Self-Ask(自问自答**)是一种AI推理策略,通过问题分解和逐步解答来处理复杂问题。2022年由斯坦福大学研究者提出,旨在提升大语言模型的多步骤推理能力。核心机制是将一个复杂问题拆分为多个简单子问题,逐一解答后整合结果。值得注意的是,Self-Ask不只是agent的设计模式,更是一种提示词工程模式,以及大模型微调的一种设计模式,体现了AI系统设计的多层次应用价值。

2025-06-08 10:45:00 1086

原创 阿里巴巴重磅发布QwenLong-L1-32B,长文本推理领域的重大突破

近些年来,大推理模型(Large Reasoning Models,简称 LRMs)借助强化学习(RL)在逻辑推理、数学运算以及编程任务等多个领域均取得了令人瞩目的进展。不过,目前这些模型的应用主要聚焦于短上下文任务(比如上下文长度为 4K tokens 左右)。但在现实的实际应用场景里,像开展深度研究工作或是进行法律分析时,往往需要处理长上下文信息(例如上下文长度达 120K tokens),这无疑对模型的上下文理解能力以及多步推理能力提出了更为严苛的要求。鉴于此,阿里巴巴 Qwen-Doc 团队重磅推出

2025-06-07 19:50:19 750

原创 【开源】企业知识库革命!本地RAG系统如何实现“数据安全+智能问答”双赢?

在数据安全与AI智能化双重需求下,**Local_Chat_RAG本地RAG系统**应运而生。它通过本地化部署与动态知识检索,为企业构建了一个安全、高效的知识管理中枢。本文将详解其技术原理、核心优势及行业应用价值。

2025-06-07 19:48:51 655

原创 智能体5级分类:从规则到大语言模型

摘要:智能体被定义为能够感知环境、做出决策并采取行动的人工实体。受汽车工程师协会(SAE)自动驾驶六级分类的启发,智能体也根据其功能和能力被划分为以下层级:L0——无 AI,具备工具(有感知能力)和行动;L1——使用基于规则的 AI;L2——用基于模仿学习(IL)/强化学习(RL)的 AI 替代基于规则的 AI,增加推理和决策能力;L3——应用基于大型语言模型(LLM)的AI 替代基于 IL/RL 的 AI,并设置记忆和反思功能;L4——在 L3 的基础上,实现自主学习和泛化能力;L5——在 L4 的基础上

2025-06-06 19:47:55 963

原创 智能体快速入门,不可不知的60个AI Agent术语

大语言模型取得突破性进展之后,AI Agent已然成为最具变革性的核心概念,其所涵盖的领域极为广泛且仍在不断演进。

2025-06-06 19:46:58 929

原创 谈谈RAG 的四个级别

选择正确的 RAG(检索增强生成)架构主要取决于具体的用例和实施要求,确保系统符合任务需求。

2025-06-06 19:45:37 624

原创 开源AI多智能体框架,根据论文自动生成代码,复刻论文再也不费力气

Paper2Code 是一个开源的多智能体 LLM 框架,可将机器学习论文自动转化为功能代码仓库。它通过规划、分析和生成三阶段流程,先从论文构建高层路线图、设计系统架构、确定文件依赖并生成配置文件,再解读具体实现细节,最后生成模块化代码。

2025-06-05 19:35:09 840

原创 AI编程到底有没有护城河?RL+Agent重塑代码世界!

今天,cursor更新了1.0版本,作为一个cursor重度使用用户 & 算法出身玩家,今天给家人们分享一下AI编程这个赛道的一些技术内幕。

2025-06-05 19:33:50 791

原创 揭示小规模SFT在R1-Style强化学习中的关键作用

我们提出一种解释性方法(re-distillation, 重蒸镏),用1K样本SFT可达到与R1-style RL相同的泛化性能,而后者采样次数超过100K。可压缩性质说明RL并非天然具有内在的泛化性优势,SFT也并非天然缺乏泛化能力。

2025-06-05 19:33:01 561

原创 从零实现本地语音识别(FunASR)

FunASR 是达摩院开源的综合性语音处理工具包,提供语音识别(ASR)、语音活动检测(VAD)、标点恢复(PUNC)等全流程功能,支持多种主流模型(如 Paraformer、Whisper、SenseVoice)的推理、微调和部署。

2025-06-04 20:55:57 974

原创 从零开始学 Dify- RAG 知识库系统设计详解

RAG(检索增强生成)知识系统是 Dify 的核心组件,它使 AI 应用程序能够检索和利用外部知识。该系统管理从文档提取到知识检索的整个流程,支持不同的索引技术、文档处理方法和检索策略。

2025-06-04 20:54:41 753

原创 LangChain服务部署

LangServe 是 LangChain 提供的一个子项目,专注于简化 LangChain 组件(如 Runnables 和 Chains)的部署流程。其核心目标是让开发者能够以最小的努力将这些组件暴露为 REST API 或其他可远程调用的形式。

2025-06-03 21:02:26 789

原创 IJCAI 2025 | 因果赋能大语言模型:驱动智能体学习、适应与决策的能力增强

近日,广东工业大学计算机学院数据挖掘与信息检索(DMIR)实验室与汕头大学、华为诺亚方舟实验室、鹏城实验室合作的论文Causal-aware Large Language Models: Enhancing Decision-Making through Learning, Adapting and Acting被国际人工智能联合会议IJCAI 2025 (International Joint Conferences on Artificial Intelligence)接收。IJCAI是人工智能领域顶级

2025-06-03 21:01:09 1014

原创 langchain4j实现知识库搭建(实战篇)

*介绍:本文将重点讲解思路和方法*步骤一:表结构设计

2025-06-03 21:00:23 884

原创 一张图讲清楚:AI Agent工程演进趋势

**1、AI** **Agent是具备感知环境、做出决策并执行任务能力的AI工具,通过感知、决策和行动实现目标**。

2025-06-02 10:45:00 532

原创 基于临床数据与病理切片构建多模态医学AI模型,实现腋窝淋巴结转移的术前精准预测

传统预测方法存在诸多弊端,如腋窝淋巴结清扫术(ALND)创伤大,前哨淋巴结活检(SLNB)存在操作风险且无法利用原发肿瘤病理特征。

2025-06-01 10:45:00 617

原创 流程工业大模型:挑战与机遇

**导语**:当前,大模型技术在多个领域展现出颠覆性潜力,正深刻重塑人类与工业复杂系统的交互模式。面对流程工业“机理复杂、控制困难、知识碎片化、研发周期长”等长期存在的关键难题,通用大模型在泛化能力、可信性与可持续学习等方面难以满足工业场景的高要求。为此,任磊教授团队于中国工程院院刊《Engineering》提出了流程工业大模型框架——ProcessFM,融合“数据+机理+知识+计算”的多层架构,该架构从资源层、基础层、适配层到应用层进行系统设计,构建适用于流程工业的大模型技术底座,具备机理认知、知识问答、

2025-05-31 10:45:00 638

原创 RAG其实并没有你想的那么简单,Late Chunking vs Contextual Retrieval解决上下文难题

RAG是一种将外部知识库检索与生成模型相结合的技术,不过最近的Agent,MCP喧嚣至上,包括DS-R1模型的热度,让RAG的技术热度下降了很多。甚至我和一些AI的从业者讨论基本技术的时候,大家对RAG嗤之以鼻。其实RAG一点都不简单,我今天就总结了一下RAG的经常遇到的“左右手”怎么选的问题,算是给自己的学习做个总结。

2025-05-30 21:02:07 851

原创 行业必读丨OpenAI 最新报告:构建 Agents 最佳实践

传统软件可帮助用户简化和自动化工作流,而 Agent 则能高度自主地代表用户执行相同的工作流。

2025-04-28 20:52:19 784

原创 大模型推理BenchMark榜单更新:GPU性能调优要点

本博客介绍了 AMD 在 MLPerf Inference:Datacenter v5.0 提交中针对 Llama 2 70B 和 SDXL 模型使用的关键优化策略。如果您有兴趣进一步探索这些策略或亲自运行基准测试结果,请访问博客“重现 AMD MLPerf Inference v5.0 提交”。AMD 一直在突破我们产品的能力界限。请务必查看我们最新的软件和硬件版本,它们将进一步提高本博客中描述的工作负载的性能。

2025-04-28 20:50:05 953

原创 SimpleDeepSearcher:SFT以小博大,少量数据性能超越RL!

近期研究者探索使用强化学习训练大语言模型,以提升其在复杂信息检索任务中的自主检索和推理能力。然而,强化学习带来高训练开销,且从本地检索切换至联网搜索后效率更低,同时联网搜索对计算资源要求极高。基于此,我们希望以较低的训练成本获得具有强大推理能力的深度搜索模型。基于此,

2025-04-28 20:48:46 818

原创 论文复现—基于随机森林、LightGBM 、 CatBoost 、LightGBM 、Optuna 优化与 SHAP 解释分析

数据准备充分:代码细致地处理了数据的加载、清洗、类型转换、特征提取(时间特征、利润)和异常值控制,为后续分析和建模奠定了坚实的基础。探索性分析深入:通过统计摘要和多种可视化手段(包括基础图表和高级图如 Chord 图、SHAP 图),脚本对数据进行了深入的探索,揭示了销售的关键模式、趋势、相关性以及不同维度(产品、时间、地区、人员)下的表现。建模流程规范:遵循标准的机器学习流程,包括特征编码、数据划分、多种模型(决策树、随机森林及)的训练与评估。性能优化显著:引入了 Optuna 进行系统的超参数优化,并通

2025-04-27 11:42:15 790

原创 DeepSeek赋能!企业私有化知识库3大搭建方案拆解

RAG(Retrieval-Augmented Generation)技术结合了信息检索和文本生成。当我们提出问题时,不仅可以根据问题内容从知识库中检索相关的信息,还能够根据检索到的信息生成准确且高质量的回答。这种方式比传统的生成模型更为准确,更适用于知识库的问答场景。

2025-04-27 11:38:15 993

原创 从计算机辅助药物设计到人工智能药物设计的最新进展

图3B。

2025-04-27 11:33:24 1169

原创 DeepSeek在IT运维中的实战应用与价值

在IT运维的战场上,DeepSeek不是在兜售华而不实的AI概念,而是。这种实用主义的方法正在悄然改变传统运维模式。:凌晨接到告警,上千条错误日志扑面而来,仿佛大海捞针般寻找真正的故障源。:业务高峰期就像一场赌博,运维团队只能提心吊胆地待命,随时准备"灭火"。:系统一旦宕机,各技术部门立即开启"甩锅大会",浪费大量时间而不解决问题。:IT资源配置总是两难——要么过度配置造成浪费,要么不足导致系统崩溃。:新人培训如同填不满的水桶,老员工疲于重复解答基础问题。

2025-04-26 10:45:00 988

原创 一文搞懂GraphRAG(RAG + 知识图谱)

输入:近五年AI领域文献数据。

2025-04-25 21:09:05 1218

原创 企业级RAG选择难题:数据方案的关键博弈

智能时代,企业数据每日剧增。员工寻找答案的效率直接影响工作流程,StackOverflow调查表明54%的开发者因等待问题答案而工作中断。。检索增强生成(RAG)技术为企业级知识管理带来希望。但RAG系统的魔力不在于语言模型本身,而在于底层数据存储方案的选择。向量数据库将文档分割成100至200字符的文本块,通过嵌入模型转换为数值向量存储。搜索时,用户查询同样被转换为向量,系统使用KNN或ANN算法找出最相似向量。这种方案在处理大规模语义相似性搜索时表现出色,支持多种数据类型存储。

2025-04-25 21:06:38 1018

原创 一文汇总:LLM应用到推荐系统的各类玩法总结

上面从LLM提取特征、文本推荐模型、微调LLM、融合建模等4个角度介绍了LLM推荐建模思路。目前所有搜推广大厂都在投入人力研究LLM在推荐模型中的应用方式,想进行。

2025-04-24 11:30:47 778

原创 DeepSeek的幻觉,以及怎样解决幻觉

说到幻觉,现在也是有个排行榜,看谁的幻觉最少,DeepSeek排名较后,尤其是DeepSeek-R1,幻觉率有14%,这也与我们日常使用体验接近。或许幻觉(胡编乱造)和创造性本来就是ai的一体两面。对此有人说,你要限制ai的能力,而不是放任它发挥,例如先给方案等我确认或者提出疑问等我解答,又如限制回答内容长度等。而限制ai能力,就引出另一个说法:你本来不会做的事情,ai也做不好。我理解这有两个层面的意思:一是你要有分解问题的能力,你可以把一个问题逐步拆解到ai的能力范围里;

2025-04-24 11:28:23 645

原创 首篇MCP技术生态全面综述:核心组件、工作流程、生命周期

一种标准化接口,旨在实现AI模型与外部工具和资源之间的无缝交互,打破数据孤岛,促进不同系统之间的互操作性。在MCP出现之前,AI应用与外部工具的交互依赖于等方法,这些方法存在等问题来自华科的研究人员详细探讨了MCP的,并分析了其在创建、运行和更新阶段的,还考察了MCP的当前(行业中采用情况、用例、支持其集成的工具和平台)。:MCP由三个核心组件构成:MCP主机、MCP客户端和MCP服务器。这些组件协同工作,实现AI应用与外部工具和数据源之间的无缝通信。

2025-04-24 11:27:40 680

原创 特征工程、模型结构、AIGC——大模型在推荐系统中的3大落地方向

谈具体的应用之前,我们先从宏观上理解一下大模型的出现对推荐系统到底意味着什么。就像在改造推荐模型时,我们一定要清楚信息增量在哪、模型结构的优化点在哪一样,我们并不是因为大模型这个技术比较fancy,所以才把大模型施加到推荐系统之上,而是因为大模型确确实实能够为推荐系统带来知识和模型的全新变化,让推荐效果受益,才应用大模型技术的。因此我想先从宏观上解释一下大模型对推荐系统的实际意义到底是什么。我的理解中,大模型宏观上在三个层级上改变了这个世界,也同样是在这三个层次上改变了推荐系统。

2025-04-23 20:36:11 662

原创 突破VLN难点!华为诺亚Mem2Ego革新长距离具身自主探索导航,3大记忆模块梳理+解析

MEM2EGO将。

2025-04-23 20:34:46 999

原创 企业私有大模型DeepSeek落地部署该用什么? Ollama还是vLLM

对数据敏感的企业想要部署自己的大模型该(如:DeepSeek R1)该选用什么方式呢?Ollama还是vllm呢?

2025-04-22 20:12:03 1086

原创 检索增强生成(RAG)的最新发展:一文汇总11种新型RAG算法!

随着人工智能的快速发展,检索增强生成(Retrieval-Augmented Generation,RAG)技术正在经历前所未有的演变。RAG技术通过将外部知识融入大型语言模型(LLM)的生成过程,极大地提高了AI系统的事实准确性和可靠性。如今,RAG正向更具智能性和自主性的方向发展,能够处理像超图这样的复杂结构,并适应各种专业领域的需求。本文将介绍11种最新的RAG类型,展示这一技术领域的创新前沿。InstructRAG将RAG与多代理框架相结合,使用基于图的结构来组织和执行任务。

2025-04-22 20:09:37 944

原创 图RAG统一框架来了,12种RAG方法一网打尽~

这篇文章要解决的问题是如何在统一框架下对基于图的检索增强生成 (RAG) 方法进行系统的比较和分析。现有的基于图的 RAG 方法没有在同一实验设置下进行系统的比较。包括缺乏统一的框架来抽象和比较各种基于图的 RAG 方法;现有工作主要关注整体性能评估而非单个组件的性能;以及缺乏对各种方法在准确性和效率方面的全面比较。涉及 RAG 技术在医疗、金融、教育等领域的广泛应用,以及已有的基于图的 RAG 方法(如 RAPTOR、KGP、HippoRAG 等),但这些方法缺乏系统比较和分析。

2025-04-22 20:08:53 685

原创 不用Cursor,Milvus-MCP极简版本地企业知识库构建指南来啦

我相信,自今年年初DeepSeek爆火,紧随其后MCP降低应用开发难度,

2025-04-21 20:36:39 1067

原创 别再堆文档了,大模型时代知识库应该这样建

对于超长的表格数据,建议使用数据库,而不是文件库。元数据层:让数据具备被理解的能力文档类元数据:作者、标题、创建时间、文档类型等数据类元数据:字段说明、来源系统、更新时间等元数据是所有知识挖掘与建构的基础,让原始数据具备“上下文”与“可追溯性”。知识构建层:从数据中提炼出知识元知识****层:描述知识的“适用边界”元知识是“关于知识的知识”,它用于定义:哪段知识适用于哪些场景哪种角色可以使用哪些前提条件下有效这种机制对实现智能体在复杂场景下的“精准引用”尤为关键。

2025-04-21 20:33:55 1017

原创 医图顶刊 MIA‘24 | MMGPL:基于图提示学习的多模态医学数据分析

提示学习在微调多模态大型模型以适应各种下游任务方面展现出了令人印象深刻的有效性。尽管如此,现有的提示学习方法在神经疾病诊断中的应用仍面临两个问题:(i) 现有方法通常平等对待所有图像块,尽管在神经影像中只有少数图像块与疾病相关;(ii) 它们忽略了大脑连接网络中固有的结构信息,这对于理解和诊断神经系统疾病至关重要。为了解决这些问题,我们引入了一种新颖的提示学习模型,在多模态模型的微调过程中学习图提示,以诊断神经系统疾病。

2025-04-21 20:32:41 722

原创 GraphRAG原理

向量和图谱是两种重要的知识载体,当然大模型时代参数可能是更重要的载体,但是目前来讲太大了,暂时还没有端侧的有效模型可用。向量的神奇之处在于它们各自以编码形式捕获了其对应文本的本质,向量的价值更多体现在相似度计算上,也就是你需要确定一段文本与另一段文本的相似度时。但是,如果你想理解向量内部的含义、了解文本中表示的事物、洞察其与更大规模语境的关系,那使用向量表示法就无能为力了。

2025-04-20 10:45:00 756

原创 基于LLM的加密货币交易分析:比特币案例研究

当前加密货币交易分析方法依赖不透明的黑箱模型,缺乏可解释性和适应性,无法有效捕捉行为模式。大型语言模型(LLMs)被认为能够弥补这一缺口,因其在复杂任务中的推理能力。本文在比特币网络的真实交易图上测试LLMs,提出三层框架评估其能力:基础指标、特征概述和上下文解释。引入人类可读的图表示格式LLM4TG和连接增强采样算法CETraS,以简化大型交易图。实验结果表明,LLMs在基础指标上表现优异,提供详细的特征概述,并能有效解释交易行为,即使在标记数据有限的情况下。

2025-04-19 10:45:00 1056

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除