- 博客(593)
- 收藏
- 关注
原创 Dify 之外的新尝试:Coze Studio 知识库实战指南:部署、解析、接入全流程
• coze studio 的向量还在不断地完善过程中,预估这周ollama会上,自定义http需要按规范实现• 知识库目前不支持外挂,这个在企业中是一个很大的问题,后续开源社区肯定会支持,迟早的问题• 整体检索效果相对来说比较差,这个可能是我使用的问题。
2025-07-30 15:06:44
1495
原创 突发:GPT-5下周发布
如何学习AI大模型?GPT-5即将于下周发布,看来越来越实锤了。国内负责紧盯OpenAI 的智谱,于昨晚“抢跑”,发布了GLM 4.5,先把GPT-5可能做出的功能拉满。这里所说的“传闻”,就是GPT-5即将发布。其实这也不是什么传闻,因为OpenAI自己的员工,包括CEO奥特曼,GPT-5发布在即,缺乏的就是具体的日子。圈子里的人们在寻找蛛丝马迹。
2025-07-30 14:06:04
806
原创 GPT-5「全家桶」爆出本周上线!惊艳首测秒出网页,编程彻底起飞
如何学习AI大模型?传闻称,GPT-5的发布时间提前了,预计在本月底面世。网友爆料,GPT-5共有4个版本:GPT-5-mini周六,网友们提前放出了一些,OpenAI开源模型——代号为「lobster」的实测。今天,更多关于GPT-5多个版本惊艳demo公开了。Reddit热榜上,神秘模型summit创建了视频在线网站,引来众多网友点评。目前在LMarena上,已悄悄上线了GPT-5-pro(zenith)。一位开发者用最强版zenith,一键生成「星云」单页网站,速度质量非常惊人。
2025-07-29 12:03:34
979
原创 Agent的关键一跃:没有它,你的AI应用寸步难行!
每一次软件范式变革,都会诞生新的基础设施:云计算承载了微服务浏览器承载了 Web 应用而,正成为 AI 智能体的核心支撑。❝如果你正在构建多轮、长时、可控的 Agent 系统,是时候抛弃脚手架式拼凑方案,拥抱专业的智能体平台了。
2025-07-29 11:52:51
629
原创 从RAG到记忆:大模型的非参数化持续学习
本文提出的方法HippoRAG2,这是一个新的框架,旨在解决现有RAG系统在近似人类长期记忆的动态和相互关联的性质方面的局限性。HippoRAG 2为LLM的持续学习和长期记忆研究开辟了新的途径,通过在事实,意义构建和联想记忆任务中实现标准RAG方法的全面改进,显示出以前的方法在全面评估中忽视或无法实现的功能。未来的工作可以考虑利用基于图的检索方法,以进一步提高情景记忆能力的LLM在长对话。如何学习AI大模型?
2025-07-26 11:44:39
652
原创 大模型应用开发的本质——就是对提示词的封装
如何学习AI大模型?大模型就是大模型,它和具体的应用场景无关,唯一有关的就是提示词。关于大模型应用开发有几个不同的方向,但从本质上来说大模型应用开发就是在封装提示词;原因就在于从用户的角度来说,提示词是与大模型交互的唯一接口;因此也有人说提示词就是针对大模型的编程语言。下面我们以智能体为例,解释说明一下为什么说大模型应用开发就是在封装提示词;当然,这句话并不是很准确,更加准确的说应该是:大模型应用开发的核心是围绕提示词进行业务能力封装,但提示词只是应用开发的底座。
2025-07-24 11:00:46
621
原创 揭秘夸克健康大模型:AI如何用“慢思考”拉升医学推理上限
第一,通用大模型能力虽快速增长,但要在高专业度的健康医疗领域“炼成”性能高且可靠的推理模型,仍极具挑战。业界主流方向早期由DeepSeek R1验证有效。当下,或蒸馏DeepSeek R1模型数据,或在小数据集上探索较为常见;然而,在选择合适预训练模型的基础上,从头设计并搭建整套流程,并用于业务一线,较为罕见。尤其在健康医疗领域,自建整套流程化系统,能够明确模型从哪些数据,以何种方式学到哪些知识,哪个环节学得不好;不仅提高性能,而且能提高可解释度和信任度。
2025-07-24 10:55:42
674
原创 Agent 生态爆发前夜:一文读懂《AI Agent Protocols》(含 7 大类型+未来趋势)
首先快速过一下基础概念。LLM Agent 不仅仅是能生成文本的大模型,它们更像是能自主决策、有记忆、会规划、还能调用外部工具(比如 API、数据库)来完成任务的智能系统。基础模型 (Foundation Model)提供核心的理解和推理能力;记忆系统 (Memory Systems)分短期和长期,保证对话连贯和知识积累;规划能力 (Planning)把复杂任务拆解成小步骤;工具使用 (Tool-Using)调用外部 API 或工具来弥补自身能力的不足;以及行动执行 (Action Execution)
2025-07-23 11:19:35
1025
原创 六万字长文一次性说清LLM的后训练技术
大型语言模型(LLMs)的出现从根本上改变了自然语言处理,使其在从对话系统到科学探索等多个领域不可或缺。然而,它们的预训练架构在特定情境下常常暴露出局限性,包括推理能力有限、伦理不确定性以及领域特定性能不佳等问题。这些挑战需要先进的后训练语言模型(PoLMs)来解决这些不足,例如 OpenAI-o1/o3 和 DeepSeek-R1(统称为大型推理模型,或 LRMs)。
2025-07-23 11:03:32
1198
原创 一个LangChain与MCP结合使用的案例!
AI Agent 在获取数据时面临一个挑战,换句话说,就是如何将 AI Agent 或基于 LLM 的应用集成到外部数据源中。为了实现无缝集成,已经有许多尝试,例如利用 GUI、Web 浏览器和 Web 搜索等方式。这些方法各有优劣。MCP 有潜力成为一个通用接口,可以将其视为 AI 领域的虚拟/软件版 USB-C。它能够在 LLM/AI Agent 与外部资源之间实现无缝、安全且可扩展的数据交换。
2025-07-22 10:32:44
708
原创 农业多模态大模型及应用分析
如何学习AI大模型?与单一处理文本或图像的模型不同,多模态大模型可以融合语言、图像等多种信息,打破多种信息载体的壁垒。这种模型一般涉及多种信息载体的互相转换与理解,提升机器对世界的理解能力,是通用人工智能出现的必要门槛。2021年出现的CLIP(Contrastive Language-Image Pre-training)模型是将视觉模型接入文字能力的重要尝试。
2025-07-21 14:49:31
1074
原创 大白话讲透:火遍全球的“大模型”,究竟是什么?
如何学习AI大模型?随着大模型的进一步发展,最近像 DeepSeek、豆包、Kimi、元宝这样的AI助手越来越普及,很多人已经用它们来聊天、写作、画画、编程甚至艺术创作,相信各位也已经实实在在地感受到了AI的强大和便利。而这些让人惊叹的功能,是“大模型”在背后做核心的技术支撑。但一提到“大模型”,网上很多文章就堆满了“向量矩阵”、“神经元网络”、“Transformer”之类的专业术语,让人望而生畏,不明觉厉。今天,我们就用最通俗的语言,把“大模型”的本质讲清楚。一、初心:让机器学会“思考”
2025-07-21 11:50:30
1775
原创 性能最高提升7倍?探究大语言模型推理之缓存优化
AI技术一路发展至今,推理优化是一个永存的话题,尤其是面临算力有限的情况下,如何将有限的计算资源利用最大化,是需要持续努力去实现的。今天我们来探讨一下大语言模型(LLM)推理缓存优化技术的演进和未来展望。本文主要进行原理性的探究,下一期会有相关的落地实践方案。缩略词解释LLM:大语言模型, Large Language ModelTTFT:首Token延迟, Time to First TokenTPOT:平均Token,Time Per Output Token。
2025-07-18 11:25:01
1326
原创 一天吃透一条产业链:AI Agent(智能体)产业链全解
如何学习AI大模型?01 产业链全景图02 概念解析AI Agent(人工智能代理)可以理解为一个会自主办事的智能程序,它能像人一样感知周围信息、自己规划策略,然后动手完成任务。比如你让它订周末的餐厅,它会先搞清楚你的需求(感知),接着拆解成查评分、看菜单、确认时间等步骤(规划),最后一步步执行预订(行动)。它的核心架构可以分成「大脑」和「三件套」:核心能力(大脑):基于大模型(LLM),就像人类大脑的中枢,负责理解问题、生成思路。
2025-07-18 10:56:04
1348
原创 智能体(Agent)全景解析:技术路线、落地实践与产业生态
如何学习AI大模型?AI Agent是一种具有自主性或半自主性的智能实体,能够利用人工智能技术在数字或物理环境中感知、决策、采取行动并实现目标。与Copilot、聊天机器人等相比,AI Agent能够自主规划和行动,实现用户预设的目标。伴随着人工智能技术的迭代,AI Agent也经历了多个发展阶段。从2024年开始,基于大模型(主要是指“大语言模型LLM”)的AI Agent正在成为企业落地AI应用/解决方案时的必备功能。2025年是“智能体元年”,AI Agent将迎来规模化落地浪潮。
2025-07-12 11:46:59
442
原创 从0到1构建商用Agent(智能体):套壳Claude的Manus退出中国
如何学习AI大模型?2025年7月,一则关于Manus AI出走新加坡的消息在科技圈引起轩然大波。这家曾被誉为"全球首款通用型Agent,中国造"的公司,在短短4个月内完成了从高调入场到悄然离场的戏剧性转变。从技术明星到争议焦点,再到最终的"静默退场",Manus的故事折射出当前AI Agent领域的复杂现状和中美科技博弈的微妙变化。2025年3月6日凌晨,Monica团队正式发布Manus,立即在AI圈引起巨大关注。
2025-07-12 11:03:37
490
原创 用 AI + 高德地图 MCP,3 小时做出杭州美食地图
本文记录了一次从灵光一现到快速落地的 AI + 地图服务实践,通过结合 Cursor 与高德 MCP 地图服务平台,作者仅用几个小时就实现了一个可交互、可筛选、可推荐的杭州美食地图应用。最近刷到一篇热帖,一位在阿里五年的同学总结了一份她这五年(吃的每一口记录)收集的杭州美食排行榜,为“美食荒漠”正名。也让我回忆起自己初到杭州进入团队时也曾想整理一份“美食地图”,却因种种原因而作罢。恰逢最近团队准备选团建的餐厅,于是立马把这篇帖子分享给投食官。
2025-07-10 11:44:35
577
原创 6.1K Star!AI工程师必收藏!22种RAG技术全实现,从入门到王者的开源宝典!
如何学习AI大模型?但问题来了,网上的教程要么太理论,要么直接用LangChain这种框架一把梭,根本不知道底层咋搞的。想真正理解RAG的精髓?难得很。最近发现了一个牛逼的开源项目——all-rag-techniques,现在已经拿下6.1K+ Star了。作者直接用Python基础库(numpy、matplotlib这些)从零开始实现每一种RAG技术。每个技术都有独立的Jupyter Notebook,代码清晰,注释详细。
2025-07-10 11:35:52
907
原创 Devin 教你做 Agent:把 AI 当做需要指导的初级开发者
许多平台都支持将Agent与外部工具连接(在 Devin 中,这类功能被称为 MCPs [4])。但很多人忽略了另一个简单有效的方法:为Agent编写一些自定义的命令行(CLI)小工具。比如,你可以给它一个脚本,只需输入工单 ID 就能拉取该工单的详细信息。或者,为它提供一个能一键重启本地开发环境的工具,让它在搞乱环境后能自行恢复。
2025-07-08 11:23:01
821
原创 智能体技术解析:AI Agent快速入门手册
如何学习AI大模型?01引言你是否见过这样的场景?一段简单的指令输入,AI就能自动分析数据,撰写报告并发送邮件,像一位隐形助手般完成全套工作,比如最近比较火的AutoGPT,或者国内的Manus;在ChatGPT中安装“旅行规划”插件,只需要说“帮我订一个去杭州的机票和酒店”,那么他就会自动调用订票网站的接口,实时比价下单....这些看似科幻的背后,实际上是AI Agent(智能体)技术的爆发。为什么智能体可以像人类一样拆解任务,使用工具呢?初学者该如何上手呢?
2025-07-08 10:59:40
1312
原创 5分钟读懂RAG的原理,让AI学会做笔记_秒懂 rag是什么
看完以上的介绍,有没有觉得更加清晰RAG到底是啥了。以后别人再问你,拍着胸脯说“这题我熟!不过以上讲的也就RAG的基础理解和用法,后续我还会考虑写写RAG的优化方法或实践,可以关注下我。
2025-07-04 11:39:46
1019
原创 超详细!使用 DeepSeek+Docker+Dify 搭建个人知识库
随着 DeepSeek 不断爆火,越来越多的个人和企业都在搭建属于自己行业或自己的私域知识库,那么我们应该怎么使用 DeepSeek 来搭建只属于自己的私域知识库呢,其实不难,就让我们来一探究竟。基于 DeepSeek 搭建个人私域知识库的流程图如下所示:图 1 DeepSeek 模型搭建层流程拆解图 2 知识库应用层流程拆解首先,我们来完成私域知识库需要的模型层的搭建工作。Ollama 的安装和 DeepSeek 模型的下载和使用。
2025-07-02 14:12:55
1819
原创 AI不只大模型?AI Agent到底有多强?
学术界和工业界对术语“AI Agent”提出了各种定义。其中,OpenAI将AI Agent定义为“
2025-07-02 11:40:43
629
原创 这个智能体能把PDF直接总结成PPT,基本不用咋改,确实太赞了!
最近收到很多后台留言,大家普遍关心的一个问题,就是现在有没有好用的智能体,能把PDF或Word总结出PPT,基本不用咋改动的。不少读者跟我反馈,他们在用的PDF转PPT总结,遇到的一些问题就是PPT中图片和文字搭配不太好,又得需要去找配图,还得花不少时间。这几天我通过查找不同平台,使用了不同家的智能体,今天这篇文章来系统解答下好用的PDF转PPT总结智能体,专门解决大家遇到的这些痛点,感兴趣的可以看看。1 效果展示先给大家看看,今天写这篇公众号时,我上传某个PDF文档转化成PPT的效果,传入一篇英文论文:然
2025-07-01 21:56:53
1865
原创 阿里国际发布:Ovis-U1 统一的多模态理解与生成模型
Ovis-U1在模型设计与训练策略上的创新,实现了多模态理解与多模态生成的统一,在技术突破的同时,显著提升了全球用户的体验与创作效率。
2025-07-01 21:51:24
1035
原创 算力中心转型大模型应用,看这一篇就够了!
在人工智能的浪潮之巅,算力中心曾是资本市场最炙手可热的“黄金赛道”。然而,随着潮水逐渐回归理性,单纯依靠“囤积居奇”式的算力扩张故事,已经难以再次点燃投资者的热情。市场的风向正在转变,对于前瞻的算力中心而言,一场深刻的自我革命势在必行——,正成为一条更具想象空间、也更“性感”的新路线。曾几何时,拥有和建设大规模算力中心是科技实力的终极象征。市场普遍认为,在AI的“淘金热”中,卖“铲子”是稳赚不赔的生意。然而,任何单一维度的竞争最终都会走向同质化和价格战。:资本市场永远在追逐新的、高增长的故事。
2025-06-30 14:39:39
1085
原创 【转行大模型工程师笔记】02-GPT 大模型的能力突现
先说我的观点,能力突现(涌现)是噱头,初衷是为了强调当模型大了以后,表现出的“新能力”,而不是强调“模型就要100B参数,才能不知怎么的就突变了” 这样的玄学。近几年,NLP 的研究范式在慢慢走向通用和统一,即一个模型解决大部分问题(为了实现这样通用的智能,模型变得越来越大。GPT-3 后,一般人已经连面向下游具体任务的微调都要做不起了,于是模型结构的研究讨论变成了越来越小圈子的工作。因此我打算先梳理一下能力突现(涌现)相关的问题,讨论模型变大的必要性。本文主要围绕符尧大佬的文章。
2025-06-30 12:03:37
872
原创 谈谈GraphRAG 痛点——告别“黑盒”,实现精准检索与可控生成
这听起来可能有点“笨”,但却是最有效、最可控的方式。只有当我们对知识图谱的结构和内容有清晰的掌控时,它才能真正发挥价值。
2025-06-30 11:50:21
1027
原创 周鸿祎:智能体 ≈ 带手脚的 AI(数字员工)
2025年将成为*人类与智能体共生关系的转折点,*诸多智能体的系统提示词已将其设定为“专家”或“顾问”角色,这种拟人化特征标志着*智能体正从“辅助工具”转变为“自主决策者”和“主动协作者”。智能体 vs 大模型*****什么是智能体(Agent)?****智能体是具备自主决策、任务分解、工具调用和多步执行能力的 AI 系统。*拥有 “数字手脚”,能像人类一样*任务分解、工具调用、自主执行*闭环操作。*二、任务分解 & 工具调用 & 自主执行*************
2025-06-27 11:44:24
603
原创 多模态大型语言模型,最新综述!
这项综述制了 MLLM 不断发展的格局,研究了transformer、扩散模型、SSL、MoE、RLHF 和 CoT 等基础技术如何扩展到不同的输出模式。虽然每种模式都带来了不同的挑战,但它们越来越多地共享底层架构和学习策略,这表明正在向通用生成系统趋同。一个关键的见解是方法论跨领域的高度可转移性。一种模式的进步,例如扩散模型在图像生成方面的成功,已经促进了其他模式的突破,包括视频合成和 3D 建模。同样,最初为文本任务设计的 MoE 和 CoT 等技术已被证明在视觉、运动和音频方面有效。
2025-06-27 11:32:34
1155
原创 AI 协作的未来?Anthropic 多智能体系统的实战设计
近日,Anthropic 发布了一篇重磅技术博客,详细介绍了他们如何从零构建一个多智能体支持的研究系统。Claude 现已具备研究能力,能够跨网络、谷歌工作空间及任何集成应用进行搜索,以完成复杂任务。通过解析这个多智能体系统从原型到产品的历程,博客分享了 Anthropic 在系统架构、工具设计和提示工程方面的重要经验。研究任务往往起始于模糊问题,随着信息的揭示逐步调整方向,本质上具有开放性和不可预测性,难以预设清晰路径或单一解决方案,因此模型在探索过程中必须具备高度的自主调整能力。多智能体系统通过任务分解
2025-06-24 14:56:22
1004
原创 开源!基于大模型的视频监控系统,市场巨大,可以商业化
该开源项目通过将视觉大模型、多模态大模型和大语言模型无缝集成到现有视频监控系统中,构建了一个智能化的危险行为检测系统。其核心价值在于通过AI技术提升监控效率,减少人工干预,实现对危险行为的精准识别和快速响应。系统支持多种主流AI大模型的集成,包括YOLO系列、GPT-4V、Qwen-VL等,覆盖物体检测、场景理解、告警分析等多个环节。
2025-06-24 11:56:51
1328
原创 只改2行代码,RAG效率暴涨30%!多种任务适用,可扩展至百亿级数据规模应用
只需修改两行代码,RAG向量检索效率暴涨30%!不仅适用于文搜文”、“图搜图”、“文搜图”、“推荐系统召回”多种任务;而且具备良好扩展性,适合十亿、百亿级别大规模应用。浙江大学高云君、柯翔宇团队联手向量检索领域大佬傅聪,开源新方法PSP(Proximity graph with Spherical Pathway),突破RAG两大难题。简单来说,主流向量检索方法都是基于欧几里得距离设计,主要看“谁离你最近”;但有时AI其实更需要比较“语义相关性”,也就是最大内积、看谁最相似。以往的内积检索办法,不能像欧式距
2025-06-23 14:07:51
935
原创 【Warp+Ollama+Dify】一文说透大模型本地部署和应用,小白也能上手
今天开始,即将给大家带来如何使用AI Agent 来完成我们日常工作和生活中的常见任务的分享。俗话说,。小白说人话,Warp帮你部署环境;Ollama大模型部署,dify工作流编排:如deepseek-r1,qwen3,Gemma3Warp不管是程序员还是非程序员,安装部署环境都不是一件容易的事情,除了要查找和记住不同的安装命令之外,各种环境的依赖,遇到问题的排查,都需要耗费大量的时间。本文将为大家推荐一个好用的AI命令行工具Warp。它由。
2025-06-23 13:58:29
1662
原创 小白学RAG:17种改进生成的落地方法
在测试中,该功能显著提高了检索质量。给你学习,我国在这方面的相关人才比较紧缺,大模型行业确实也需要更多的有志之士加入进来,我也真心希望帮助大家学好这门技术,如果日后有什么学习上的问题,欢迎找我交流,有技术上面的问题,我是很愿意去帮助大家的!通过实现反馈循环,可以持续提高检索文档的质量,增强生成响应的相关性,使系统随着时间的推移适应用户的偏好和需求。生成相关问题通过为每个文本片段生成各种相关问题,并将这些问题纳入向量数据库中,从而增强了标准的检索过程,提高了找到可作为生成式问答上下文的相关文档的可能性。
2025-06-18 11:41:53
1007
原创 Devin CEO:别搞多智能体!Anthropic:我们性能提升90%!
那么,为什么Cognition觉得多智能体不行,Anthropic却用得飞起?感觉上,存在一个核心模式的差异。是 write 还是 read?read - 读。比如说信息搜集、研究、分析等。这类任务天然适合并行,让10个Agent同时去读10篇论文,互不干扰,最后汇总即可。write - 写。比如说代码生成、内容创作等。这类任务并行起来就非常困难。因为“写”的每一步都包含大量“隐性决策”(比如代码的架构、变量的命名),两个Agent并行写代码,决策一冲突,产出的东西就无法合并。
2025-06-18 11:32:24
672
原创 一篇文章说清楚AI三大核心技术:RAG、大模型、智能体
前阵子刷到一篇图解AI三大核心技术:RAG、大模型、智能体的文章,但是原图都是都是英文的,很多人看不懂。粉丝还把文章还转发给了我,所以我就硬着头皮用 AI 辅助翻译,并加了一些自己的理解,用中文给大家再普及一下AI三大核心技术:RAG、大模型、智能体的区别。原图翻译后的图原装引擎不动,只加小部件,成本低,效果好比LoRA更省钱,只调一半部件,效果稍微差一点但够用共用的喇叭设备,只调几个按钮,最省钱的方法今天换个零件,明天再换个零件,循序渐进,更稳定不同零件用不同的安装速度,训练更快,效果更好原图。
2025-06-16 14:32:21
1170
原创 一文搞懂大模型的协议(MCP和A2A)
**在人工智能技术迅猛发展的当下,大型语言模型(LLM)与外部世界的交互方式已成为决定其实际应用价值的核心要素。****大模型所采用的协议(例如MCP和A2A)作为推动AI应用生态互联互通的关键技术标准,正发挥着日益重要的作用。****MCP(Model-Context Protocol,模型上下文协议)和A2A(Agent-to-Agent,智能体到智能体)是大模型应用中两个至关重要的协议**。它们分别聚焦于智能体与外部工具的交互,以及智能体之间的协作,共同构建起大模型与外部世界紧密连接的桥梁。****一
2025-06-16 13:44:59
893
原创 使用成本降至三分之一!字节大模型,重磅更新!
豆包大模型重磅升级,并推出创新性的“区间定价”模式,打响了一场平衡成本与性能的“价值战”。6月11日,字节跳动旗下火山引擎举办Force原动力大会。会上,豆包大模型家族全面升级,火山引擎发布了豆包大模型1.6、豆包视频生成模型Seedance 1.0 Pro、实时语音与播客等新模型,并升级了Agent(智能体)开发平台等AI云原生服务。除了主论坛外,本次大会还将举办多场从技术革新到行业场景落地的分论坛,涉及芯片、汽车、智能终端、软件应用等领域的众多企业合作伙伴。
2025-06-12 10:18:51
1304
原创 涉及AI-Agent、大模型过度思考、多模态后训练、测试时扩展等热门研究
紧跟技术发展趋势,快速了解大模型最新动态。、金融CoT推理基准、、图推理归因分析、长文本推理能力提升、、大模型**「表格问答能力提升」**等热门研究。大型语言模型(LLMs)在众多任务上表现接近人类且能进行通用对话,但AI Agent系统多是让语言模型重复执行少量特定任务,变化较少。本文作者提出,并且在需要通用对话能力时,异构代理系统(调用多种不同模型的代理)是自然选择,还讨论了SLMs在代理型系统采用的潜在障碍并概述了从LLM到SLM代理的通用转换算法。
2025-06-10 13:53:22
887
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅