- 博客(1000)
- 收藏
- 关注
原创 LangGraph v0.6 重磅发布!全新 Context API 让智能体开发更简单
LangGraph v0.6 带来的不仅仅是功能更新,更是开发体验的革命性提升:🔥全新 Context API 让配置管理变得简单优雅动态模型选择让智能体更加灵活强大三种耐久性模式满足不同场景需求增强的类型安全让开发更有信心为 v1.0 稳定版本做好充分准备如何学习AI大模型?“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
2025-07-30 14:58:28
547
原创 GPT-5实锤,悄悄上线代号「龙虾」!版本号曝光,实测编程惊人能改屎山代码
给你学习,我国在这方面的相关人才比较紧缺,大模型行业确实也需要更多的有志之士加入进来,我也真心希望帮助大家学好这门技术,如果日后有什么学习上的问题,欢迎找我交流,有技术上面的问题,我是很愿意去帮助大家的!可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。而GPT-5的好消息,就意味着即使预训练的边际收益递减也没关系,因为提升AI模型能力的真正关键,就在于后训练阶段的强化学习。WebDev Arena是一个大模型能力匿名评测的网站,使用相同的提示词,在双盲的情况下,给你认为最好的模型投票。
2025-07-30 14:09:42
714
原创 开源新旗舰 GLM-4.5:不想刷榜,只想干活儿
GLM-4.5 的发布,不只是又一个强大的开源模型问世,更代表了一种务实、高效、以应用为核心的理念。它不炫耀难懂的技术原理,也不执着于榜单虚名,唯一的目标就是:在你需要它的时候,能让你由衷感叹一句:“真不错,把活儿干完了!目前,Z.ai 已经免费开放「满血版 GLM-4.5」,快去体验这个“真正能干活”的强大 AI 帮手吧!如何学习AI大模型?“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
2025-07-29 12:06:20
638
原创 一文全解析:AI 智能体 8 种常见的记忆(Memory)策略与技术实现
它能够在保持对话响应速度的同时,保留大量历史信息,适合低延迟对话、时间跨度较大的任务型助手,以及需要随时回溯旧信息的场景:当用户提出涉及过往内容的问题时,系统可以像操作系统一样将“被交换出去”的记忆及时“唤醒”,实现高效又节省资源的记忆管理。给你学习,我国在这方面的相关人才比较紧缺,大模型行业确实也需要更多的有志之士加入进来,我也真心希望帮助大家学好这门技术,如果日后有什么学习上的问题,欢迎找我交流,有技术上面的问题,我是很愿意去帮助大家的!,一旦窗口滑过,旧信息就永久丢失,无法支持真正的长期记忆。
2025-07-29 11:57:15
1203
原创 【转行大模型工程师笔记】33-语言大模型高效推理综述
模型建立 system2 能力的同时,也让推理路径变得过于冗余了,比如说 QwQ-32B 回答 3*3 花了 1k token本文希望了解如何让推理更有效率:不是一般性的推理优化加速,而是让模型能够最大化每个令牌的智能大型语言模型(LLMs),如DeepSeek V3、Qwen 2.5、LLaMA 3和GPT-4o,已经在广泛的任务中展示了非凡的能力。这些模型以类似于系统1思维的方式运行,其特征是快速、直观和自动的决策。然而,复杂的推理任务,如高级数学和形式逻辑,需要更深思熟虑和结构化的分析。
2025-07-26 11:43:35
635
原创 京东开源轻量化通用Agent产品 jdgenie,开箱即用!二次开发及踩坑指南
在我们的体验过程中,整体上Agent运行比较稳定,虽然并非每次都能输出完全符合期望的结果,但这通常也和使用的LLM、搜索引擎等有一定关系,需要进一步的微调。给你学习,我国在这方面的相关人才比较紧缺,大模型行业确实也需要更多的有志之士加入进来,我也真心希望帮助大家学好这门技术,如果日后有什么学习上的问题,欢迎找我交流,有技术上面的问题,我是很愿意去帮助大家的!截至目前大模型已经超过200个,在大模型纵横的时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。请根据自己实际情况配置即可;
2025-07-24 11:07:10
1824
1
原创 性能刚超Kimi,定价就敢比Claude贵4倍?阿里Qwen3-Coder想干嘛?
相信今天大家都被阿里的Qwen3-Coder刷屏了。什么“4800亿参数开源”、“性能硬刚Claude Sonnet 4”、“SWE-Bench登顶开源SOTA”。。。但是有个被很多人忽略的细节,今天就来聊聊这头性能猛兽背后,那同样“凶猛”的成本。
2025-07-24 10:56:28
559
1
原创 深度解析Agentic AI智能体工作流 —— 打造自适应与高效GenAI未来
近年来,AI智能体(Agent)以及Agentic AI、Agentic架构等相关名词席卷业内,成为决策自动化与高效AI应用的代名词。但智能体到底是什么?它们真的能够完成复杂任务吗?本篇将带你系统梳理Agentic AI的核心概念、工作流模式、架构,并深入探讨其实际应用与局限性。AI智能体(Agent)是一种将大型语言模型(LLM)的推理与决策能力,与丰富的真实世界交互工具相结合的系统。它们可被赋予具体角色、目标与权限,并配备短期与长期记忆,能自我学习、适应与进步,从而以较低的人力介入完成复杂任务。
2025-07-23 11:20:24
652
原创 从DeepSeek-V3到Kimi K2:八种现代 LLM 架构大比较
给你学习,我国在这方面的相关人才比较紧缺,大模型行业确实也需要更多的有志之士加入进来,我也真心希望帮助大家学好这门技术,如果日后有什么学习上的问题,欢迎找我交流,有技术上面的问题,我是很愿意去帮助大家的!Qwen3的密集模型采用了较深的架构(更多Transformer块),具有更多的层,而 Llama 3 是一种更宽的架构,具有更多的注意力头。Qwen3 的内存占用较小,但生成速度较慢。截至目前大模型已经超过200个,在大模型纵横的时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。
2025-07-23 11:04:36
753
原创 一次把 Langchain 的基本用法讲清楚,Langchain保姆级教程,看这一篇就够了!
langchain 的各种花式写法实在是太多,直接看复杂代码让人头晕。文本基于 0.3 版本记录一下基础语法,重点是 ChatModel、PromptTemplate 和 OutputParser,以及如何通过这三种对象搭基础 RunnableSequence,进行一次完整的 LLM 调用。这种小功能单元是 Agent 系统的基础结构。
2025-07-22 10:38:19
1686
原创 梳理一下火爆的大模型
今年年初Deepseek火了之后,大模型百家争鸣。仅仅是编程应用这块,先是套壳VSCode的Cursor 、然后是命令行模式的Claude Code、Gemini CLI,又出来一个Warp,大家都在抢流量,token收费是真香,尤其是深度思考就好比计程车按平台导航兜大圈。趁着今天大佬写了一个总结,跟着盗图梳理一下大模型这个领域的牛马天天都在加班搞什么。。。下图是各家的大模型架构图,结构狂复杂的魔改就为了三个事省算力、省内存、提效果。
2025-07-21 14:51:21
1049
原创 生产级RAG系统落地的10个经验教训
本文为大家解读Contextual AI 联合创始人兼CEO,也是著名的RAG技术先驱,Douwe Kiela 分享的他在企业级 RAG 系统实施与落地中的十大经验教训。本次分享主要针对企业AI系统转化为商业价值的关键难题:根据麦肯锡的估计,当前企业AI总规模高达4.4万亿美元 ,但同时福布斯的调查指出只有约四分之一的企业真正从AI中获益。为什么大部分项目无法突破试点?
2025-07-21 13:45:33
918
原创 谷歌DeepMind重磅发布多模态医疗AI大模型MedGemma技术报告:下一代赋能医疗文本与影像分析的前沿大模型
人工智能(AI)在医疗保健应用中具有巨大潜力,但由于医疗保健数据的多样性、可能任务的复杂范围以及需要保护隐私的要求,其训练和部署具有挑战性。在各种医疗任务上表现良好且需要较少特定任务调整数据的基础模型,对于加速开发用于医疗保健应用的AI至关重要。在本技术报告中,我们介绍了MedGemma,这是基于Gemma 3 4B和27B的新一批医疗视觉-语言基础模型集合。
2025-07-18 11:26:25
1060
原创 行业报告丨信通院:智能体技术和应用研究报告2025(附下载)
给你学习,我国在这方面的相关人才比较紧缺,大模型行业确实也需要更多的有志之士加入进来,我也真心希望帮助大家学好这门技术,如果日后有什么学习上的问题,欢迎找我交流,有技术上面的问题,我是很愿意去帮助大家的!随着多智能体系统正逐步成为构建智能生态的重要支撑形态,大模型和智能体通信协议,为信息孤岛和通信兼容性问题提供了有效的技术解决方案,降低了智能体系统集成复杂性,进一步拓宽了智能体能力边界。截至目前大模型已经超过200个,在大模型纵横的时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。
2025-07-18 11:01:07
1169
原创 关于 AI Agent: 从 Manus 聊起
AI Agent 的发展才刚刚开始。虽然现在的技术还不完美,但进步的速度是惊人的。两年前,我们还在惊叹 ChatGPT 能够进行对话;现在,AI Agent 已经能够帮我们写代码、分析数据、制定计划了。对于技术人员来说,现在是最好的时代。我们有机会参与到这场变革中,创造出真正有用的 AI Agent。但同时,我们也要保持清醒:AI Agent 是工具,不是魔法。它能够提高效率,但不能替代人类的创造力和判断力。未来的世界,可能每个人都会有自己的 AI Agent 团队。就像现在每个人都有智能手机一样自然。
2025-07-12 11:47:39
457
原创 论文浅尝 | 用于多文档问答的知识图(AAAI2024)
另外,如图五 (a)、(b) 所示,作者探索了不同大小的分支数量(即检索时的Top-K 参数)对性能的影响,2WikiMQA 与 MuSiQue 两个数据集上均呈现出先提升后下降的趋势,表明随着 Top-K 的增大,Golden段落命中概率提升的同时无关的噪声数据也会增多。(3)整合多模态文档结构。给你学习,我国在这方面的相关人才比较紧缺,大模型行业确实也需要更多的有志之士加入进来,我也真心希望帮助大家学好这门技术,如果日后有什么学习上的问题,欢迎找我交流,有技术上面的问题,我是很愿意去帮助大家的!
2025-07-12 11:26:20
259
原创 AI智能体实战:批量生成1000条爆款视频,1条爆款轻松涨粉2000+(万字图文)
春节期间,DeepSeek R1 在AI领域引发广泛关注,这款突破性的大模型通过强化学习(RL)技术重新优化了模型架构。它的创新之处在于能够像人类大脑一样,系统性地规划和推理每一个决策步骤。这种方法不仅让AI的思维过程更加清晰透明,还使其推理能力获得了显著提升。特别是在复杂任务处理方面,DeepSeek R1表现出了前所未有的准确性和效率,让整个AI行业为之振奋。第一个原因啊,就是AI现在最擅长的恰好是内容营销最需要的,比如生成文案、做图片、数字人、剪视频,这些都是内容营销的核心。
2025-07-10 11:54:04
886
原创 最全梳理:一文搞懂RAG技术的5种范式!
高级 RAG 引入了具体的改进措施,以克服 Naive RAG 的局限性。为了提高检索质量,它采用了检索前和检索后策略。为了解决索引问题,高级 RAG 通过使用滑动窗口方法、细粒度分割和元数据的整合,改进了索引技术。此外,它还采用了多种优化方法来简化检索过程。模块化 RAG 架构超越了前两种 RAG 范式,具有更强的适应性和多功能性。它采用了多种策略来改进其组件,例如为相似性搜索添加搜索模块,以及通过微调完善检索器。为应对特定挑战,还引入了重组 RAG 模块和重排 RAG 管道等创新方法。
2025-07-10 11:37:56
509
原创 5款AI知识库工具深度测评:哪款是你的菜?
在信息爆炸的时代,如何高效管理和运用知识,成为每个人的必修课。AI知识库工具应运而生,它们不仅能帮你梳理杂乱的资料,更能智能回答你的疑问。今天,我们就来扒一扒市面上5款热门AI知识库工具,看看它们各自有哪些看家本领,又有哪些不尽如人意的地方。除了这5款之外,还有很多比较好用的知识库,欢迎大家补充!
2025-07-08 11:28:18
1747
原创 OpenAI教你做Agent:2025年,评估标准和如何产品化是Agent的重点
他们认为,受益于 CoT 与 tool use 的结合,agent 获取信息的方式已经发生了巨变,agent 的下一步是能够接入数百个工具,并能够自主判断调用哪个工具并确定如何使用。AI agent 并不是一个新概念,但从 2024 年到今天,agent 的行动能力和交互方式发生了质变,头部模型厂商也正在将 agentic 能力融入模型,agentic 能力会成为今年模型竞赛的重点之一, tool use 作为 agent 最重要的能力,一直是头部 AI labs 非常关注的方向。
2025-07-08 11:02:46
1010
原创 从被优化到年薪40万:35岁Java程序员的AI大模型逆袭之旅
男人过了35是不是就真的被淘汰了?”电话那头,老李的声音有些沙哑,带着深深的无奈和焦虑。昨天,他刚刚被公司优化,从一家大厂的外包Java开发岗位上离开。我们曾是同一所211大学的同学,毕业后他一直在做Java开发,本以为能安稳地干到退休,却没想到在35岁这年,遭遇了职业生涯的滑铁卢。“现在找工作太难了,很多公司一看我35岁,连面试机会都不给。”老李的声音里透着疲惫,“家里还有房贷、车贷,孩子上学也要花钱,我真的不知道该怎么办了。听着老李的倾诉,我心里五味杂陈。
2025-07-04 11:40:53
1017
原创 AI大模型应用架构图大全
给你学习,我国在这方面的相关人才比较紧缺,大模型行业确实也需要更多的有志之士加入进来,我也真心希望帮助大家学好这门技术,如果日后有什么学习上的问题,欢迎找我交流,有技术上面的问题,我是很愿意去帮助大家的!截至目前大模型已经超过200个,在大模型纵横的时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战项目来学习。要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。
2025-07-04 11:22:37
433
原创 个人知识库,真心建议你尽早搭建!【深度干货】
IMA 作为一个新的知识库产品,别嫌它不完美!它正在悄悄改变我们的学习方式!如果你符合以下任一情况,今天现在就去试试 IMA▸ 经常‘记得有资料但找不到’的人▸ 每天处理超过 3 种信息形式的职场人▸ 想用 AI 但怕复杂的小白用户。
2025-07-02 14:14:58
914
原创 Dify × MCP 实战(三):结果别再堆字了!用 AntV 插件打造图表可视化工具
在之前dify插件市场检索mcp的时候,发现了 一个图表可视化插件AntV,很早之前我了解到echarts,功能比较单一,只支持3种图表,看了下就没有深入研究。
2025-07-01 21:59:19
1322
原创 《Happy-LLM》项目正式发布,一起快乐学习大模型!
本项目是一个系统性的 LLM 学习教程,将从 NLP 的基本研究方法出发,根据 LLM 的思路及原理逐层深入,依次为读者剖析 LLM 的架构基础和训练过程。同时,我们会结合目前 LLM 领域最主流的代码框架,演练如何亲手搭建、训练一个 LLM,期以实现授之以鱼,更授之以渔。希望大家能从这个项目开始走入 LLM 的浩瀚世界,探索 LLM 的无尽可能。🔍 深入理解 Transformer 架构和注意力机制📚 掌握 预训练语言模型的基本原理🧠 了解 现有大模型的基本结构。
2025-07-01 21:52:52
700
原创 大模型怎么转?适合哪些人?哪些方向对新手友好?又有哪些坑你必须避开?
如果你之前有写后端、搞大数据、做K8s、玩过分布式系统的经验,那这个方向太适合你了。
2025-06-30 14:40:56
1504
原创 探索AI未来:GraphRAG——更高效智能的跨文档查询方式
GraphRAG是一种将知识图谱与大语言模型(LLM)相结合的前沿技术,极大提升了复杂问题检索、文档互联及领域知识集成的准确性和效率。本文详细介绍了GraphRAG的原理、优于传统RAG(向量检索增强生成)的关键优势,并通过实际案例和实现流程,帮助专业人士把握最新的企业AI知识管理与应用趋势。
2025-06-30 11:51:25
547
原创 KAG-Thinker: 在知识增强大模型中进行互动式思考和深度推理以及医药领域应用 - 蚂蚁集团等
摘要本文介绍了KAG-Thinker,它将知识增强生成(KAG)升级为一个由专用轻量级大型语言模型(LLM)驱动的多轮互动式思考和深度推理框架。我们的方法构建了一个结构化的思考过程,用于解决复杂问题,增强了在特定领域知识库(KBs)上的问答(Q&A)任务中推理过程的逻辑连贯性和上下文一致性。遵循KAG的逻辑形式引导检索和推理技术路线,该框架首先通过广度分解将复杂问题分解为可独立解决的子问题(也称为逻辑形式)。每个这样的逻辑形式以自然语言和逻辑函数的两种等价形式表示,随后被归类为知识检索或推理分析任务。
2025-06-27 11:57:10
1029
原创 这一职业,突然爆火!有人简历刚投,就被“抢光”……
人工智能快速发展让相关领域人才需求大幅增长某招聘平台数据显示今年春节后至今业内人士表示随着大语言模型的快速发展以及涉及的领域越来越多人工智能训练师的需求还会继续增加。
2025-06-24 11:57:49
1150
原创 一网打尽:AI 大模型应用架构图终极合集
人工智能已然成为推动各行业变革的核心力量。而 AI 大模型,更是以其强大的通用性和适应性,开创了智能应用的新纪元。从精准营销到智能安防,从医疗诊断到工业制造,AI 大模型正深度融入各个领域,重塑行业生态。AI 大模型的应用架构图**也成为我们理解这一领域至关重要的 “地图”。它不仅清晰地描绘了技术的脉络,还向我们展示了众多实际应用的广阔前景。如今,*这份 AI 大模型应用架构图大全*应运而生,*汇聚了众多前沿技术架构与行业实践案例*,为读者呈现了一场丰富的知识盛宴。
2025-06-24 11:50:17
734
原创 保姆级Agent(智能体)框架Dify部署流程
Dify是一个开源的LLM的Agent(智能体)应用开发平台,今天咱们详细介绍下Dify的安装步骤和使用场景。使用细节:略,后续分一到多篇文章具体详解。
2025-06-23 14:42:18
1090
原创 dify案例分享-手把手教你用 Dify 搭建中药科普工作流,小白也能轻松上手!
今天主要带大家了解并实现了使用 Dify 搭建演示设计师 SVG 海报生成工作流的方案。此工作流旨在利用大模型将原始材料(如 PPT、PDF、Word 等)自动转换为 SVG 格式的海报,提高海报制作的效率,同时保留源文档的内容和格式。该方案不仅解决了传统海报制作过程中沟通成本高、效果难以把控的问题,还能生成对应的 HTML 代码,方便后续前端工程师进行使用。感兴趣的小伙伴可以按照本文步骤去尝试搭建自己的演示设计师 SVG 海报生成工作流。
2025-06-23 14:14:10
801
原创 解锁未来技能:手把手教你用Dify打造专属DeepSeek智能Agent
上一篇我们已经完成了第一个AI应用-聊天助手的搭建[Deepseek+Dify:零代码玩转大模型,普通人也能成为AI应用开发者;,并赋予他独特的性格。比如上篇文章的助手**“熬夜的猫头鹰”**,他乐观的性格,**不论别人说什么,都会报以鼓励和赞扬。**听起来是不是很像《超能陆战队》里的Baymax,妥妥一个守护型暖男!OK,进入正题。\2. 编写提示词编写Agent的任务目标、工作流程、所需资源和限制条件等提示信息。这些信息将帮助Agent更好地理解用户的意图并执行相应的任务。
2025-06-23 14:00:29
813
原创 17 种(高级)RAG 技术,将您的 RAG 应用原型转变为生产就绪型解决方案
没有明确的道路可循。这是一个不断试错的过程。与任何其他数据科学用例一样,我们有一套特定的工具,可以使用这些工具来尝试找到针对特定问题的解决方案。这就是这些项目一开始就很有趣的原因。如果有一本静态的食谱可以遵循,那不是很无聊吗?
2025-06-18 11:48:39
691
原创 nanoVLM: 简洁、轻量的纯 PyTorch 视觉-语言模型训练代码库
顾名思义,视觉语言模型 (VLM) 是一种处理两种模态的多模态模型: 视觉和文本。这些模型通常以图像和/或文本作为输入,生成文本作为输出。基于对图像和文本 (输入) 的理解来生成文本 (输出) 是一个强大的范式。它支持广泛的应用,从图像字幕生成和目标检测到回答关于视觉内容的问题 (如下表所示)。需要注意的是,nanoVLM 仅专注于视觉问答作为训练目标。
2025-06-18 11:34:50
887
原创 AI应用分享系列(八):智能体的六种设计模式
从静态到动态:Chain/Parallelization(固定流程)→Routing/Orchestrator(动态调度)。从单机到协同:单一模型(Chain)→多模型协作(Evaluator-Optimizer/Orchestrator-Workers)。从封闭到开放:预设任务(Chain)→自主规划(ReAct)。
2025-06-16 14:31:09
1105
原创 如何像 Manus 交付业务需求-- OneAgent + MCPs 范式
强化学习是三种主要的机器学习范式之一,区别于监督学习和自监督学习。监督学习(supervisor learning)是最经典的一种。训练监督学习系统的方法是,比方说让一个系统识别图像。你给它看一张图片,比方说一张桌子,然后告诉它这是一张桌子,这就是监督学习,因为你告诉它正确答案是什么。这就是计算机的输出,如果你在表格上写了别的东西,那么它就会调整内部结构中的参数,从而使它产生的输出更接近你想要的输出。
2025-06-13 10:32:30
678
原创 国产大模型上新!测评达全球第一梯队,价格比DeepSeek更低……
6月11日,字节跳动旗下火山引擎举办Force原动力大会,。字节跳动CEO梁汝波表示,AI发展还处于早期,只是马拉松的前500米。在AI大模型带来的技术变革时代,字节跳动致力于成为优秀的创新科技公司。据字节跳动介绍,。目前,该系列已在火山引擎上线,企业和开发者可调用API体验。火山引擎总裁谭待称,豆包1.6系列模型。此前,豆包1.5的多模态能力在60个公开评测基准中取得38项最佳成绩,已广泛应用在电商识图、自动驾驶数据标注、门店巡检等场景。图形界面操作能力则让豆包1.6进一步具备“行动力”。
2025-06-12 10:20:10
879
原创 7款AI大模型写高考作文,名师点评结果让人惊讶,有的跑题了?!
刚刚,2025年高考作文题目出炉,再次成为亿万网友关注的话题。今年湖北高考语文采用全国一卷,作文题为根据给定的材料进行写作。阅读下面的材料,根据要求写作。(60分)他想要给孩子们唱上一段,可是心里直翻腾,开不了口。——老舍《鼓书艺人》(见全国一卷阅读II)假如我是一只鸟,我也应该用嘶哑的喉咙歌唱——艾青《我爱这土地》我要以带血的手和你们一一拥抱,因为一个民族已经起来——穆旦《赞美》以上材料引发了你怎样的联想和思考?请写一篇文章。要求:选准角度,确定立意,明确文体,自拟标题;
2025-06-10 11:47:05
908
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人