AI大模型
文章平均质量分 95
AI大模型入门学习教程
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
一文讲清楚AI智能体(AI Agent): 概念、技术、趋势及其在制造业中的应用
AI Agent(人工智能代理)是一种具备自主性和目标导向能力的智能系统,能够感知环境、执行任务并不断学习优化。与传统AI助手和聊天机器人相比,AI Agent具有更高的自主决策能力,能处理复杂多步骤任务。根据功能差异,AI Agent可分为反射型、目标导向型、效用优化型和学习型等类别,其核心优势在于结合生成式AI的多模态处理能力,实现动态环境下的自主运作。随着技术进步,AI Agent正从简单规则系统发展为基于大模型的智能实体,将在人机协作中发挥更重要作用。原创 2025-07-31 14:00:00 · 701 阅读 · 0 评论 -
深度解读:智能体2.0 AI Agent多推演进
AI Agent:从图灵测试到智能协作的进化之路 AI Agent(人工智能代理)自1950年代图灵提出智能概念以来不断发展,如今借助大语言模型(LLM)实现了质的飞跃。LLM通过深度学习赋予Agent强大的生成、推理和多语言能力,使其从单一任务(如AlphaGo)迈向通用智能。现代Agent以LLM为核心,结合规划、记忆、工具和行动能力,通过Prompt工程实现自动化升级,并衍生出反思、工具调用、任务规划和多智能体协作四种工作模式。 在应用层面,AI Agent正重塑企业知识库、金融分析、乡村振兴等领域,原创 2025-07-31 13:45:00 · 1876 阅读 · 0 评论 -
RAG+AI工作流+Agent:LLM框架该如何选择,全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM,以及更多推荐
MaxKB与Dify:两大开源LLM应用平台解析 MaxKB是基于大语言模型的开源知识库问答系统,支持文档上传、智能问答和RAG技术,可快速嵌入业务系统。其特点包括开箱即用、灵活编排工作流,并兼容多种大模型(如Llama 3、通义千问等),技术栈涵盖Vue.js、Python/Django及PostgreSQL。 Dify是LLM应用开发平台,结合Backend as Service与LLMOps,支持非技术人员参与AI应用开发。提供Prompt编排、RAG引擎、Agent框架等功能,兼容数百种模型,开发者原创 2025-07-30 11:37:11 · 899 阅读 · 0 评论 -
【优质书籍推荐】LLM分类模式驱动和软件性能测试
本文介绍了大语言模型(LLM)的模式驱动生成(Schema-Driven Generation)方法。该方法通过预定义的JSON模式约束语言模型输出,相比受控生成更易与现有程序集成。文章重点分析了Instructor、LangChain等框架的实现方式:Instructor通过Pydantic模型直接约束OpenAI API输出,支持JSON、函数调用等模式;LangChain则主要通过自然语言提示引导输出格式,并提供错误重试机制。文章还附带两个代码示例,展示如何使用Pydantic模型约束LLM输出格式。原创 2025-07-30 11:34:43 · 638 阅读 · 0 评论 -
AI小白也能快速用五分钟复现的ERNIE-4.5系列模型单卡部署与心理健康机器人实战案例
AI小白也能快速用五分钟复现的ERNIE-4.5系列模型单卡部署与心理健康机器人实战案例原创 2025-07-29 14:15:00 · 1312 阅读 · 0 评论 -
AIGC实战之如何构建出更好的大模型RAG系统
本文由全栈工程师喵喵撰写,介绍了大模型RAG(检索增强生成)系统的三个发展阶段。初级阶段(S1)主要构建基础pipeline,使用向量索引和预定义prompt模板;高级阶段(S2)从模型和策略两方面优化,包括模型微调、查询重写等技术;超级阶段(S3)展望了Agentic RAG、多模态RAG等前沿发展方向。文章旨在帮助读者深入理解RAG技术演进,构建更高效的问答系统。作者为双985硕士,曾在多个AI竞赛中获得Top名次,现为优快云博客专家。原创 2025-07-29 14:30:00 · 895 阅读 · 0 评论 -
DeepSeek服务器繁忙?这几种替代方案帮你流畅使用!(附本地部署教程)
本文介绍了DeepSeek智能推理平台的快速崛起及其面临的服务器负载问题,并提供了三种替代解决方案:纳米AI搜索的第三方平台、GitHub上的开源资源以及硅基流动提供的API服务。文章详细说明了本地部署DeepSeek模型的优势,包括响应速度、数据安全和成本控制等,并给出了运行配置需求和显卡显存对照表,帮助用户评估硬件适配性。最后推荐了多种支持DeepSeek模型的客户端应用,为不同场景下的AI需求提供灵活选择。原创 2025-07-28 14:36:00 · 997 阅读 · 0 评论 -
扣子(Coze)实战:历史故事哄睡视频一键出片!27条作品狂揽35万粉,失眠党的福音
本文介绍了一个基于Coze平台搭建的自动化短视频制作工作流,能够根据用户输入的朝代名称,自动生成哄睡历史故事视频。工作流包含21个步骤,从文案生成、配音处理到图片生成和剪辑合成,实现了全流程自动化。作者详细拆解了视频构成的9个要素和工作流实现逻辑,并提供了核心节点的配置方法,包括文案生成、音频处理、图片生成和时间线配置等。该工作流显著提高了制作效率,但作者强调需要加入个性化创意以避免内容同质化。文章还提供了流程图和代码示例,帮助读者理解整个自动化流程的实现原理。原创 2025-07-28 14:34:05 · 578 阅读 · 0 评论 -
Qwen2.5 全链路模型体验、下载、推理、微调、部署实战!
通义千问团队开源Qwen2.5系列语言模型,包含基础版、编程专用版和数学专用版,提供从5亿到720亿参数的多种规模选择。新模型在18T tokens数据集上训练,知识储备(MMLU 85+)、编程(HumanEval 85+)和数学能力(MATH 80+)显著提升,支持128K上下文和29种语言。专业模型Qwen2.5-Coder在5.5T编程数据上训练,Qwen2.5-Math整合多种推理方法。性能测试显示,72B版本超越主流开源模型,小参数模型也展现竞争力。模型采用Apache 2.0许可证,开发者可通原创 2025-07-26 12:00:00 · 931 阅读 · 0 评论 -
【DeepSeek】在本地计算机上部署DeepSeek-R1大模型实战(完整版)
摘要 本文详细介绍了如何在个人计算机上本地部署DeepSeek R1大模型。作为一款2025年初发布的轻量级AI模型,DeepSeek R1突破了传统大模型对高性能硬件的依赖,仅需8GB内存和30GB磁盘空间即可运行。文章从数据隐私保护、定制化需求等角度阐述了本地部署的优势,并提供了完整的部署流程指南,包括Ollama安装、模型下载、Python环境配置等关键步骤。特别针对Windows10用户,作者验证了在普通笔记本电脑上运行该模型的可行性,强调整个过程无需专业编程知识,只需按照指导操作即可完成。通过这种原创 2025-07-26 11:15:00 · 882 阅读 · 0 评论 -
GPT-4o mini:AI技术的平民化革命
GPT-4o mini 是 OpenAI 推出的一款小型智能模型,它是 GPT-4o 的简化版本,具有更小的参数量和更高的性价比。这款模型在功能上非常强大,性能接近原版 GPT-4,同时成本相比 GPT-3.5 Turbo 降低了超过 60%。GPT-4o mini 支持多达 50 种不同语言,能够处理大量的上下文信息,支持文本和视觉输入输出,未来还计划扩展到图像、视频和音频的原创 2025-07-25 11:09:35 · 860 阅读 · 0 评论 -
OmniSteward:LLM Agent 赋能,语音文字随心控,智能家居与电脑的超级管家
OmniSteward:基于大语言模型的全能AI管家系统 OmniSteward是一款正在开发中的智能管家系统,通过大语言模型实现语音/文字交互,支持智能家居控制、电脑程序管理、在线检索等功能。系统采用Qwen2.5等AI模型,结合Flask框架和Selenium等技术构建,具备多模态交互、多轮对话和高度可扩展性。安装需Python 3.8+和Chrome浏览器,支持Windows平台,提供命令行和Web两种使用模式。该项目由ElliottZheng维护,遵循MIT开源协议,致力于打造便捷的智能生活体验。原创 2025-07-25 11:08:04 · 651 阅读 · 0 评论 -
【RAG检索增强生成】MaxKB:构建企业级知识库问答系统(Ollama+Qwen2)
MaxKB是一个开源AI知识库问答系统,支持文档上传、自动爬取和智能问答。文章介绍了如何基于MaxKB+Ollama+Qwen2搭建本地知识库,包括环境准备、MaxKB部署、Ollama安装、Qwen2模型运行以及知识库配置步骤。系统支持多格式文档处理,提供智能问答功能,可无缝嵌入第三方业务系统。通过Docker容器化部署,简化了安装流程,为构建企业级知识库提供了完整解决方案。原创 2025-07-24 10:28:42 · 489 阅读 · 0 评论 -
视频生成新纪元:震撼开源的智谱AI CogVideoX模型深度解析
智谱AI开源视频生成模型CogVideoX,基于3D Causal VAE压缩技术和专家Transformer架构,支持高效显存利用(FP-16推理仅需18GB)和720x480分辨率视频生成。其开源资源包括代码库、模型和技术报告,为创作者和企业提供从个人到商业应用的支持。该技术通过高质量数据筛选和动态光流计算优化视频质量,在教育、影视和广告领域具有广阔应用前景。部署简单,支持单显卡运行,为AI视频生成技术带来突破。原创 2025-07-24 10:27:26 · 390 阅读 · 0 评论 -
Dify智能体开发:RAG 技术深度解析与知识库实战指南
摘要: 检索增强生成(RAG)技术通过动态检索外部知识库与智能生成结合,解决了大模型的时效性不足和幻觉问题,显著提升回答准确性。其核心包括智能检索(语义向量匹配)、文档处理(分层分割与元数据管理)和生成优化(Prompt工程与幻觉抑制)。RAG在企业知识库、医疗问诊、法律咨询和智能客服等场景中实现90%以上的准确率提升,如金融政策查询和多轮对话优化。未来趋势包括多模态融合、自治式检索及与Agent技术结合,但需解决长上下文检索、多文档整合等挑战。原创 2025-07-23 13:49:12 · 954 阅读 · 0 评论 -
Deepseek-R1大模型在银行系统的微调落地方案
摘要 本项目旨在通过微调Deepseek-R1大模型提升银行系统的智能化水平,应对金融科技快速发展背景下的银行业务挑战。项目聚焦于客户服务自动化、风险管理、业务流程优化三大核心场景,通过数据收集与预处理、模型微调与优化、系统集成与测试、持续监控与迭代四个阶段实施。微调后的模型将显著提升银行在自然语言处理、风险预测、欺诈检测等方面的能力,预计客户服务推荐准确率提升14%,风险控制预警准确率提升11%。该解决方案不仅能提高银行运营效率和服务质量,还将为数字化转型提供关键技术支撑,帮助银行在市场竞争中保持优势地位原创 2025-07-23 11:35:40 · 702 阅读 · 0 评论 -
大模型学习路径之多模态模型学习路线分享,很强很全!
本文介绍了多模态学习领域的主流模型CLIP、BLIP、BLIP2及其应用实践。文章首先概述了CLIP通过对比学习对齐图像和文本特征的原理,以及BLIP系列模型通过多模态混合架构实现视觉-语言理解与生成的技术路线。随后以CLIP和VisualGLM为例展示了多模态模型的实际应用,并简要提及了LLaVA、miniGPT4等同类模型。文章为读者提供了多模态学习的基础理论框架和实践案例,可作为该领域的入门参考资料。原创 2025-07-22 14:47:30 · 808 阅读 · 0 评论 -
2025年最新AI大模型学习路线(非常详细)从入门到精通!学完即就业!
摘要:本文介绍了2025最新版的大模型学习路线,分为L1-L4四个阶段:L1学习大模型基础知识和提示工程;L2掌握RAG应用开发;L3进阶Agent应用架构;L4深入微调与私有化部署。通过理论+实战的方式,帮助新人系统学习大模型技术,并提供配套教程资料。原创 2025-07-22 14:24:53 · 944 阅读 · 0 评论 -
Adam优化算法在大规模分布式模型训练中的应用:模型整合与性能提升
本文探讨了Adam优化算法在大规模分布式模型训练中的应用,重点分析了其模型整合与性能提升能力。文章首先介绍了深度学习模型训练面临的挑战以及Adam算法的优势,随后详细阐述了Adam算法的核心原理、数学公式及与其他优化算法的比较。在实现部分,提供了从环境配置到核心模块实现的完整流程,包括单机训练和分布式训练的代码示例。最后,针对分布式训练场景,讨论了Adam算法的优化方向,包括训练速度、准确性和安全性改进。本文面向深度学习从业者和对优化算法感兴趣的读者,为大规模分布式模型训练提供了实用的技术参考。原创 2025-07-21 12:02:04 · 1052 阅读 · 0 评论 -
【小白】一文读懂CLIP图文多模态模型
CLIP(Contrastive Language-Image Pre-Training)模型是一种多模态预训练神经网络,由OpenAI在2021年发布,是从自然语言监督中学习的一种有效且可扩展的方法。CLIP在预训练期间学习执行广泛的任务,包括OCR,地理...原创 2025-07-21 11:44:48 · 1938 阅读 · 0 评论 -
大模型RAG入门到实战基础教程(非常详细),大模型RAG入门到精通,收藏这一篇就够了!
本文介绍了检索增强生成(RAG)技术如何解决大模型(LLM)在实际应用中的关键问题,包括幻觉问题、时效性不足和数据安全风险。RAG通过结合外部知识检索与生成过程,有效提升模型输出的准确性和时效性,同时保障企业数据安全。文章详细分析了RAG的技术架构优势,并提供了一个基于LangChain的实践示例,展示了如何加载本地文本数据构建RAG系统。该技术为行业应用大模型提供了经济高效的开箱即用解决方案,特别适合专业场景和隐私敏感领域。原创 2025-07-18 11:38:09 · 949 阅读 · 0 评论 -
【AI大模型应用开发】1.1 Prompt Engineering(提示词工程)- 用OpenAI API实战,优化方法论总结
本文介绍了AI大模型提示词工程(Prompt Engineering)的实战技巧。主要内容包括:1. 封装通用OpenAI对话函数,测试temperature参数对回答随机性的影响;2. 通过添加System Prompt定义模型角色,提升回答质量;3. 提供Prompt优化方法论,如使用分隔符、角色扮演、输出约束等技巧;4. 介绍进阶优化方法如少样本提示。文章通过代码示例展示了如何从简单Prompt开始,逐步优化提示词,从而获得更精准的大模型回答。原创 2025-07-18 11:01:59 · 436 阅读 · 0 评论 -
读懂RAG这一篇就够了,一文讲明白所有RAG概念!附带完整RAG实践过程!
本文介绍了检索增强生成(RAG)技术及其在医疗智能问诊中的应用。RAG通过结合大规模语言模型(LLM)与外部知识检索,有效解决LLM的知识局限和幻觉问题,提升问答系统的准确性和专业性。文章详细阐述了RAG的分类(Naive RAG、Modular RAG、Agentic RAG)及其发展历程,并解析了RAG的基本流程:构建文本库、生成向量表征、建立索引、检索匹配和模型生成答案。最后,以医院智能问诊场景为例,展示了RAG如何整合静态医学知识和动态患者病历数据,通过意图分析、信息检索和上下文交互,实现精准的医疗原创 2025-07-17 15:16:54 · 800 阅读 · 0 评论 -
DeepSeek大模型优化实践:从数据处理到模型部署的高效策略
摘要: 本文系统介绍了DeepSeek大模型在数据处理、训练优化及部署应用中的关键技术。通过数据清洗、特征提取和增强,训练效率提升30%;结合超参数优化与分布式训练,GPU利用率提升至89%;模型压缩与异步处理使推理速度提升300%。案例显示,电商推荐响应时间缩短至200毫秒,金融风控准确率达95%。文末提供AI大模型学习资料,涵盖提示词工程、RAG系统及智能体开发,助力从入门到实战的全链路技能提升。原创 2025-07-17 14:47:07 · 732 阅读 · 0 评论 -
AI大模型知识点大梳理
AI大模型是指具有数十亿甚至数万亿参数的深度学习模型,在自然语言处理、计算机视觉等领域取得重要突破。文章介绍了AI大模型的发展历程,从ChatGPT到GPT-4,国内外企业纷纷布局;阐述了其底层原理,包括数据预处理、神经网络构建、训练优化等步骤;分析了AI大模型在自然语言处理、计算机视觉、人脸识别等领域的应用。文章还讨论了大模型的优缺点及其广泛影响,指出大模型虽性能强大但也面临计算资源消耗大等问题。最后分享了对AI大模型未来发展的个人观点。原创 2025-07-16 11:47:22 · 1070 阅读 · 0 评论 -
AI大模型赋能中医药产业发展分析
以大模型为代表的人工智能技术正在加速改变世界,成为引领新一轮科技革命和产业变革的关键驱动。近年来,在数据、算法和算力等关键要素的快速迭代下,AI大模型迅速发展,应用领域不断拓宽,正在与中医诊疗、中药研发等深度融合,带来了众多创新与突破。中医药模型如同一位博学的古代名医,穿越时空,与现代科技携手,共同守护着人类的健康。原创 2025-07-15 10:51:30 · 1177 阅读 · 0 评论 -
【AIGC】大模型在金融行业的应用场景和落地路径
当前,金融科技已经从“立柱架梁”迈入了“积厚成势”新阶段,越来越多的金融机构积极使用数字技术来为金融血脉注入全新能量。人工智能技术正加速与金融产业深度融合,以 ChatGPT 为代表的大模型技术不断进化,为金融业带来深刻变革,驱动金融服务更加高效、便捷、有温度。ChatGPT 拥有持续的多轮对话能力,并具备一定逻辑推理能力,在生成文章、生成代码、翻译等方面展现出令人惊叹的水平。ChatGPT 的问世,意味着人工智能从 1.0 时代迈入了 2.0 时代。ChatGPT 背后的 GPT 大模型技术是下一代原创 2025-07-15 10:25:30 · 998 阅读 · 0 评论 -
一文掌握大模型数据准备、模型微调、部署使用全流程
距离ChatGPT已经发布1年半了,距离我们训练出自己的大模型也已经1周年了。目前仍然有很多同学在咨询如何训练自己的大模型。这个东西和男/女朋友一样。当你不认识TA,距离TA很远,不敢接触TA的时候,TA就是很神秘,也很难接触。但是一旦当你愈发了解TA的时候,你就知道其实上手也很容易。之前我已经撰写了一个简单的训练大模型的代码,用于阐述大模型训练其实和原来的训练没什么两样。但是随着大模型深入到了每一个研究者的手上,这时候,训练部署的代码框架就更为重要了。原创 2025-07-12 15:47:54 · 858 阅读 · 0 评论 -
AI模型大杀器----Amazon SageMaker 实现高精度猫狗分类
Amazon SageMaker是一个完全托管的机器学习平台,能够帮助开发者和数据科学家快速构建、训练和部署ML模型。它提供端到端的机器学习工具,包括数据预处理、算法设计、模型训练和部署,同时支持高性能计算资源。用户无需管理底层基础设施,只需通过Jupyter Notebook界面即可完成开发工作。本文以猫狗分类为例,展示了如何创建SageMaker笔记本实例、配置环境并启动Jupyter Notebook进行模型开发。SageMaker简化了机器学习流程,让开发者可以专注于算法实现而非运维工作。原创 2025-07-12 15:08:24 · 451 阅读 · 0 评论 -
【大模型系列——解读RAG】_大模型rag是什么意思
RAG 是2023年最流行的基于 LLM 的应用系统架构。有许多产品几乎完全建立在 RAG 之上,覆盖了结合网络搜索引擎和 LLM 的问答服务,到成千上万个数据聊天的应用程序。很多人将RAG和Agent 作为大模型应用的两种主流架构,但什么是RAG呢?RAG又涉及了哪些具体的技术呢?1. 什么是RAGRAG即检索增强生成,为 LLM 提供了从某些数据源检索到的信息,并基于此修正生成的答案。RAG 基本上是 Search + LLM 提示,可以通过大模型回答查询,并将搜索算法所找到的信息作为大模型的上下原创 2025-07-11 15:10:22 · 681 阅读 · 0 评论 -
全网最全RAG评估指南:全面解析RAG评估指标并提供代码示例
本文探讨了RAG(检索增强生成)系统的痛点及优化策略。关键痛点包括数据处理、chunk大小设置、embedding模型选择、prompt设计、topN检索参数调整及LLM模型选择等。优化建议包括:数据清洗与合理分段(100-300词)、选用BERT等成熟embedding模型、设计清晰prompt、调整topN值(3-10)、结合GPT等大语言模型,并建议通过尝试更大模型来提升生成效果。文中还提供了具体代码示例,展示数据预处理和embedding的实现方法。原创 2025-07-11 14:13:52 · 467 阅读 · 0 评论 -
AI大模型赋能电商行业:引领数字化转型与创新变革
AI大模型赋能电商行业变革 摘要:AI大模型(如GPT、BERT)正深刻改变电商行业,通过个性化推荐、智能客服、供应链优化等八大核心场景驱动变革。关键技术应用包括:1)基于用户行为的精准商品推荐与广告投放;2)24小时NLP智能客服系统;3)需求预测与动态定价的库存管理;4)语义理解和AR技术提升搜索体验;5)自动化内容生成与营销文案优化。这些技术使电商平台转化率平均提升30%,库存周转率提高25%,同时通过反欺诈系统增强安全性。随着AI技术发展,电商行业将加速向智能化、个性化生态演进。原创 2025-07-08 11:04:16 · 1139 阅读 · 0 评论 -
大语言模型 - 提示词(Prompt)工程入门
摘要:本文系统介绍了提示词工程(Prompt Engineering)的核心内容,包括基本原则、结构设计、优化技巧和框架技术。重点阐述了编写清晰指令、结构化输出、分阶段思考等五大优化策略,以及Co-STAR、RISEN等Prompt框架和零样本提示、思维链等14项关键技术。文章还列举了大语言模型在周报生成、数据分析等8个常见场景的应用方案,为开发者提供了从理论到实践的完整Prompt设计指南。原创 2025-07-07 17:27:45 · 1882 阅读 · 0 评论 -
LLMs之Law:大语言模型纵向赋能场景—垂直行业场景应用之大模型法律行业的简介、主流LLMs(PowerLawGLM/ChatLaw)、经典应用之详细攻略
摘要: 法律行业大模型通过垂直领域优化解决通用大模型的法律知识缺陷。清华大学开发的PowerLawGLM基于GLM-130B,通过三阶段训练(法律语料收集、对话对齐微调、工程优化)提升合同生成、法律问答等专业能力;北大ChatLaw则基于Ziya-LLaMA-13B,整合外部知识库增强准确性。两者均针对通用模型易产生的虚假案例引用等问题,提供更可靠的法律服务,推动AI在法律咨询、文书生成等场景的应用。原创 2025-07-04 12:01:13 · 1028 阅读 · 0 评论 -
国产AI大模型在医疗行业的应用:10大场景典型案例全解析!
人工智能技术的浪潮正席卷全球,AI大模型以其卓越的数据处理能力和深度学习能力,正在成为医疗健康领域变革的关键力量。本文将深入探讨AI大模型在医疗十大场景中的创新实践,展示其提升医疗服务效率、赋能临床决策、推动行业智能化转型的广阔前景。原创 2025-07-04 11:27:14 · 1136 阅读 · 0 评论 -
【玩转 TableAgent 数据智能分析】股票交易数据分析+预测
TableAgent是一款基于Alaya大模型的智能数据分析工具,由九章云极DataCanvas公司开发。它通过AI技术实现自动化数据处理与分析,用户只需输入分析目标,TableAgent即可自动完成数据筛选、格式转换、模型选择、代码生成、运行分析并输出报告,全程无需编码。该工具支持会话式交互、领域微调、私有化部署,适用于企业级数据分析。本文以建设银行股票数据为例,演示了TableAgent的注册、数据准备及分析流程,验证其自动化分析能力,帮助用户理解大模型驱动的分析工具如何提升工作效率。原创 2025-07-03 11:59:30 · 997 阅读 · 0 评论 -
从0到1开发AI Agent(智能体)(六)| 智能体1 :通过LangChain中的ReAct框架实现自动定价
摘要: 本文介绍了如何利用ReAct框架构建智能体(Agent)来解决鲜花店定价问题。ReAct框架通过协同推理(Reasoning)和行动(Acting),使大模型能够动态决策并调用外部工具。文章详细阐述了ReAct框架的四个核心要素:大模型(LLM)、提示词(prompt)、外部工具(如搜索引擎)和Agent执行器。通过Python代码示例,展示了如何实现一个根据天气和交通状况自动调整鲜花价格的智能体,并利用LangChain工具链完成推理-行动循环。该方案模拟了人类定价的决策过程,体现了AI智能体在业原创 2025-07-03 14:30:00 · 873 阅读 · 0 评论 -
LangChain实战 | Tool Calling :让AI真正动起来的关键技术
摘要 本文介绍了大模型通过Tool Calling调用外部工具的方法,重点讲解了LangChain框架下的工具定义与调用流程。主要内容包括:1) 工具的定义方式,通过@tool装饰器创建工具,可自定义名称、描述和参数;2) 工具与大模型的绑定过程;3) 大模型Tool Calling的工作原理,模型仅生成调用参数而不直接执行;4) 完整的调用示例,展示从工具定义到最终执行的四个步骤。文章强调Tool Calling能力使大模型从单纯的语言生成工具升级为任务执行引擎,解决了静态知识局限和执行能力缺失等问题。原创 2025-07-03 10:30:00 · 953 阅读 · 0 评论 -
一文说清楚什么是AI大模型
本文系统介绍了大语言模型(LLM)的核心概念与技术特性。主要内容包括:1)LLM的定义,强调其基于Transformer架构、超大规模参数和通用任务处理能力;2)核心技术解析,重点说明注意力机制、并行计算和编码器-解码器结构的工作原理;3)探讨"大模型"特指语言模型的原因,包括技术突破、应用广泛性和商业价值;4)区分"大模型"与"小模型"的差异,指出参数规模、训练数据和计算资源的不同;5)列举典型小模型案例及其轻量化优势。文章通过班级管理比喻生动阐原创 2025-07-02 11:40:26 · 1017 阅读 · 0 评论 -
一文说清楚什么是AI Agent(智能体)
在人工智能的浪潮中,AI Agent作为新一代的技术革命,正逐渐走进我们的视野。AI Agent不仅仅是工具,更是连接复杂任务的关键纽带,它们能够理解自然语言、生成响应以及执行具体行动。什么是AI Agent?AI Agent,即人工智能代理,一般直接叫做智能体。它是一种能够感知环境、做出决策并采取行动的系统。这些系统能够执行被动的任务,也能够主动寻找解决问题的方法,适应环境的变化,并在没****有人类直接干预的情况下做出决策。原创 2025-07-02 11:39:24 · 626 阅读 · 0 评论
分享