- 博客(550)
- 收藏
- 关注
原创 【概念扫盲】AI Agent与Agentic AI到底有何不同?一文详解
本文探讨了AI Agent与Agentic AI的区别与联系。Agentic AI是由吴恩达提出的概念,指具备自主思考和解决问题能力的未来人工智能形态,强调系统性、适应性和目标导向性;而AI Agent是当前基于大模型的具体实现方案,专注于完成特定任务。二者的核心区别在于:Agentic AI是目标导向的能力框架,AI Agent是任务驱动的具体实现。文章指出,虽然当前AI技术仍处于"伪智能"阶段,但Agentic AI为人工智能发展提供了方向性思考,而AI Agent则展现了现阶段可行
2025-07-31 15:00:00
829
原创 AI Agent架构全解析:从基础概念到系统设计的完整指南
本文系统介绍了AI Agent(人工智能代理)的概念、架构和应用。AI Agent是以大型语言模型为核心、能感知环境并自主决策的智能系统,广泛应用于客服、医疗、金融交易等领域。其架构采用PPA(感知-规划-行动)模型,通过持续的环境交互实现智能行为,其中记忆机制(感觉记忆、短期记忆等)对经验积累和决策优化至关重要。文章还对比了AI Agent与其他技术,列举了相关开发框架,并展望了其未来发展前景。AI Agent正凭借其高效性、适应性成为现代社会的关键技术之一。
2025-07-31 14:45:00
744
原创 【技术干货】大模型量化学习指南:Quantization原理与应用详解
大型语言模型(LLM)量化技术通过将高精度浮点参数转换为低精度整数参数,有效降低模型存储和计算需求。该技术主要包括参数压缩和计算加速两方面,能够节省显存、加速推理并降低通讯量。研究表明,大模型(70B+)采用4bit量化对性能影响较小,而小模型则更适合8bit量化。量化技术适用于移动设备、边缘计算和云端部署等场景,在保证模型性能的同时显著提升运行效率。不同数据格式(FP32、FP16、BF16等)的选择需要平衡精度与计算效率,其中TF32和BF16等新型格式在深度学习中展现出优势。
2025-07-30 15:05:46
761
原创 AI开发者必知:LLM框架、Agent应用、Workflow架构概念与实践
摘要: 本文深入解析AI领域的三大关键技术:LLM框架(大语言模型)、Agent应用和Workflow架构。通过技术原理剖析、代码示例和操作指南,系统介绍LLM框架的自然语言处理能力、Agent的智能决策特性以及Workflow的高效协同机制。文章旨在为开发者提供实用技术参考,涵盖核心概念、应用场景及实现方法,助力读者掌握AI前沿技术。关键词:人工智能、LLM、智能代理、工作流、技术创新。
2025-07-30 14:59:51
758
原创 qwen2.5大模型微调实战教程:详细步骤+代码示例完整指南
摘要 本文介绍了大模型微调(Fine-tuning)的基础概念和常见方法。微调是指在预训练模型基础上,使用特定数据集进行进一步训练,使模型适应特定任务或领域。其优势包括提升任务性能、增强领域适应性、解决数据稀缺问题、防止过拟合及降低成本。常见微调方法包括SFT(有监督微调)、LoRA、QLoRA等,其中SFT通过标记数据调整模型权重,优化任务表现。微调流程包括数据准备、执行训练、迭代调整和模型更新。文章还提及了实操微调Qwen2.5的案例,展示了微调的实际应用价值。
2025-07-29 15:30:00
930
原创 LLM部署实战:基于Qwen2+FastAPI的并发控制与流式响应实现
本文提出了一种基于FastAPI的大型语言模型(LLM)服务器部署方案,重点解决并发控制和流式响应两大工程实践问题。通过asyncio.Queue实现请求队列管理,当请求超过阈值(10个)时直接拒绝新请求,防止服务器过载;采用ThreadPoolExecutor线程池执行器将同步推理任务转为异步执行,避免阻塞事件循环。同时,利用TextIteratorStreamer实现边推理边输出的流式响应,显著提升用户体验。实验表明,该方法能有效支持并发推理任务,GPU显存占用随并发量动态调整并回落。该方案为单机部署L
2025-07-29 15:15:00
864
原创 10分钟搭建合同审查AI智能体!Dify+Qwen3保姆级教程,小白轻松上手
本文详细介绍了如何从零开始部署Dify AI框架并构建合同审查智能体。教程分为五个部分:首先说明Dify在数据安全性和本地化部署方面的优势;接着逐步指导安装Docker等必备工具,完成Dify的本地部署;然后介绍通过Ollama集成Qwen3模型的方法,针对不同硬件配置推荐适配模型;最后演示10分钟快速创建合同审查智能体的流程。文章配有详细操作截图和命令示例,即使非技术人员也能跟随完成。文末还提供了资料领取方式,帮助读者快速掌握这一能显著提升合同处理效率的AI解决方案。
2025-07-28 14:46:00
1006
原创 【技术干货】Qwen3优化实践:训练与推理性能提升详细教程
Qwen3模型系列带来多项技术突破,包括两大MoE架构(235B总参/22B激活参数和30B总参/3B激活参数),支持128K长上下文和119种语言。模型提供灵活的思考模式切换功能,基础模型性能显著提升,如Qwen3-1.7B性能对标前代Qwen2.5-3B。创新性地采用混合奖励机制,结合规则奖励、基于参考答案的模型奖励和无参考答案的偏好学习,有效提升模型响应质量。系列涵盖从0.6B到235B的丰富参数规模,满足从移动端到云端的全场景部署需求,特别适合对话系统、语音助手等AI应用开发。
2025-07-28 14:44:13
952
原创 Qwen2-VL性能提升秘籍:多模态微调实战教程(含完整代码)
本文介绍了基于Qwen2-VL-2B-Instruct模型在COCO2014图像描述数据集上的Lora微调训练方法。通过使用transformers、peft等框架,结合SwanLab工具进行训练监控和效果评估。文章详细说明了环境配置、数据集准备(包含500张图像预处理为特定JSON格式)、模型加载与微调过程,并展示了训练结果。项目提供了完整的代码仓库和在线训练可视化示例,帮助研究者实现多模态图像描述任务的模型优化。关键步骤包括数据格式转换、SwanLab集成、Lora参数配置等,为视觉语言模型的微调提供了
2025-07-26 14:15:00
941
原创 Qwen3开源大模型实战:从技术解析到本地部署的完整路径
阿里云发布Qwen3系列开源大语言模型,包含6个密集模型(0.6B-32B)和2个MoE模型(30B/235B),采用Apache 2.0许可。主要创新包括:1)混合推理模式,用户可手动切换"思考/非思考"模式提升任务适应性;2)推理能力显著提升,4B小模型性能媲美前代72B模型;3)支持128K长文本处理和多达119种语言;4)训练数据达36万亿token。提供在线API、Python调用及本地部署方案(如ollama),适用于各类AI应用场景。
2025-07-26 13:45:00
556
原创 FastMCP实战指南:3分钟部署AI服务器,开发效率飙升秘诀
摘要: FastMCP是一款专为构建MCP服务器设计的开源Python库,通过简化协议实现和服务器管理,提供高效易用的开发接口。其核心优势包括:1)利用装饰器快速定义工具与资源,显著减少代码量;2)完全遵循Pythonic风格,降低学习成本;3)完整实现MCP协议,支持从简单工具到企业级系统的开发。典型应用场景涵盖智能问答系统、业务自动化等领域,仅需少量代码即可完成服务器搭建,极大提升了AI与外部资源集成的开发效率。
2025-07-25 11:15:17
999
原创 【RAG检索增强生成】RAG+Vanna组合拳:智能SQL生成让数据库交互更高效
Vanna是一个基于RAG技术的开源Text2SQL工具,能够将自然语言查询自动转换为SQL语句并执行。它结合了检索增强生成技术,支持多种数据库和大语言模型,简化了非技术人员的数据查询流程。本文介绍了Vanna的工作原理、安装配置步骤,并通过示例展示了其执行SQL查询和生成可视化图表的能力。Vanna显著提升了数据库查询的效率和易用性,为数据分析提供了智能化的解决方案。
2025-07-24 10:34:56
857
原创 手把手实战RAG:LangChain智能检索生成系统构建详解
摘要:本文探讨了如何结合大型语言模型(LLM)的常识性知识与专有数据,重点介绍了检索增强生成(RAG)技术。RAG通过检索模型从外部知识源获取信息,再结合生成模型产生更准确的回答,避免了微调的高成本问题。文章详细阐述了RAG的工作流程(检索、增强、生成),并通过LangChain、OpenAI和Weaviate数据库的实例演示了RAG系统的实现步骤,包括数据加载、分块处理、向量嵌入及查询增强生成。该技术能有效提升LLM在专有领域信息处理中的准确性。
2025-07-23 13:55:24
668
原创 RAG基础理论详解:第一讲带你彻底理解检索增强生成原理
本文系统介绍了大语言模型(LLM)的基本概念、核心能力与结构原理,并深入分析了其局限性和面临的挑战。文章着重阐述了检索增强生成(RAG)技术如何通过结合外部知识库来弥补LLM的知识局限,包括减少幻觉问题、提升回答准确性等优势。通过形象的"学生与神奇书本"比喻,生动说明了LLM与RAG的协同关系:LLM作为基础提供语言理解和生成能力,RAG则提供动态知识支持,二者结合可显著提升模型在专业领域和实时信息处理中的表现。文章还简要概述了后续系列教程的内容框架,为读者提供了清晰的学习路径。
2025-07-23 11:41:22
650
原创 一文掌握DeepSeek-R1部署:本地化配置要求与环境搭建详解
DeepSeek-R1本地部署硬件指南 本文介绍了不同规模DeepSeek-R1模型的本地部署硬件需求及适用场景: 1.5B:低配设备可用(4核CPU/8GB内存),适合轻量级任务如聊天机器人。 7B/8B:需中端配置(8核CPU/16GB内存,推荐RTX 3070),适用于文本摘要、翻译等任务。 14B:要求较高(32GB内存/16GB显存),适合企业级复杂任务如合同分析。 32B/70B:需高端硬件(多卡并行/服务器级CPU),面向专业领域如医疗咨询或科研。 用户可根据具体需求选择合适版本,平衡性能与资
2025-07-22 14:50:20
1160
原创 【收藏必备】AI大模型学习全攻略:理论基础与实践应用双路径
本文介绍了大模型的基本概念及其应用前景。大模型是具备数千亿参数的大型预训练AI系统,能够通过海量数据学习语言理解、文本生成等能力,如GPT-3等典型代表。学习大模型具有重要意义:既是把握AI技术前沿的关键,又能提升就业竞争力、创新能力和问题解决能力。大模型已广泛应用于自然语言处理(如智能客服)、机器翻译、内容生成等领域,并正在医疗、教育等行业产生深远影响。掌握大模型技术不仅有助于个人职业发展,也是参与社会数字化转型的重要途径。
2025-07-22 14:27:18
720
原创 垂直领域大模型搭建训练完整指南:基于ChemLLM论文的实践解析
上海人工智能实验室提出ChemLLM,一个化学领域的垂直大语言模型。研究通过构建ChemData指令数据集,将结构化化学数据转化为自然对话形式,并设计两阶段训练方法(通用语料+专业数据)。ChemLLM在化学任务上超越GPT-3.5,部分任务超过GPT-4,还展现出对数学物理的跨领域适应能力。创新点包括基于模板的数据转换方法(单轮/多轮对话生成)和多任务训练框架,为垂直领域模型开发提供范例。
2025-07-21 12:05:54
913
原创 新手入门:大语言模型训练超详细指南,零基础到精通的完整教程
本文介绍了大语言模型(LLM)的基础知识和训练方法。首先阐述了Transformer架构在语言建模中的核心地位,并指出Python编程语言和HuggingFace Transformers库是LLM训练的主要工具。文章将LLM比作高级文本压缩技术,通过概率矩阵学习语言模式。训练方法主要包括三种:预训练需要大量数据和计算资源;微调是在预训练基础上调整模型以适应特定任务;而低秩自适应(LoRA)技术能显著降低计算需求。文章还强调了理解Transformer架构对高效使用LLM技术的重要性,并建议从基础神经网络知
2025-07-21 11:47:50
998
原创 DeepSeek高效使用秘籍:2025新版从入门到精通的实战教程
为什么要做 RAG 搭建一个简单的 ChatPDF 检索的基础概念 什么是向量表示(Embeddings) 向量数据库与向量检索 基于向量检索的 RAG 搭建 RAG 系统的扩展知识 混合检索与 RAG-Fusion 简介 向量模型本地部署 … 第三...
2025-07-18 11:42:51
799
原创 提示词工程入门指南:从基础概念到实践应用的完整解析
一、概念解读 1、Prompt Engineering(提示词工程)到底是个啥? 提示词工程通过设计优化输入提示词,引导大模型生成更精准的答案,类似于给大模型装上“人类语言翻译器”。 传统的模糊指令如“写首诗” → AI可能...
2025-07-18 11:09:25
726
原创 【开发者必看】国内7大AI Agent框架:技术选型与应用指南
AI Agent技术正深刻改变2024年的工作与生活方式。作为智能实体,AI Agent具备环境感知和自主决策能力,可简化流程、提升效率。其核心机制基于大型语言模型(LLM),通过感知、规划、行动三步骤实现动态决策优化。工程实现包含推理、记忆、工具和行动四大模块,支持多轮迭代以持续改进。该技术已广泛应用于智能客服、数据分析等领域,展现出强大的适应性和灵活性。
2025-07-17 14:56:00
973
原创 DeepSeek vs ChatGPT:主流大语言模型能力对比与分析
用户只需打开浏览器,访问 DeepSeek 官方网站(https://chat.deepseek.com/ ),即可开启智能之旅。首次使用的用户,可通过手机号、微信或者邮箱进行登录。登录成功后,点击 “开始对话”,就能与 DeepSeek 展开互动...
2025-07-16 16:24:11
925
原创 医疗数据安全新课题:大模型攻击下的医院AI防护指南
医疗大模型安全挑战与医院数字化应对策略 摘要:随着人工智能技术在医疗领域的深入应用,医疗大模型在提升诊疗效率的同时也面临严峻的安全威胁。本文系统分析了医疗大模型在数据层面(泄露、篡改、投毒)和模型层面(对抗攻击)的安全风险,并通过真实案例揭示了这些威胁可能导致的严重后果。研究提出,需要构建包含数据加密、访问控制、模型监测等多维度的综合防御体系,同时强调安全管理与技术防护的有机结合。针对医院数字化安全,建议采用区块链、零信任等新技术,并完善安全管理制度和人员培训机制。通过技术创新与管理优化相结合,为医疗数字化
2025-07-16 11:53:38
945
原创 AI+大模型在金融行业的应用场景全景图:从理论到实践的完整解析
摘要: AI技术正深度赋能金融行业,覆盖银行、证券、保险三大领域。银行业应用最广泛,包括风控、反欺诈、智能营销等;证券业聚焦智能投顾、自动化交易;保险业则优化理赔与个性化产品。AI并非简单叠加技术,而是重塑业务流程与模式。然而,AI也带来数据隐私、算法透明度等挑战,需平衡效率与合规。未来,率先掌握AI技术的机构和个人将更具竞争优势。
2025-07-15 10:54:16
273
原创 【行业指南】大模型在金融行业的应用实践与落地建议
当前,金融科技已经从“立柱架梁”迈入了“积厚成势”新阶段,越来越多的金融机构积极使用数字技术来为金融血脉注入全新能量。人工智能技术正加速与金融产业深度融合,以 ChatGPT 为代表的大模型技术不断进化,为金融业带来深刻变革,驱动金融服务更加高效、便捷、有温度。
2025-07-15 10:30:53
851
原创 大模型本地化微调+部署完整教程:基于Ollama的全流程实战指南
Ollama是一个开源的大型语言模型本地化部署工具,支持Meta发布的LLaMA等模型。其核心优势在于高性能(GPU加速)、易用性(简化安装配置)和灵活性(跨平台支持)。平台提供模型运行管理、REST API接口、多模态支持等功能,并允许用户自定义模型参数。作为开源项目,Ollama具有活跃的社区生态,支持多种交互方式,使开发者能便捷地在本地环境中部署和应用大语言模型。
2025-07-12 15:57:15
433
原创 【AI大模型】跌倒监控与健康:技术实践及如何改变未来
本文探讨了基于AI大模型的跌倒预警系统在健康监测中的应用。全球每年约68万人死于跌倒,老年人尤为高危。系统通过多传感器数据(加速度计、陀螺仪、心率等)融合与深度学习模型,实现行为模式识别和跌倒预测。应用场景涵盖老年社区、康复中心和高风险职业防护。技术架构包括数据采集、处理、模型训练和预警反馈四层。案例显示,该系统能有效降低跌倒风险(某老年社区跌倒减少30%)。未来需解决数据隐私、模型泛化等问题,发展方向包括多模态数据融合和个性化建模。跨学科合作和政策支持将推动该技术的广泛应用。
2025-07-12 15:14:06
676
原创 一文带你了解大模型的RAG(检索增强生成) | 概念理论介绍+ 代码实操(含源码)
针对大型语言模型效果不好的问题,之前人们主要关注大模型再训练、大模型微调、大模型的Prompt增强,但对于专有、快速更新的数据却并没有较好的解决方法,为此检索增强生成(RAG)的出现,弥合了LLM常识和专有数据之间的差距。今天给大家分享的这篇文章,将介绍RAG的概念理论,并带大家利用LangChain进行编排,OpenAI语言模型、Weaviate 矢量数据库(也可以自己搭建Milvus向量数据库)来实现简单的 RAG 管道。
2025-07-11 14:22:40
925
原创 从理论到落地:国产AI大模型在医疗行业的10大应用实践
AI大模型在医疗领域的未来发展将是多方面的,不仅仅局限于技术的进步,更涉及到伦理、监管等...通过不断的创新和努力,AI大模型有望为医疗行业带来革命性的变化,提高医疗服务的质量和效率,为全球患者带来更大的福祉。
2025-07-08 11:09:02
782
原创 大模型应用:AI大模型如何赋能Agent开发与部署全流程
随着人工智能技术的迅猛发展,AI Agent(智能代理)作为连接人与机器的重要纽带,正逐步渗透到各行各业。以DeepSeek和通义千问为代表的国内AI大模型,凭借其强大的计算能力、多样化的功能以及灵活的适配性,为国内客服领域AI Agent的开发与部署提供了核心驱动力。本文将详细探讨这些大模型如何通过自然语言处理、多模态能力、模型微调以及RAG(检索增强生成)知识库检索等技术,赋能AI Agent的开发流程、提升其智能化水平,并在部署阶段发挥关键作用。
2025-07-04 12:04:23
666
原创 企业级AI Agent应用实战:30个成功案例解析与经验总结【收藏版】
【万字长文,建议收藏】AI Agent企业应用场景全解:30个智能体落地案例剖析
2025-07-02 12:00:01
723
原创 RAG技术全景解读:从基础原理到工程实践的完整学习指南
RAG(检索增强生成)技术解析与学习指南 RAG是一种结合检索技术与生成式大模型的技术框架,通过外接知识库解决大模型的幻觉问题和知识滞后性。其优势包括无需微调、数据安全、灵活性强和可解释性增强,但也面临上下文限制、检索噪声等挑战。RAG工作流程分为索引和查询两阶段,涉及文档分块、向量化和语义检索等步骤。学习RAG可从基础概念入手,逐步进阶到性能优化和多模态应用。推荐资源包括LangChain、Hugging Face等开源工具和Coursera相关课程。RAG在医疗、金融等领域具有广阔应用前景,是AI大模型
2025-07-01 10:59:21
698
原创 Prompt工程进阶指南:AI爱好者必知的提示词写作技巧
Google发布了一份69页的白皮书《Prompt Engineering》,系统介绍了提示词工程的最佳实践。文章提炼了核心内容,指出Prompt是与AI对话的关键,通过角色设定、任务描述和背景信息三要素,可以引导AI生成更精准的结果。提示工程适用于文案撰写、内容总结、代码辅助等多种场景,强调通过不断练习优化Prompt质量。掌握这一技能无需专业背景,任何人都能通过有效引导提升AI输出效果。
2025-06-30 17:45:08
628
原创 【收藏版】Transformer深入解析:理论基础与实践应用双视角
【Transformer系列】深入浅出理解Transformer网络模型(综合篇)
2025-06-30 17:08:41
819
原创 【收藏必备】大语言模型微调宝典:11种方法详解与选择建议
本文介绍了11种高效的大型语言模型参数调优方法,旨在降低训练和推理阶段的资源消耗。这些方法主要分为两类:一是固定基础模型参数,引入部分特定参数(如前缀调优、提示调优);二是通过增加旁路结构优化模型(如LoRA及其变种)。具体方法包括前缀调优、提示调优、P-Tuning v2、LoRA、DyLoRA、AdaLoRA、QLoRA、QA-LoRA、LongLoRA、VeRA和S-LoRA。这些技术通过减少参数量和计算开销,在不显著损失性能的前提下提升了模型效率,为大规模预训练模型的应用提供了经济可行的微调方案。
2025-06-28 15:30:53
881
原创 从零开始用Easy Dataset:大模型训练数据高效构建实战教程
Easy Dataset:快速构建大模型训练数据的智能工具 Easy Dataset是一款专为AI开发者设计的数据集创建工具,能够将各类文档(PDF/Markdown/DOCX/TXT)高效转化为结构化问答数据集。该工具通过智能文档处理、文本分割、问题生成和答案构建四个核心步骤,简化了大模型训练数据的准备工作。支持多种导出格式(JSON/JSONL/Excel)和数据集风格(Alpaca/ShareGPT),兼容所有OpenAI格式的LLM API。使用Docker即可快速部署,提供可视化界面管理整个数据处
2025-06-28 14:19:26
1110
原创 短短时间,疯狂斩获1.9k star,开源AI神器AingDesk:一键部署上百模型,本地运行还能联网搜索!
摘要: AingDesk是一款本地化AI部署工具,无需云端账号和网络延迟,可离线运行模型并实时联网搜索。它解决了传统AI部署的环境配置复杂、模型管理混乱和隐私泄露三大痛点,适合技术小白、团队管理者和隐私敏感者。核心功能包括零门槛模型部署、实时联网搜证、私人知识库搭建、跨平台共享和智能体工厂。AingDesk支持100+模型、三大搜索引擎和本地语义检索,自动适配硬件配置,提供企业级隐私保护。与同类工具相比,AingDesk在部署难度、联网搜索和知识库管理上更具优势。安装简单,支持普通方式和Docker部署。
2025-06-27 14:34:08
950
原创 拒绝服务繁忙!DeepSeek本地部署完整教程:电脑手机都能用
更重要的是,今天是 Deepseek 把 AI 的训练成本打下来,或许明天就有新的 AI 模型把硬件需求打下来,能多一种玩法也更容易尝鲜了。
2025-06-27 14:31:20
949
原创 手把手教学!DeepSeek联动Stable Diffusion一键出图(附提示词库)
“AI绘画翻车现场:五条腿的猫、三只眼的超人、悬浮的咖啡杯……别慌!今天教你用DeepSeek+Stable Diffusion,解锁‘咒语’的正确打开方式,让AI从‘灵魂画手’秒变‘毕加索’!”
2025-06-09 17:13:42
500
原创 2亿播放、涨粉百万、盈利50万,“泼天的富贵”轮到AI宠物短剧了?
**一条AI比熊奶狗细心照顾人类宝宝的短剧,在抖音获赞44.5万、分享72.7万,**直接在抖音刷屏。如今,各种AI生成的萌宠正忙得**“比996的年轻人还忙”**:上一秒还在环球旅行发自拍,下一秒就穿上围裙下厨房照顾孩子。
2025-06-09 11:12:27
280
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人