自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(53)
  • 收藏
  • 关注

原创 开篇、给大模型装上“外部大脑”-解锁RAG魔法

RAG(Retrieval-Augmented Generation)是一种将大语言模型与外部知识库相结合的技术,通过检索相关文档片段来增强生成模型的准确性和实用性。该技术解决了大型语言模型缺乏最新知识和精确事实的痛点,在实际应用中展现出强大潜力[0†]。

2025-10-28 14:29:32 324

原创 从 0.x 到 1.0:LangChain 生产级 Agent 实战指南

LangChain 1.0 于 2025 年 10 月 23 日正式发布,标志着 AI Agent 开发进入生产就绪阶段。本系统梳理从 0.x 到 1.0 的演进脉络、核心架构理念及实战应用。内容概括:从 Chain 设计转向 Agent 优先,引入中间件机制、统一抽象层静态/动态模型选择、工具调用优化、结构化输出策略中间件钩子、状态管理、流式输出、错误处理本指南适合 AI 工程师、架构师及技术决策者阅读,提供从设计到落地的完整路径。文中所有代码示例均基于 Python 3.10+ 环境。

2025-12-02 11:35:01 1051

原创 开源多智能体框架全景技术调研报告

本报告系统梳理了2025年主流开源多智能体框架的技术生态,涵盖等17个核心框架。通过对架构设计、技术特点、应用场景、性能表现四大维度的深度对比,揭示当前多智能体领域呈现**"编排派""协作派""极简派""RAG融合派""持续自主派"**五大技术路线。生产级首选:LangGraph凭借状态图编排与可观测性优势,成为复杂业务场景的基石,可与Pydantic AI组合实现强类型验证[0†]企业级生态:Semantic Kernel在微软技术栈中占据主导地位,而AgentScope在国产化企业级市场快速崛起。

2025-11-24 11:35:40 849

原创 Google Antigravity:技术解析、研发历程与未来展望

谷歌推出Antigravity开发平台,实现AI编程从"辅助"到"代理主导"的范式转变。该平台基于多智能体协作架构,支持Gemini3Pro等主流模型,提供自然语言编程、跨表面操作、Artifacts验证机制等创新功能。通过多代理并行工作流和持续学习能力,Antigravity显著提升开发效率,使开发者能专注于创意设计而非底层编码。目前该平台处于免费预览阶段,支持三大操作系统。尽管在复杂任务处理和创意性工作方面仍存局限,Antigravity代表了AI编程工具的未来发

2025-11-20 09:17:31 1994

原创 LlamaIndex 教程文档

LlamaIndex是一个数据框架,用于将自定义数据源连接到大型语言模型(LLMs),从而构建检索增强生成(RAG)和其他AI应用。它提供了一套工具来摄取、处理和索引各种数据源,使其能够与LLMs有效结合使用。# 创建摘要索引# 生成摘要summary = index.query("用200字总结文档内容")

2025-11-10 13:25:06 64

原创 一文读懂向量数据库:从核心概念到数据格式逻辑

相比传统关系数据库的固定字段,Point 的组件化设计更能承载非结构化数据的特征(向量)与描述信息(载荷);相比 JSON 的文本存储,内部二进制与结构化索引格式更能满足高维向量的快速计算与检索需求。掌握这些核心逻辑后,无论是学习向量数据库的存储原理、检索算法,还是实际应用(如搭建相似图片推荐系统、智能文本检索系统),都能建立清晰的认知框架,快速上手实践。

2025-10-31 17:55:22 833

原创 第三章、第四节 pgvector向量数据库教程

PGVector是一个开源的PostgreSQL扩展,专为在PostgreSQL中高效处理向量数据而设计。它允许用户直接在PostgreSQL数据库中存储和查询向量数据,特别适合处理高维嵌入向量。PGVector特别适用于构建推荐系统、语义搜索、图像检索等需要向量相似性搜索的应用场景。:可能需要管理员权限来执行安装命令。某些系统上可能需要先安装PostgreSQL开发包(如。PGVector支持PostgreSQL 13及更高版本。:使用官方Docker镜像。

2025-10-31 11:24:03 55

原创 第三章、第二节 Milvus向量数据库教程

Milvus是由Zilliz公司开发的开源向量数据库,专为处理和搜索大量向量数据而设计。它是一个高性能、可扩展的向量数据库,适用于需要高效向量搜索的各种场景,尤其是生成式AI和大语言模型应用中的RAG(检索增强生成)系统。

2025-10-31 11:11:29 71

原创 第三章、第一节Chroma向量数据库教程

Chroma是一个开源的AI原生向量数据库,专为AI应用设计,使知识、事实和技能能够可插拔地集成到大语言模型(LLM)中。它让构建LLM应用变得更加容易,特别适用于RAG(检索增强生成)场景。n8n是一个强大的工作流自动化工具,它允许您通过可视化的方式连接不同的应用程序和服务。通过与Chroma的集成,可以构建智能化的文档处理、知识库管理和RAG应用工作流。Chroma是一个功能强大且易于使用的向量数据库,特别适合AI应用开发。

2025-10-31 11:10:34 58

原创 第三章、向量数据库教程

向量数据库(Vector Database)是一种专门用于存储、管理和查询高维向量嵌入的数据库系统。它将数据(如文本、图像、音频等)编码为数值向量,并通过向量间的相似性计算来实现高效的相似性搜索。PostgreSQL + pgvector代表了一种将向量数据库功能与传统关系数据库相结合的创新方法。通过在PostgreSQL中集成pgvector扩展,开发者可以在享受传统SQL数据库可靠性的同时,获得向量相似性搜索的能力。核心特点:事务一致性:确保向量写入和传统数据操作的原子性SQL集成。

2025-10-31 11:09:27 53

原创 第二章 Docker+Ollama封神!2步装Qwen+Deepseek小型模型

拉取模型提示 “connection refused”?,没看到 ollama 容器就重新执行启动命令模型下载慢 / 中断?👉 可以换国内镜像源,或者重新输拉取命令,Ollama 会断点续传终端关了模型就停了?👉 因为用了-d后台运行容器,只要容器没删,重新输sudo docker exec -it ollama ollama run 模型名就能重新启动对话。

2025-10-29 15:09:54 269

原创 第一章 Docker安装+入门教程,新手也能秒会

输 docker 命令提示 “权限不够”?,注销电脑再登录,之后用 docker 就不用每次输 sudo 了安装时提示 “无法定位软件包 docker-ce”?👉 先检查第 3 步的密钥有没有加对,再重新执行第 1 步更新软件源,然后重试安装启动 Docker 提示 “Job for docker.service failed”?👉 先输。

2025-10-29 09:15:41 189

原创 小白也能懂:Python 和 C++ 的“类”为啥不一样?

在 Python 里,情况完全不同。当你写下class定义时,解释器会立刻把这个类变成一个“活的对象”(叫“类对象”),直接占用内存。# 1. 实例方法:依赖实例,第一个参数是 self(代表实例)print(f"我是实例 {self} 的方法")# 2. 类方法:依赖类本身,第一个参数是 cls(代表类),用 @classmethod 标记print(f"我是类 {cls} 的方法")# 3. 静态方法:不依赖实例也不依赖类,用 @staticmethod 标记。

2025-10-24 13:18:26 954

原创 Llama Factory、Unsloth与Hugging Face三大微调平台深度对比分析

微调技术从传统全参数微调发展到参数高效微调(PEFT),再到量化优化,体现了AI领域在资源效率和性能平衡方面的持续创新。Llama Factory主打"低代码"可视化操作,Unsloth专注"极致性能"加速,Hugging Face强调"生态完备性"和学术前沿支持。Unsloth通过Triton计算重写和动态量化,实现速度提升2-5倍、内存减少50-80%的显著优化[10†]。从BitFit的极简参数调整到LoRA的低秩适配,再到QLoRA的量化优化,不同方法在效率与效果之间呈现明显权衡特性。

2025-10-23 15:13:31 1753

原创 向量数据库:全面解锁AI时代的“语义记忆引擎“

向量数据库是一种专门设计用于存储、管理和搜索高维向量嵌入的数据库系统。它将非结构化数据(如文本、图像、音频等)转换为数值向量形式,以便进行高效的存储和相似性搜索。处理非结构化数据:通过向量嵌入将文本、图像等非结构化数据转换为数值向量高维向量处理:擅长在高维向量空间中存储和管理数据相似性搜索:核心功能是找到与查询向量最相似的向量动态更新:支持创建、读取、更新和删除(CRUD)操作数据模型:传统数据库使用表格结构存储结构化数据,而向量数据库使用向量空间模型存储非结构化数据。

2025-10-21 17:20:22 660

原创 大模型接口:连接智能的桥梁与未来的演进

在人工智能飞速发展的今天,大语言模型(LLMs)已成为诸多应用的核心驱动力。这些模型强大的理解、生成和推理能力,离不开一套高效、灵活的调用接口。本文将深入探讨当前主流大模型提供商的接口类型、核心功能,并展望其未来的发展方向和“统一”的可能性。

2025-10-20 09:57:47 916

原创 Pydantic 完整教程

Pydantic是一个基于 Python 类型注解的数据验证与序列化库,主要用于数据验证和设置管理,使用Python类型提示。Pydantic的主要优势在于其简单易用的API和强大的数据验证能力,它可以在运行时验证数据是否符合类型提示,并提供清晰的错误信息。Pydantic 核心用途可概括为:运行时类型检查把“普通的”Python 类型提示(int、str、List[User]…)变成严格的运行时校验规则,一旦数据不符立即抛出有意义的 ValidationError。数据解析与转换。

2025-10-17 09:45:09 865

原创 FastChat框架完整教程:从入门到精通

FastChat是一个开源平台,专为训练、服务与评估对话式大模型而设计。该平台由加州大学伯克利分校和CMU共建的LMSYS实验室开发,是前文提到的基于vLLM推理引擎后端的Chatbot Arena打擂平台的开源版本。FastChat在GitHub上的官方仓库为,项目旨在提供一个全面的解决方案,用于大型语言模型聊天机器人的开发与应用。Controller(控制器)负责协调整个系统管理模型工作器的注册和任务分发监控系统状态和负载均衡Model Worker(模型工作器)实际运行大语言模型的组件。

2025-10-15 11:39:46 620

原创 从Hugging Face模型到OpenAI化包装全指南

Hugging Face Transformers是一个流行的开源库,提供了丰富的预训练模型集合,适用于各种NLP任务([19†], [20†])。将OpenAI风格的请求转换为Hugging Face Transformers可理解的格式调用相应的Hugging Face模型将模型输出转换为OpenAI API兼容的响应格式接受OpenAI风格的API请求将请求参数转换为Hugging Face Transformers兼容的格式调用指定的Hugging Face因果语言模型。

2025-10-15 10:34:07 1008

原创 模型量化处理:从基础概念到大模型应用的全面解析

模型量化是指将机器学习模型中的高精度数值(如32位浮点数,FP32)转换为低精度数值(如8位整数,INT8或更低)的过程。这一技术的主要目的是减少模型的存储空间和计算资源需求,同时尽量保持模型的原始性能([2†])。量化本质上是一种有损压缩技术,通过减少模型参数和激活值的表示位数来实现模型大小的显著减少。例如,将模型参数从32位浮点数(FP32)转换为8位整数(INT8),可以将模型大小减少至原来的四分之一([4†])。参数规模巨大:动辄数十亿至上千亿参数,对量化算法的效率提出更高要求内存约束严格。

2025-10-15 09:48:03 949

原创 Streamlit 中文全面教程:从入门到精通

Streamlit 是一个开源的 Python 库,专为数据科学家和机器学习工程师设计,旨在快速构建数据应用。通过它,你可以用少量的 Python 代码创建交互式的数据可视化应用,无需任何前端开发经验。零前端门槛:无需学习 HTML、CSS 或 JavaScript([1†])快速开发:几分钟内就能将 Python 脚本转换为可分享的网页应用([17†])动态交互:自动支持代码修改后的实时刷新美观界面:内置现代化 UI 设计,自动处理样式和布局结构组织使用st.titlest.header和。

2025-10-14 15:04:02 2384

原创 Gradio 全面教程:从入门到精通

Gradio 是一个开源的 Python 库,用于为机器学习模型和函数创建交互式网页界面。它成立于 2020 年,由 Ali Faisal、Hamza Khan 和 Muhammad Furqan 持续开发,最新稳定版本为 5.49.1 ([15†])。# 示例:查看当前安装的 Gradio 版本print(f"当前 Gradio 版本: {gr.__version__}")with gr.Blocks(title="自定义布局示例") as demo:gr.Markdown("# 自定义布局示例")

2025-10-14 14:36:19 914

原创 Node.js 完全安装与使用指南:Windows 平台详细教程

Node.js 是一个开源的基于事件驱动的 JavaScript 运行时,适用于构建可扩展的网络应用程序。它使开发者能够在服务器端和跨平台环境中使用 JavaScript 语言。本文详细介绍了在 Windows 系统上安装和使用 Node.js 的多种方式,重点介绍了 nvm-windows 这一版本管理工具的使用方法。选择适合的 Node.js 安装方式使用 nvm-windows 管理多个 Node.js 版本掌握 Node.js 核心命令和基本使用方法解决常见的安装和配置问题。

2025-09-30 13:20:35 1159

原创 Qwen Code CLI 安装与使用完全指南

Qwen Code CLI是一款功能强大的命令行AI编程工具,通过简单的安装配置,可以为开发者提供智能代码生成、项目分析和多种开发辅助功能。通过本文的指导,您应该能够顺利完成Qwen Code CLI的安装、配置和使用,将其融入日常开发工作,提升编程效率和代码质量。此命令会将Qwen Code CLI全局安装到您的系统中,便于在任何目录下使用 ([9†], [14†])。命令时,Qwen Code会引导您通过浏览器完成授权配置 ([2†], [3†])。

2025-09-30 11:59:44 2186

原创 机器人企业技术路径分化趋势:运动型与干活派的技术博弈

根据行业观察,"干活派"内部又分化为两种技术路线:一种是"视觉算法+轨迹生成"方案,另一种是"端到端VLA"(视觉-运动-动作一体化生成)方案。银河通用采用"端到端VLA"(视觉-语言-动作一体化生成)的技术路径,这一方案强调机器人的感知、决策和执行能力的深度融合。无论哪种技术路径,最终成功的关键将在于能否真正实现机器人在实际场景中的价值创造,让机器人从"动起来"到"用得起来",再到"赚到钱"。银河通用的技术路径理念是"让机器人甩掉遥控器",直接迈向自主作业阶段,专注于解决实际生产场景中的问题。

2025-09-29 11:22:50 739

原创 具身智能学习路线图:从基础到前沿的系统化指南

具身智能(Embodied Artificial Intelligence, EAI)是指智能体通过身体与环境的互动产生的智能行为,强调智能体的认知和行动在物理环境中的相互依赖。具身智能的实质是强调有物理身体的智能体通过与物理环境进行交互而获得智能的人工智能研究范式。具身智能体是指具备完整的"感知—理解—决策—执行"闭环能力,能够在真实或虚拟环境中完成复杂任务的实体,如机器人、自动驾驶系统等。

2025-09-29 10:24:39 1076

原创 Spec-Driven Development与Spec Kit框架全面解析

规格驱动开发(Spec-Driven Development,简称SDD)是一种以"规范文档"为核心的工程方法论。与传统的"代码优先"开发模式不同,SDD要求开发流程的每一步都必须以明确的规格(specifications)为依据([7†])。SDD的理念是"规格先行",即将规范文档作为整个开发流程的权威来源,确保需求、设计、编码、测试和交付等各阶段都基于同一套明确的规范([24†])。

2025-09-27 10:00:08 1889

原创 第12讲:未来展望——Kiro生态与AI开发新范式

如果你只会“Ctrl+C / Ctrl+V”,AI会取代你如果你不懂架构、不懂安全、不懂产品,AI生成的代码你也看不懂如果你过度依赖AI,你的“编程肌肉”会退化AI不会取代你,但会用AI的人会取代不用AI的人。而真正能赢的,是那些驾驭AI,而不是被AI驾驭的人。亲爱的学员:12讲的旅程到这里就结束了。我们从“什么是Kiro”开始,到“如何用Kiro重构企业系统”,再到“如何展望AI开发的未来”。我希望你带走的,不只是一个工具的使用方法,而是一种全新的开发思维。

2025-09-08 01:15:00 746

原创 第11讲:常见问题与避坑指南

恭喜你!经过前面10讲的学习,你已经掌握了Kiro的全部核心功能。但现实是:会用工具,不等于能用好工具。很多团队在兴奋地试用Kiro后,很快就遇到了这些问题:别担心,这些问题我们都遇到过。今天这讲,就是来帮你扫清所有地雷,让你用Kiro时既高效又安心。问题描述:你让Kiro调用一个AWS SDK方法,它编了一个根本不存在的函数名,还写得头头是道。这就是AI的“幻觉”(Hallucination)——凭空编造信息。看来源:在AI回复中,问它:“这个API来自哪个文档?”如果它说“根据AWS SDK v3”,你

2025-09-07 11:11:45 789

原创 第10讲:性能优化与成本控制

在谈成本之前,我们必须搞懂Kiro的“货币”——交互次数(Interactions)。

2025-09-06 08:00:00 480

原创 第9讲 Kiro + AWS云服务——一键部署到云端

关键词:Docker化、CI/CD、Lambda、API Gateway、一键部署、云集成:30-35分钟:掌握如何用Kiro自动生成云部署配置,实现从本地开发到AWS上线的无缝衔接。

2025-09-05 05:30:00 882

原创 第8讲 企业级项目实战——用Kiro重构用户认证系统

关键词:用户认证、RBAC、JWT、邮箱验证、密码重置、全流程实战:40-45分钟(可拆分为两部分):掌握如何用Kiro完成一个复杂、可上线、可维护的企业级功能模块。

2025-09-04 05:30:00 900

原创 第7讲:团队协作实战——多人如何共用Kiro?

AI生成变更摘要- **功能**:实现用户登录- **技术方案**:JWT认证,前端React,后端Express- **关键决策**:- 使用JWT而非Session(理由:无状态,适合微服务)- 密码加密用bcrypt(强度12)- **影响范围**:- 新增文件:`src/services/authService.ts`- 修改文件:`src/pages/Login.tsx`✅ 效果:即使不用Kiro,也能快速理解AI做了什么。

2025-09-03 05:00:00 644

原创 第6讲:MCP集成——连接外部工具(GitHub、Jira、AWS文档)

MCP = AI的“外接大脑”你可以把它理解为 AI 的“外接硬盘”或“知识U盘”。没有MCP:AI只能靠“内置知识”工作,就像一个人只靠记忆写代码。有MCP:AI可以实时访问外部系统,就像打开了搜索引擎 + 公司内网 + 文档库。✅ MCP不是简单的API调用,而是一个安全、结构化、可审计的协议,由Anthropic和AWS共同开发,专为AI智能体设计。

2025-09-02 05:00:00 1112

原创 第5讲:智能体引导(Agent Steering)——教会AI“懂你的项目”

Agent Steering = 给AI一本“团队开发手册”就像新员工入职要读《开发规范文档》一样,Steering就是给AI看的“入职培训材料”。你把团队的技术栈、命名规则、架构风格写成几个Markdown文件,放在目录下。从此,AI生成的代码,自动符合你们的规范。✅ 不用手动纠正✅ 不用反复解释✅ 代码风格统一。

2025-09-01 05:00:00 822

原创 第4讲:智能体Hooks——打造自动化开发流水线

Agent Hooks = Git Hooks + AI大脑你可能听说过Git Hooks,比如pre-commit(提交前触发)、post-merge(合并后触发)。Kiro的也一样,但它不是执行一个简单的脚本,而是唤醒一个懂你项目的AI智能体,让它来“看一眼代码”,然后自动做点事。

2025-08-31 04:30:00 2117

原创 第3讲:Spec驱动开发——如何让AI先设计再编码

关键词:需求文档、技术设计、任务拆解、决策说明、可追溯性:30-35分钟:掌握Spec三件套的编写技巧,学会引导AI生成专业级设计文档。

2025-08-30 16:50:55 1112

原创 Python编程教程之三:实例

在这一部分,我们将通过几个实际的项目案例来展示Python在不同领域的应用。这些案例将帮助你理解如何将前面学到的知识应用到实际项目中。在这个项目中,我们将使用Flask框架创建一个简单的个人博客系统,包括文章发布、用户认证和评论功能。在这个项目中,我们将使用Python来分析学生成绩数据,包括数据清洗、数据分析和数据可视化。

2025-08-30 15:27:00 219

原创 Python编程教程之二:提高

Python拥有丰富的第三方库,这些库可以帮助我们快速实现各种功能。下面介绍一些常用的Python库。

2025-08-30 15:24:17 960

原创 Python编程教程之一:入门

Python是一种高级编程语言,由Guido van Rossum于1989年底发明,第一个公开发行版发行于1991年。Python的设计哲学强调代码的可读性和简洁的语法(尤其是使用空格缩进划分代码块,而非使用大括号或者关键词)。相比于C++或Java,Python让开发者能够用更少的代码表达想法。在Python中,使用def关键字定义函数,函数定义的基本语法如下:"""函数文档字符串"""# 函数体下面是一个简单的函数示例:# 定义一个简单的函数"""这个函数用于打印问候语"""")

2025-08-30 13:22:28 1349

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除