- 博客(256)
- 资源 (6)
- 问答 (1)
- 收藏
- 关注
原创 FastAPI 的运行方式解析:def、async def、线程池、异步与等待的区别与联系
运行方式写法是否阻塞事件循环推荐场景性能表现异步(async)async def否异步网络 I/O、数据库、API 请求⭐⭐⭐⭐⭐ 高并发优选同步非阻塞(def)def否(由线程池运行)快速计算、小逻辑处理⭐⭐⭐⭐ 稳定安全同步阻塞(def)def否(由线程池运行)使用阻塞库(如 requests)⭐⭐⭐ 稍慢,但兼容性好FastAPI 让 Python 的异步能力进入大众开发者视野,并通过简洁的 API 接口和底层的 Starlette 框架,优雅支持async def和def。
2025-06-16 11:17:50
346
原创 赋能大型语言模型与外部世界交互——函数调用的崛起
函数调用,或称工具使用,其核心定义是一种使大型语言模型能够根据用户的自然语言输入,请求执行外部系统中预先定义好的函数或API的技术。在此过程中,LLM本身并不直接执行这些函数;相反,它会分析用户意图,并生成一个包含目标函数名称及其所需参数的结构化数据(通常为JSON格式)1。这个结构化数据随后被传递给外部的应用程序或执行环境,由后者负责实际调用函数并处理结果。
2025-06-06 17:23:39
1160
原创 一文读懂RAG流程中用到的请求参数与返回字段
阶段参数或字段说明检索请求querynameprojectlimit基础检索条件检索前处理rewritemessages提升语义匹配检索后处理精细排序、上下文扩展响应结果检索内容与消耗大模型调用messagesmodelmax_tokens构建回答生成任务回答内容usage输出结果与解释。
2025-06-04 17:00:59
493
原创 知识库检索接口参数设置
场景推荐配置纯语义检索精准关键字匹配, 关闭 rerank多轮对话+智能改写, 配置messages需要上下文增强图文混合文档展示。
2025-06-04 16:02:51
473
原创 构建检索增强生成(RAG)应用:第二部分
我们仍使用第1部分中提到的外部知识源:Lilian Weng 撰写的博客文章《LLM驱动的自主智能体(LLM Powered Autonomous Agents)》。在许多问答应用中,我们希望允许用户进行来回对话,这意味着应用需要某种“记忆”以记录过去的问题和答案,并具备将其纳入当前思考的逻辑。在 Part 1 中,我们将用户输入、检索上下文和生成的回答分别作为状态的不同字段。本教程中的方法利用了现代聊天模型中的工具调用(Tool Calling)能力。使用 Agent 模式的多步迭代检索 RAG。
2025-06-03 11:06:19
969
原创 LangChain + LangGraph 教程第一部分:打造基于 RAG 的问答应用
Build a Retrieval Augmented Generation (RAG) App: Part 1 | 🦜️🔗 LangChain 在大型语言模型应用中,构建有数据根据的问答类应用是最有力的场景之一。这类应用使用的技术叫做 Retrieval Augmented Generation(RAG)。Part 1 (本文):介绍 RAG 原理,应用 LangChain 和 LangGraph 实现最简应用Part 2 (将推出):展延到支持对话风格与多步骤的处理流加载文档:Docu
2025-06-03 11:01:05
342
原创 如何无损修复Windows
Windows 11 提供“使用 Windows 更新修复问题”功能,允许用户在保留应用、文件和设置的前提下重新安装当前版本的操作系统,有效解决系统文件损坏、组件异常等常见问题。Windows 11 安装助手适用于当前运行 Windows 10/11 的设备,支持在保留用户数据的前提下重新安装系统,是一种“就地升级”的修复方式。适用于进行全新安装或高级修复场景,用户可通过创建启动 U 盘或 ISO 文件,手动引导电脑进入安装程序修复系统。
2025-05-31 09:34:45
1443
原创 GPT-4.1 开启智能时代新纪元
GPT-4.1 是通用人工智能从“可用”走向“好用”的里程碑。它以更高性能、更低成本,覆盖更广的能力边界,不仅是开发者的得力工具,更是推动教育公平、产业升级与公共服务革新的新引擎。未来,随着 GPT-4.1 在更多行业的嵌入式应用落地,我们有理由相信,真正的“AI for everyone” 时代,已经到来。
2025-04-21 15:39:12
805
原创 ControlNet v1.1 用途与典型例子
AI 插画师工具链:草图 → 自动绘图 → AI 修图。多为社区调制扩展,如角色融合风格生成、模仿参考图动作等。“让这个人穿红裙子”+图片输入 → 生成穿红裙子版本。:检测场景中的几何直线(通常用于室内/建筑)动作一致的 VTuber 插画 / 模型图。与 pose 联用生成立体感更强的角色插画。指定哪个区域生成什么:人、衣服、车、树……“蓝色区域为人物,绿色为树,红色为太阳”:Prompt 引导图像变换(非强控制):每个像素点的三维方向(用彩色图编码)儿童画 → 完整插图(AI 插画)
2025-04-09 14:06:59
803
原创 ControlNet v1.1 - OpenPose模型说明
是 ControlNet v1.1 系列中基于OpenPose 人体姿态估计图像训练的控制模型。可与 Stable Diffusion v1.5 搭配使用,通过“骨架提示图(keypoint map)”进行强力的人体姿态控制。适用于人体换装、动态一致性图生图、动作还原、动漫角色动态生成等场景。
2025-04-09 14:01:15
558
原创 sam_vit_h_4b8939模型说明
是 Meta AI 发布的的最强版本,采用ViT-H(Vision Transformer Huge)作为图像编码器,具备极高的零样本分割能力。该模型支持基于提示的交互式分割:你可以提供“点、框、掩码”作为提示,它会高质量地生成目标区域的掩码。它也可在无需提示的自动模式下生成整张图的所有对象掩码。
2025-04-09 13:49:26
1113
原创 840000VAE 模型使用说明
使用 CyberRealistic、Anything、ChilloutMix、Realistic Vision 等注重真实感的模型时,提高。该模型是原始 Stable Diffusion 所用 VAE 的升级版本,旨在。此模型不会生成图像,只作用于潜空间 ↔ 图像空间的编码/解码(影响画面质量、色彩、细节还原)。更适合人像与细节还原(比原始VAE在 PSNR / SSIM / PSIM 上表现更佳)。可配合提示词、LoRA 调优,观察对图像细节、色彩、面部还原的影响。,与原模型完全兼容。
2025-04-09 13:34:41
1010
原创 CyberRealistic V8 模型使用说明
✅ 特色改进:V8 大幅减少异常肢体(多手、多指等),更贴近真实人类结构。与 CyberRealistic LCM 版本不同,本模型为。LoRA、Textual Inversion 插件兼容性强。可结合 LoRA 提升人物表现力(如姿势、服饰、风格等)。本模型为多个写实模型融合结果,融合方式未完全公开,但强调。支持 Civitai 网页端生成与 LoRA 叠加实验。,非常适合新手或需要快速出图的场景。,追求图像质量优先而非推理速度。:高写实、高细节人像模型。清晰的五官与自然光影。
2025-04-09 13:28:16
452
原创 一文了解 MCP Server:AI 工具与外部世界的桥梁
MCP 是统一大模型与外部工具交互的通用协议MCP Server 是你构建智能体最重要的“外挂工具”集合借助 MCP Inspector、现成 MCP Server 仓库、主流 SDK(Python、Node)可以快速接入与开发DeepSeek、Cursor、Claude 等主流平台全面支持 MCP,让 Agent 构建进入标准化时代MCP 不是新技术,而是一种“标准 + 工具”的革命。它正在推动 AI 工具从“孤岛”走向生态协作,人人都能成为“Agent 工程师”。
2025-03-27 17:36:21
3199
原创 Cloudflared安装与基本使用
Cloudflared 免费版不支持直接设置密码访问。用 Nginx 反代 + HTTP Basic Auth(进阶)⚠️ 注意:如果你在 JupyterLab 的终端运行,复制刚刚的地址粘贴到浏览器,就能看到你的项目页面了 ✅。用 Cloudflare Tunnel 配合。如果页面能正常显示你的项目页面,即表示成功。
2025-03-27 16:29:22
603
原创 Cloudflared vs FRP
临时访问用 Cloudflared,长期服务用 FRP!你也可以一开始用 Cloudflared,等项目稳定再切换到 FRP。
2025-03-27 15:46:17
318
原创 Gradio实现内网穿透的重要组件
Gradio 的share=True功能需要,这是用来建立公网隧道的工具(Gradio 内置的 FRP 客户端)。
2025-03-27 15:14:59
358
原创 Hybrid + Reranking 检索管线简介
在大模型问答(如 RAG、ChatGPT 插件)和搜索增强生成(Retrieval-Augmented Generation, RAG)场景中,是一种非常主流且有效的检索策略。它结合了稀疏检索和稠密检索的优势,并通过重排序模型(reranker)进一步优化结果质量。
2025-03-21 12:00:32
321
原创 Browser Use 项目介绍
支持 AI 代理在网页上进行复杂交互,例如自动填表、数据分析、在线购物、社交媒体操作等。,旨在让 AI 代理能够高效、智能地控制网页,实现。,开源免费,支持企业级应用扩展。
2025-03-20 10:02:32
1021
原创 LiteraSageAI 项目介绍
LiteraSageAI 是一个基于多 Agent 协同工作的文学润色系统,旨在提升文学文章的质量和表现力。该系统通过 DeepSeek API 实现,利用 5 个不同专业方向的 Agent 进行多轮对话,不断优化和提升文章的质量。
2025-03-20 09:48:03
376
原创 Conda 常规用法指南
Conda 是一个开源的包管理和环境管理系统,主要用于 Python 和其他编程语言的开发环境。它能够方便地安装、更新和管理依赖项,使得不同项目可以使用不同的 Python 版本和库。
2025-03-12 16:10:03
586
原创 Champ
Champ(Controllable and Consistent Human Image Animation with 3D Parametric Guidance)是一种可控 & 一致性强的人像动画生成框架。该方法结合了 SMPL 3D人体参数模型 和 潜变量扩散模型(Latent Diffusion Model, LDM),能够在 参考图像 的基础上 复现目标视频中的运动,实现 精准的姿态控制 和 高度一致的角色动画。 📌 研究机构:南京大学、复旦大学、阿里巴巴📌 论文:arXiv 预印本📌
2025-03-12 14:44:32
801
原创 Hallo3
Hallo3 是一个基于 扩散变换器网络(Diffusion Transformer Networks) 的高动态 & 高逼真人像动画生成框架。该模型可以 将静态人像转换为动态视频,支持 语音驱动,即通过音频控制面部表情和嘴唇同步,生成流畅的说话动画。 📌 研究机构:复旦大学 & 百度📌 论文:arXiv 预印本📌 GitHub:Hallo3 Repository📌 CVPR 2025 录用 🎉 Hallo3 适用于 各种 AI 生成 & 语音驱动的视频应用: 1️⃣ 虚拟主播 &
2025-03-12 14:29:44
1089
原创 StableAnimator
StableAnimator 是一个高质量、身份保持(ID-preserving)的人像动画生成框架,采用视频扩散模型(Video Diffusion Model),能够在不使用任何面部修复或换脸后处理的情况下,生成自然、高清且一致的人物动画。 📌 研究机构:复旦大学、微软亚洲研究院、Huya Inc、卡内基梅隆大学📌 论文:arXiv 预印版📌 GitHub:StableAnimator Repository📌 CVPR 2025 录用 🎉 StableAnimator 适用于多
2025-03-12 14:14:04
880
原创 HumanVid
HumanVid 是一个 大规模、高质量的 人像动画数据集,旨在提高 相机可控(Camera-controllable) 的 人像动画(Human Image Animation) 生成能力。它结合了真实世界视频和合成数据,不仅支持 2D 人体姿态控制,还支持相机轨迹控制,使得生成的视频更加稳定、自然。 📌 研究机构:香港中文大学(CUHK) & 上海 AI 实验室(Shanghai AI Lab)📌 论文:NeurIPS D&B Track 2024📌 数据集:HumanVid 官方主页
2025-03-12 11:55:36
805
原创 MagicAnimate
新加坡国立大学(NUS) & 字节跳动(Bytedance)AI 视频、游戏开发、虚拟人等多个场景。MagicAnimate 依赖以下。MagicAnimate 提供了。MagicAnimate 需要。MagicAnimate 支持。MagicAnimate 由。的动画,并保持人物外观的。研究团队开发,并将在。
2025-03-12 11:41:37
829
原创 Firecrawl API
Firecrawl 是一个 开源的 Web 数据抓取和爬取 API,旨在 将网站内容转换为 LLM 友好的数据,帮助 AI 应用获取 结构化、干净、可用的数据。该 API 处理 动态内容、JavaScript 加载、速率限制 等复杂问题,使开发者可以更轻松地集成 Web 数据到 AI 应用中。 📌 官网:Firecrawl Firecrawl API 适用于各种需要 从 Web 获取数据 的场景,特别是在 AI 领域: LLM 训练 & RAG(检索增强生成)智能内容聚合自动化 Web 数据提取
2025-03-12 10:16:49
1456
原创 Chunkr API
Chunkr API 是一个开源的文档智能解析服务,专为将复杂文档转换为适用于 LLM(大语言模型)或 RAG(检索增强生成)的数据块而设计。该 API 由Y Combinator 支持,提供了高效的文档解析、OCR、布局分析、表格处理等功能,使开发者能够轻松地将各种文档转换为结构化数据。Chunkr API。
2025-03-12 10:02:29
967
原创 Google Search
Google Search API(Custom Search JSON API)是 Google 提供的一种 API,允许开发者在自己的应用或网站中集成 Google 搜索功能。它可以返回 Google 搜索结果,包括网页、图片、新闻等,并支持自定义搜索引擎(CSE,Custom Search Engine)。
2025-03-12 09:51:13
1065
原创 OpenManus测出死循环bug
问题链接:https://github.com/mannaandpoem/OpenManus/issues/458🐞 Bug 描述当 OpenManus 在 成功查询天气并保存文件 后,它本应该终止任务,但 LLM 进入死循环,不断执行新的步骤 (Step 6+),并重复 "你可以使用这些工具" 之类的提示,导致代理无限执行。🔍 复现步骤运行 main.py输入:今天广州的天气以及未来七天的天气观察 Step 5 成功保存数据后,LLM 仍然继续运行📌 问题描述在 OpenManus 运行时
2025-03-11 14:52:33
470
原创 细说AI Agent(智能代理)
AI 不能每次都靠大模型“现编”,LangChain 允许你把 AI 和。在 AI 代理(AI Agent)和 AI 知识管理的领域,,从而让 AI 不是“单纯的聊天机器人”,而是能“自主执行任务的智能体”。让 AI 能读取公司文档,比如查询 HR 政策、法律文件。让 AI 能连接外部 API,比如查询最新的法律法规。让 AI 具备法律知识库,比如读取法院判例、法律条文。的能力,在 AI 代理(Agent)中至关重要。让 AI 能执行任务,比如查询数据库、计算数据。LangChain 还能让 AI 连接。
2025-03-07 11:04:07
929
原创 Manus 真的那么神?普通人也能做一个!
的概念正在快速崛起,从 ChatGPT 到最新的 Manus AI,它们不仅能理解文本,还能执行任务。作为大模型管理中心,然后结合 LangChain 构建 AI 代理,接入知识库和搜索引擎,让 AI 具备真正的决策能力。火了,不少人说它是 “AI 代理革命”,甚至有人高价买邀请码。这样,我们就让 AI 具备了联网搜索的能力,避免“闭门造车”。,让 AI 具备公司业务、政策、产品信息的知识。听起来厉害,其实它的底层逻辑很简单,就是。,而无需依赖特定的商业 AI 平台。的 AI 代理,让你的 AI。
2025-03-07 10:43:28
381
原创 Manus:通用 AI Agent 的新革命,还是资本市场的又一轮炒作?
然而,Manus 的发布不仅带来了市场的狂热,也伴随着自媒体的两极化解读。Manus 在尚未全面公测的情况下,其邀请码在二手市场被炒至 5 万元人民币,更是引发了关于资本运作的疑问。Manus 的发布无疑推动了 AI Agent 概念的热度,但它是否能真正改变 AI 的应用模式,还有待时间检验。这意味着,当前市场的乐观预期可能存在一定程度的“信息陷阱”,投资者需警惕短期炒作带来的风险。从这些案例来看,Manus 确实具备一定的实用性,但是否能在更广泛的场景中普及,还需要进一步的市场验证。
2025-03-07 10:03:09
534
原创 Toolify.ai:探索最佳AI工具的智能导航平台
Toolify.ai 是全球领先的人工智能(AI)工具导航平台,汇集了超过22,700个AI工具和网站,涵盖文字与写作、图像、视频、代码与IT、音频、商业、营销、AI检测器、聊天机器人、设计与艺术、生活助理、3D、教育等多个领域。无论是个人用户还是企业开发者,都能在Toolify.ai找到适合自己的AI工具。Toolify.ai 是一个功能强大、内容丰富的AI工具导航平台,为用户探索和利用最新的AI技术提供了极大的便利。
2025-03-06 10:19:13
483
1
原创 [特殊字符] Django 常用命令
Django 提供了许多实用的命令,可以用于。:启动 Django 内置的开发服务器(默认监听。,帮助你更高效地使用 Django。
2025-03-03 13:38:27
996
原创 探索 OpenAI 最新进展
2025年2月,OpenAI推出了一项革命性的更新——Deep Research,这项先进的AI功能彻底改变了我们进行复杂多步研究任务的方式。Deep Research使用户能够通过人工智能独立进行深入的在线调查,在极短的时间内完成传统上需要人工长时间完成的工作。对于科学、政策、工程和商业等领域的用户,Deep Research带来了显著的价值,尤其在需要快速获取和综合大量信息的场景中。 Deep Research 是 ChatGPT 中的下一代智能体,能够执行独立的在线研究,解决复杂的
2025-02-26 16:26:03
818
原创 细说向量化知识库
向量化知识库本质上是优化检索和信息组织的方式,它通过**语义向量化(Embedding)技术,将文本内容转换成数学向量存储在向量数据库(Vector Database)**中,便于大模型进行高效查询和匹配。突破 LLM 训练时间点的限制,让 AI 能够访问新信息。优化 Prompt 长度,减少无关内容,降低 Token 费用。节省计算资源,相比直接传输完整文档,更节省算力。与其把整个知识库硬塞进 LLM 的 Prompt,不如用向量化检索。
2025-02-24 17:42:06
2045
常见的资料转成txt文本文件
2024-06-21
算法实例-派遣运动员上场能获胜的所有方法
2024-01-20
小白爬虫-下载网页JSON数据以及下载网页图片-Python-适合有一点点经验的新手、小白
2024-01-20
HTTP网页请求Demo和教程-Python-适合小白
2024-01-20
如何使用ASSIMP库转3D换模型格式
2023-01-26
TA创建的收藏夹 TA关注的收藏夹
TA关注的人