自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(273)
  • 收藏
  • 关注

原创 AutoGLM 的实现原理

是智谱推出的“它能在或真实设备上,用“看屏→理解→点击/输入”的方式完成任务,例如“打开美团→选店→下单外卖”。

2025-09-26 13:14:55 1460

原创 Browser-Use 的实现原理

是一个让的闭环系统。GitHub+1。

2025-09-26 13:07:15 1214

原创 什么是 GEO(Generative Engine Optimization)

让你的内容更容易被 ChatGPT、Gemini、Perplexity、Copilot、以及 Google 的。

2025-09-26 12:51:45 1311

原创 Icon 项目总结

Icon是一个典型的 AI + 广告创意自动化工具,优势在于效率、工具整合、多样化广告支持。它特别适合电商、DTC、中型品牌以及广告测试频繁的团队。但它并不能完全替代人工创意与设计师深度创作,对强调原创性和品牌差异化的大客户来说可能仍有不足。

2025-09-12 01:18:19 937

原创 playwright安装

(Playwright 下载 Chromium、WebKit、Firefox 时,这些浏览器二进制运行需要 C++ 运行库支持。

2025-09-10 12:27:05 296

原创 AI短片的风口,我看到了内容特工队Ai

不同于市面上那些“半吊子”软件,它是真正的一站式闭环:从选题脚本、AI 配音、数字人出镜、镜头剪辑,到成品生成和多平台发布,全程自动化。以前我最抗拒的就是“露脸”。我的体验是这样的:我只需要输入一句话需求,比如“帮我做一条秋季养生小贴士视频”,然后点一下,几分钟后就能得到一条精致的短片。有位律师朋友告诉我,他用内容特工队Ai一个月就生成了 100 多条专业短视频,播放量突破几十万,咨询量翻了三倍。这几年,短视频几乎成了所有行业的标配:餐饮要靠它引流,律师要靠它获客,跨境电商更是离不开它做全球营销。

2025-09-10 00:41:37 665

原创 内容特工队:一台手机就是一个短视频团队

内容特工队是由荷里购科技推出的全球首个移动端AI营销视频智能体。它把复杂的短视频生产流程,浓缩成一个“一键式”的操作体验,真正实现了从策划到发布的全链路自动化。无论是个人创业者、小微商户,还是营销团队,都可以借助它快速生成专业级短视频。内容特工队不仅仅是一个AI工具,更像是为短视频时代量身打造的“智能生产力伙伴”。它帮助个人和企业节省成本、提升效率,把创意快速转化为具有传播力的内容。在未来,随着AI技术的不断升级,像内容特工队这样的产品,或许会成为短视频行业的新标配。

2025-09-08 00:30:53 1618

原创 知识库②——向量化 (Embedding):从文本片段到语义向量

中文/多语 + 本地部署:优先BGE-M3云端稳定 + 免运维:选已有 E5 系统或轻量多语:可用从文本片段 → 向量知识库文本切片 (Chunks)↓ Embedding 模型编码 → 向量表示↓ 存储与索引 (Vector DB: FAISS / Pinecone / Weaviate / Chroma / Milvus / Qdrant)↓ Chunk ↔ Metadata 绑定↓ 可检索的语义知识库Embedding 模型选择决定了检索精度、语言适配性与部署方式:中文/多语本地 →。

2025-08-29 01:45:30 1053

原创 返回关联文本片段:如何避免上下文过长导致模型错乱

适用场景:当确实需要多个证据支撑回答时。方法:利用专门的压缩模型(如LLMLingua一类的 Prompt 压缩器),将多个片段合并成提要,再交给大模型生成答案。注意:要平衡信息损失与可追溯性。少取、取准、压缩。预算控制→ 先决定能塞多少;MMR / 重排 / 压缩→ 精选出最有价值的片段;邻近扩展 / HyDE→ 保证上下文连贯与检索准确;提示词工程→ 引导模型专注问题本身、正确引用检索结果。通过这套组合拳,就能在有限的上下文窗口中,最大化信息利用率,避免模型错乱或遗忘核心问题。

2025-08-29 01:40:15 671

原创 在向量库里进行相似检索:Hybrid Search 的常见算法

Hybrid Search 的核心目标是结合关键词检索的精确性与向量检索的语义能力:最常用、可调节精度与召回的平衡;RRF:更健壮的无参排序融合;Cross-Encoder 重排:牺牲性能换取极致精度;Sparse + Dense 一体化:系统级方案,适合长期工程化部署。根据业务场景和性能需求,可以灵活选择或组合使用这些方法,构建高效稳定的混合检索系统。

2025-08-29 01:36:22 1058

原创 用户输入的问题生成 Query Embedding

核心原则:Query embedding 必须和知识库构建时用的 document embedding 模型一致。中文语料推荐:首选BGE-M3;若已有 E5 体系则用Multilingual-E5-Large(带前缀);若要云端省心,则选OpenAI text-embedding-3 系列。检索优化建议:向量检索应结合关键词 BM25 做 Hybrid,再配合 Cross-Encoder 重排,才能在中文场景下兼顾召回率和精度。

2025-08-29 01:30:25 429

原创 存储到向量数据库:去重、清洗与数据库选择

清洗与去重是保证知识库质量的前置环节,必须在 embedding 之前完成。数据库选择则取决于语料语言(中文/多语 vs 英文)、数据规模(小型实验 vs 大规模生产)、部署条件(本地 vs 云端)、业务需求(单模态 vs 多模态)。正确结合两者,才能构建一个高质量、可扩展、适配业务场景的向量知识库。

2025-08-29 01:27:44 451

原创 向量化 (Embedding):从文本到知识库的关键步骤

从Markdown → 向量知识库Markdown 文档↓ Loader 加载 → Document(page_content + metadata)↓ Splitter 切分 → Chunks (继承 metadata)↓ Embedding → 向量化↓ 存储与索引 → 向量数据库 (FAISS / Pinecone / Weaviate / Chroma 等)↓ Metadata 绑定 → (id, vector, chunk_text, metadata)↓ 可检索的知识库。

2025-08-29 01:24:39 1425

原创 从 Markdown 到向量知识库:文本切片与 Metadata 管理实践

从 Markdown 到向量知识库的流程中,Metadata 结构化和文本切片是两个核心步骤:Metadata 提供过滤、访问控制与溯源能力;合理的 chunk 大小和 overlap 决定了召回的准确性与效率。在中文场景下,推荐MarkdownLoader + 语义切分 + 500–800 tokens/块的配置作为起点,再结合实际上下文窗口、Top-K 设置与检索实验结果,迭代优化。

2025-08-29 01:21:17 1100

原创 声音克隆中的音量归一化:原理、作用与潜在副作用

音量归一化是声音克隆和语音合成流程中不可或缺的标准步骤。科学地应用归一化能极大提升模型的训练效率与推理一致性,但工程实践中需要根据目标场景、数据分布与合成需求权衡取舍,避免一刀切式的归一化导致情感表达、音质或建模能力的损失。归一化不是万能药,而是一个工程“调优点”。理解其原理和副作用,才能让你的声音克隆模型既稳定又富有表现力。

2025-07-10 15:51:58 903

原创 Python UI自动化演进格局:从传统库到AI驱动的智能代理

在现代软件工程和业务流程管理中,图形用户界面(GUI)自动化扮演着至关重要的角色。它不仅仅局限于软件测试领域,更是机器人流程自动化(RPA)、自动化数据录入、遗留系统集成以及在API(应用程序编程接口)缺失或不足时模拟人类交互的核心技术。通过编程方式模拟鼠标点击、键盘输入和屏幕导航,UI自动化技术弥合了人类操作与机器执行之间的鸿沟,使得重复性、规律性的任务得以高效、准确地完成。当前的UI自动化技术可以被归纳为一个光谱,其两端代表了截然不同的实现哲学。本报告将深入探讨这一光谱的各个层面:基于对象属性的确定性自

2025-06-30 17:40:46 939

原创 ComfyUI 高级工作流教程:HiDream 图像生成 + Perturbation 放大 + LanPaint 修复实战

本教程完整展示了一条从文本提示到图像生成、再到局部修复与高分辨率输出的完整高级流程。无论你是 ComfyUI 的新手还是老手,HiDream + Perturbation + LanPaint 的组合都值得深入探索与实践。

2025-06-18 09:24:46 1104

原创 FastAPI 的运行方式解析:def、async def、线程池、异步与等待的区别与联系

运行方式写法是否阻塞事件循环推荐场景性能表现异步(async)async def否异步网络 I/O、数据库、API 请求⭐⭐⭐⭐⭐ 高并发优选同步非阻塞(def)def否(由线程池运行)快速计算、小逻辑处理⭐⭐⭐⭐ 稳定安全同步阻塞(def)def否(由线程池运行)使用阻塞库(如 requests)⭐⭐⭐ 稍慢,但兼容性好FastAPI 让 Python 的异步能力进入大众开发者视野,并通过简洁的 API 接口和底层的 Starlette 框架,优雅支持async def和def。

2025-06-16 11:17:50 1172

原创 赋能大型语言模型与外部世界交互——函数调用的崛起

函数调用,或称工具使用,其核心定义是一种使大型语言模型能够根据用户的自然语言输入,请求执行外部系统中预先定义好的函数或API的技术。在此过程中,LLM本身并不直接执行这些函数;相反,它会分析用户意图,并生成一个包含目标函数名称及其所需参数的结构化数据(通常为JSON格式)1。这个结构化数据随后被传递给外部的应用程序或执行环境,由后者负责实际调用函数并处理结果。

2025-06-06 17:23:39 1306

原创 一文读懂RAG流程中用到的请求参数与返回字段

阶段参数或字段说明检索请求querynameprojectlimit基础检索条件检索前处理rewritemessages提升语义匹配检索后处理精细排序、上下文扩展响应结果检索内容与消耗大模型调用messagesmodelmax_tokens构建回答生成任务回答内容usage输出结果与解释。

2025-06-04 17:00:59 854

原创 知识库检索接口参数设置

场景推荐配置纯语义检索精准关键字匹配, 关闭 rerank多轮对话+智能改写, 配置messages需要上下文增强图文混合文档展示。

2025-06-04 16:02:51 739

原创 构建检索增强生成(RAG)应用:第二部分

我们仍使用第1部分中提到的外部知识源:Lilian Weng 撰写的博客文章《LLM驱动的自主智能体(LLM Powered Autonomous Agents)》。在许多问答应用中,我们希望允许用户进行来回对话,这意味着应用需要某种“记忆”以记录过去的问题和答案,并具备将其纳入当前思考的逻辑。在 Part 1 中,我们将用户输入、检索上下文和生成的回答分别作为状态的不同字段。本教程中的方法利用了现代聊天模型中的工具调用(Tool Calling)能力。使用 Agent 模式的多步迭代检索 RAG。

2025-06-03 11:06:19 1016

原创 LangChain + LangGraph 教程第一部分:打造基于 RAG 的问答应用

Build a Retrieval Augmented Generation (RAG) App: Part 1 | 🦜️🔗 LangChain 在大型语言模型应用中,构建有数据根据的问答类应用是最有力的场景之一。这类应用使用的技术叫做 Retrieval Augmented Generation(RAG)。Part 1 (本文):介绍 RAG 原理,应用 LangChain 和 LangGraph 实现最简应用Part 2 (将推出):展延到支持对话风格与多步骤的处理流加载文档:Docu

2025-06-03 11:01:05 454

原创 如何无损修复Windows

Windows 11 提供“使用 Windows 更新修复问题”功能,允许用户在保留应用、文件和设置的前提下重新安装当前版本的操作系统,有效解决系统文件损坏、组件异常等常见问题。Windows 11 安装助手适用于当前运行 Windows 10/11 的设备,支持在保留用户数据的前提下重新安装系统,是一种“就地升级”的修复方式。适用于进行全新安装或高级修复场景,用户可通过创建启动 U 盘或 ISO 文件,手动引导电脑进入安装程序修复系统。

2025-05-31 09:34:45 7401

原创 uv ——新的python包管理工具

直接把.venv等目录整个删除到回收站即可,就是这么简单粗暴。如果想格式化重置虚拟环境。

2025-05-26 16:39:44 984

原创 GPT-4.1 开启智能时代新纪元

GPT-4.1 是通用人工智能从“可用”走向“好用”的里程碑。它以更高性能、更低成本,覆盖更广的能力边界,不仅是开发者的得力工具,更是推动教育公平、产业升级与公共服务革新的新引擎。未来,随着 GPT-4.1 在更多行业的嵌入式应用落地,我们有理由相信,真正的“AI for everyone” 时代,已经到来。

2025-04-21 15:39:12 949

原创 ControlNet v1.1 用途与典型例子

AI 插画师工具链:草图 → 自动绘图 → AI 修图。多为社区调制扩展,如角色融合风格生成、模仿参考图动作等。“让这个人穿红裙子”+图片输入 → 生成穿红裙子版本。:检测场景中的几何直线(通常用于室内/建筑)动作一致的 VTuber 插画 / 模型图。与 pose 联用生成立体感更强的角色插画。指定哪个区域生成什么:人、衣服、车、树……“蓝色区域为人物,绿色为树,红色为太阳”:Prompt 引导图像变换(非强控制):每个像素点的三维方向(用彩色图编码)儿童画 → 完整插图(AI 插画)

2025-04-09 14:06:59 991

原创 ControlNet v1.1 - OpenPose模型说明

是 ControlNet v1.1 系列中基于OpenPose 人体姿态估计图像训练的控制模型。可与 Stable Diffusion v1.5 搭配使用,通过“骨架提示图(keypoint map)”进行强力的人体姿态控制。适用于人体换装、动态一致性图生图、动作还原、动漫角色动态生成等场景。

2025-04-09 14:01:15 1081

原创 sam_vit_h_4b8939模型说明

是 Meta AI 发布的的最强版本,采用ViT-H(Vision Transformer Huge)作为图像编码器,具备极高的零样本分割能力。该模型支持基于提示的交互式分割:你可以提供“点、框、掩码”作为提示,它会高质量地生成目标区域的掩码。它也可在无需提示的自动模式下生成整张图的所有对象掩码。

2025-04-09 13:49:26 3548

原创 840000VAE 模型使用说明

使用 CyberRealistic、Anything、ChilloutMix、Realistic Vision 等注重真实感的模型时,提高。该模型是原始 Stable Diffusion 所用 VAE 的升级版本,旨在。此模型不会生成图像,只作用于潜空间 ↔ 图像空间的编码/解码(影响画面质量、色彩、细节还原)。更适合人像与细节还原(比原始VAE在 PSNR / SSIM / PSIM 上表现更佳)。可配合提示词、LoRA 调优,观察对图像细节、色彩、面部还原的影响。,与原模型完全兼容。

2025-04-09 13:34:41 2728

原创 CyberRealistic V8 模型使用说明

✅ 特色改进:V8 大幅减少异常肢体(多手、多指等),更贴近真实人类结构。与 CyberRealistic LCM 版本不同,本模型为。LoRA、Textual Inversion 插件兼容性强。可结合 LoRA 提升人物表现力(如姿势、服饰、风格等)。本模型为多个写实模型融合结果,融合方式未完全公开,但强调。支持 Civitai 网页端生成与 LoRA 叠加实验。,非常适合新手或需要快速出图的场景。,追求图像质量优先而非推理速度。:高写实、高细节人像模型。清晰的五官与自然光影。

2025-04-09 13:28:16 791

原创 一文了解 MCP Server:AI 工具与外部世界的桥梁

MCP 是统一大模型与外部工具交互的通用协议MCP Server 是你构建智能体最重要的“外挂工具”集合借助 MCP Inspector、现成 MCP Server 仓库、主流 SDK(Python、Node)可以快速接入与开发DeepSeek、Cursor、Claude 等主流平台全面支持 MCP,让 Agent 构建进入标准化时代MCP 不是新技术,而是一种“标准 + 工具”的革命。它正在推动 AI 工具从“孤岛”走向生态协作,人人都能成为“Agent 工程师”。

2025-03-27 17:36:21 4074

原创 Cloudflared安装与基本使用

Cloudflared 免费版不支持直接设置密码访问。用 Nginx 反代 + HTTP Basic Auth(进阶)⚠️ 注意:如果你在 JupyterLab 的终端运行,复制刚刚的地址粘贴到浏览器,就能看到你的项目页面了 ✅。用 Cloudflare Tunnel 配合。如果页面能正常显示你的项目页面,即表示成功。

2025-03-27 16:29:22 1723

原创 Cloudflared vs FRP

临时访问用 Cloudflared,长期服务用 FRP!你也可以一开始用 Cloudflared,等项目稳定再切换到 FRP。

2025-03-27 15:46:17 810

原创 Gradio实现内网穿透的重要组件

Gradio 的share=True功能需要,这是用来建立公网隧道的工具(Gradio 内置的 FRP 客户端)。

2025-03-27 15:14:59 880

原创 Hybrid + Reranking 检索管线简介

在大模型问答(如 RAG、ChatGPT 插件)和搜索增强生成(Retrieval-Augmented Generation, RAG)场景中,是一种非常主流且有效的检索策略。它结合了稀疏检索和稠密检索的优势,并通过重排序模型(reranker)进一步优化结果质量。

2025-03-21 12:00:32 476

原创 Browser Use 项目介绍

支持 AI 代理在网页上进行复杂交互,例如自动填表、数据分析、在线购物、社交媒体操作等。,旨在让 AI 代理能够高效、智能地控制网页,实现。,开源免费,支持企业级应用扩展。

2025-03-20 10:02:32 1416

原创 LiteraSageAI 项目介绍

LiteraSageAI 是一个基于多 Agent 协同工作的文学润色系统,旨在提升文学文章的质量和表现力。该系统通过 DeepSeek API 实现,利用 5 个不同专业方向的 Agent 进行多轮对话,不断优化和提升文章的质量。

2025-03-20 09:48:03 613

原创 Image to Line ComfyUI WorkFlow 讲解

这个。

2025-03-19 11:35:01 1313

原创 Conda 常规用法指南

Conda 是一个开源的包管理和环境管理系统,主要用于 Python 和其他编程语言的开发环境。它能够方便地安装、更新和管理依赖项,使得不同项目可以使用不同的 Python 版本和库。

2025-03-12 16:10:03 757

常见的资料转成txt文本文件

该代码旨在遍历指定目录中的所有文件,将支持的文件格式(如PDF、DOC、DOCX、PPT、PPTX、XLS、XLSX、TXT)转换为文本文件并保存。使用不同的库处理不同的文件格式,如fitz用于PDF,docx用于DOCX,comtypes用于PPT,openpyxl用于XLSX,xlrd用于XLS,aspose-words用于DOC等。 该代码通过定义不同的函数来提取各种文件格式的文本,并通过遍历目录中的文件来转换所有支持的文件格式,最终将转换结果保存到指定目录的文本文件中。这一过程简化了从多个文件中提取文本的复杂性,并可以很容易地扩展以支持更多的文件格式。

2024-06-21

算法实例-派遣运动员上场能获胜的所有方法

算法实例-派遣运动员上场能获胜的所有方法 1、假设每一个运动员有一个战力值 2、在比赛对抗中,总战力高的队伍将胜出 3、如果两个队伍的战力值一直,默认让A队伍获胜(默认让同一方获胜) 4、一共分为两个战队 5、每个战队分别是3男3女 6、进行男男、女女、男女混合对决 7、最终展示所有能获胜的阵容

2024-01-20

广度优先算法例子-Python-迷宫路径规划

1、首先,模拟构建迷宫数据 2、模拟迷宫的探索过程 3、回溯以重建路径,即从起点到终点的最优路径

2024-01-20

小白爬虫-下载网页JSON数据以及下载网页图片-Python-适合有一点点经验的新手、小白

1、首先是获取网页的JSON数据 2、然后用迭代器把JSON数据内容打印出来查看 3、然后展示如何通过URL把网页的图片内容下载到本地

2024-01-20

HTTP网页请求Demo和教程-Python-适合小白

1、HTTP协议介绍 2、URL、URI介绍 3、请求方式介绍 4、响应码介绍 5、网页数据介绍 6、前面的理论进行实践和调试 7、实战Demo

2024-01-20

获取网页Cookie-Python-适合小白

1、尝试把Cookies保存到txt文件中 2、获取Cookies 3、保存Cookies 4、使用Cookies 5、Demo

2024-01-20

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除