二号小明-优快云博客

原创 Google Antigravity 免费1个月无限速使用教程｜解锁 Google One 高级权益！（真实有效）

本文详细解析了 Google Antigravity 的升级方式与 Google One 权益机制，并介绍如何通过 Google 官方福利免费获取 1 个月 Google One 权益，实现 Google Antigravity 无限额度使用。同时，文章提供了完整的注册步骤与实操方法，适合开发者快速上手。

2026-01-08 12:41:03 452

原创 Google & GitHub OAuth 第三方注册、登录快速配置指南！

本文详细介绍了如何配置Google和GitHub的OAuth第三方登录功能。主要内容包括：1）在Google Cloud Console创建项目、启用API和获取OAuth凭据；2）在GitHub开发者设置中创建OAuth应用并生成密钥；3）配置环境变量和测试登录流程；4）常见问题排查方法；5）生产环境部署注意事项。文章还提供了完整的.env配置示例和用户体验说明，帮助开发者快速实现第三方登录功能，提升用户注册体验。

2025-11-28 09:47:53 1058

原创别只拿 DeepSeek-OCR 当识字工具，它其实能干更多！

这个项目是我用工具花了不少时间折腾出来的，主要是结合 DeepSeek-OCR 模型的强大特性，想做一个能在本地自由玩转 OCR 的小工具。通过集成 DeepSeek-OCR，不仅能精准识别图片里的文字，还能对图像内容进行描述，效果相当不错。目前项目已经完全开源，大家可以直接拉取代码在本地部署，省去重复开发的麻烦，开箱即用！🚀基于 DeepSeek-OCR 模型的 OCR 识别平台，集成 FastAPI 后端与 React 前端，提供实时流式识别、多语言界面、对象定位等功能。✨多种解析模式。

2025-10-23 22:23:37 2119 7

原创消费级的DeepSeek-OCR本地部署实战来了！赶紧行动起来吧~

DeepSeek-OCR是一款高效的开源OCR模型，通过创新的视觉token压缩技术显著减少了文本处理时的token数量，同时保持较高准确率。该模型仅3B大小，支持本地部署（如RTX4060 8G显存设备），处理单页PDF仅需数秒。部署步骤包括环境配置（CUDA 11.8+、PyTorch 2.6.0）、模型下载（HuggingFace/ModelScope）及推理测试。实际应用中，输入图片后模型能有效解析内容并输出结构化结果。其核心优势在于平衡了效率与性能，适合大规模文档处理任务。

2025-10-22 17:17:11 9192 13

原创硬刚Sora2！国产殿堂级影视视频生成神器GAGA-1来临！

国内AI视频生成工具GAGA-1评测：媲美Sora2的中文视频创作利器 GAGA-1作为国内AI视频生成新秀，在人物表情、唇形同步和中文理解方面表现突出。测试显示，其单人生成效果优于马斯克的Grok Imagine，尤其在中文语音-唇形同步和微表情处理上更精准。目前完全免费，10秒视频生成仅需3分钟。优势：出色的中文理解与语音同步人物微表情还原度高完全免费开放使用不足：多人场景表现不稳定道具和复杂场景处理有待提升虽然与Sora2仍有差距，但GAGA-1为中文用户提供了优质的AI视频创作体验，

2025-10-13 10:04:51 1446

原创 ComfyUI × Qwen-Image-Edit Plus ：本地部署教程，让大家自由创作，无限灵感随心掌控！

阿里巴巴近日推出Qwen-Image-Edit-2509图像编辑模型，支持本地8G显存部署。文章详解了在ComfyUI中配置该模型的完整流程：需加载UNet、LoRA、VAE和CLIP四个核心组件，通过多图输入和文本提示实现姿态调整、服装替换等编辑功能。实测显示8G显存下生成时间约2分钟，并提供了人物换装、动物场景融合等案例展示。该方案突破平台限制，支持本地自由创作，读者可获取官方工作流进一步探索优化空间。

2025-09-29 13:09:26 5264 3

原创阿里“双生子”：Qwen-Image 与通义万相，谁才是你的AI画笔？

阿里发布Qwen-Image和通义万相并非"重复造轮子"，而是采取"双轨制"产品战略。开源模型Qwen-Image面向开发者，专注复杂文本渲染和精准编辑；商业产品通义万相则针对终端用户，提供一站式AI创作服务。两者API兼容，分工明确：前者通过开源构建技术生态，后者通过闭源实现商业变现。这种"引擎+整车"的组合，既推动技术创新又创造商业价值，展现了阿里在AIGC领域的战略布局。

2025-09-26 15:49:26 1084

原创「重磅升级」Qwen-Image-Edit-2509上线：多图组合+一致性全面提升！

Qwen-Image-Edit-2509迎来重大升级，新增多图编辑功能，支持人物/场景/商品自由组合，并优化了一致性表现。改进包括：精准保持人物/商品ID，增强文字编辑能力（可改字体/颜色/材质），原生支持ControlNet条件控制（深度图/边缘图等）。新版本在娱乐性和专业性上均有提升，适合P图爱好者及设计营销场景。体验地址已开放，未来有望加入组图生成功能。

2025-09-23 10:35:55 1638

原创「IndexTTS2 × ComfyUI 王炸上线，本地语音创作全面起飞！」

B站开源IndexTTS2语音模型在语音合成效果上有显著突破，支持本地部署与ComfyUI集成。本文介绍了IndexTTS2的本地部署流程，包括插件下载、模型配置及ComfyUI工作流创建。通过自定义节点，用户可实现文本到语音转换，并支持情感调节功能。主要步骤包括：下载项目到ComfyUI的custom_nodes目录、安装依赖、配置多模块模型文件，以及创建工作流进行音频处理。该方案为数字人开发提供了高质量的语音合成解决方案。

2025-09-16 19:42:10 2548

原创 Nano Banana 本地部署开发实战—— 无需提示词，局部修改随心所欲

摘要：本文介绍了如何利用Google AI Studio周末限免的Gemini API接口，结合开源项目Nano Bananary实现AI图像生成。该项目提供27种预设模板（如3D手办、高清修复等），支持一键生成和连续编辑，无需复杂提示词。文章详细说明了本地部署步骤，包括Node.js环境配置、API密钥设置和项目运行方法，并展示了3D手办生成的具体操作流程。该项目有效简化了AI图像创作过程，未来还将拓展视频生成功能，是开发者利用免费API进行创意开发的典型案例。

2025-09-08 09:08:26 4928

原创重磅福利！Google Nano Banana模型 API 周末限时免费开放啦！

Google宣布周末免费开放Gemini API，助力开发者体验Nano Banana图像模型摘要：Google AI Studio宣布2025年9月6日起，每周周末将开放Gemini API的免费调用权限，支持开发者零成本使用Gemini2.5 Flash Preview Image（代号Nano Banana）模型。该模型以精准的图像生成和编辑能力著称，单次调用成本约0.39美元（1024x1024px图像）。本文提供快速上手指南： API配置：通过Google AI Studio获取密钥，周末调用暂

2025-09-06 23:26:11 2381

原创 5秒钟打造爆款手办图，Nano Banana AI图像编辑神器技巧公开！

Nano Banana（Gemini 2.5 Flash Image）是谷歌推出的革命性AI图像编辑工具，凭借超强图文生成与编辑能力引爆全网。其核心亮点包括：1）一键生成逼真3D手办模型；2）智能拆解图片结构；3）精准调整人物动作；4）多图组合创意合成；5）视觉推理预测能力。测试显示该工具在保持图像一致性、细节处理等方面远超竞品，支持中英文自然语言指令，已广泛应用于媒体创作、产品设计等领域。文末还提供了6类实用提示词模板，涵盖商业摄影、极简设计等场景，助力用户高效产出专业级视觉内容。目前该模型正以病毒式速度

2025-09-03 13:57:04 2314

原创 Coze工作流中的Agent卡片设置，助你事半功倍！

本文介绍了如何利用Coze平台提供的卡片功能优化Agent智能体的多模态输出显示效果。针对当前Agent只能以链接形式展示图片、视频等内容的局限性，作者详细演示了通过配置卡片模板与工作流变量相结合的方法，实现更友好的内容预览排版。具体步骤包括：创建卡片、配置图片组件、设置循环渲染变量、绑定工作流输出数据等。最终实现了表情包生成Agent的图片直接预览功能，显著提升了用户体验。该方法不仅适用于图片展示，还可扩展至其他多模态内容的格式化输出。

2025-08-30 17:18:59 955

原创新手小白10秒打造【智能换衣间】Agent智能体，手把手教程来袭！

本文介绍了使用COZE平台创建智能换衣Agent的全流程。从登录COZE官网、创建智能体、配置模型和插件，到详细讲解核心工作流的编排（包括指令编辑、智能抠图和换脸功能），并演示了工作流调试与发布过程。该Agent能通过图片和文字描述在10秒内完成精准换装换脸操作，展示了AI图像处理的高效能力。文章提供了完整的操作指南，适合对AI应用开发感兴趣的读者参考实践。

2025-08-29 00:43:26 1501

原创 1分钟打造爆款短视频，COZE高效工作流重磅发布！！！

这篇文章介绍了使用COZE工作流制作"老黄历运势"视频的全过程。作者详细讲解了工作流设计流程，包括用户输入、黄历信息查询、文案生成、素材制作（背景图、音频、字幕）和最终视频合成。文章还提供了资源下载和导入剪映客户端的操作指南，展示了自动化生成高质量视频的高效方法。该技术可显著提升自媒体创作效率，1分钟内即可完成从文案生成到视频制作的全流程，适合短视频创作者使用。文末还提供了获取完整工作流配置的方式。

2025-08-25 13:00:27 1134

原创爆改短视频效率！COZE短视频工作流大公开！（实战篇）

本文介绍了如何利用COZE平台搭建【独居女孩】短视频自动化工作流。主要内容包括：1）新建工作流的基本操作；2）核心流程设计，包含文案生成、分段处理、文生图、语音合成及视频合成五个关键步骤；3）重点插件推荐：COZE官方的图像生成、语音合成插件，以及剪映小助手数据生成器插件。文章还展示了工作流思维导图和实际效果图，为自媒体创业者提供了一套完整的短视频自动化制作方案。作者表示将分享更多工作流案例，并欢迎读者点赞私信获取完整工作流模板。

2025-08-22 23:57:58 2972

原创阿里Qwen-Image-Edit强势来袭，PS地位不保？

阿里开源Qwen-Image-Edit图像编辑模型实测：该20B参数模型具备语义与外观双重编辑能力，支持文字增删改、IP创作和风格迁移等任务。测试显示其在人物转向编辑、水印去除、文本修改等方面表现优秀，能保持原图风格一致性。虽然多轮编辑仍有提升空间，但已展现较强实用性，为视觉内容创作提供了新工具。用户可通过官方平台体验这一SOTA模型。

2025-08-20 17:30:25 1785

原创 Dify最新版私有化离线部署：分分钟解决Dify旧版工作流迁移导致的兼容性问题

本文介绍了Dify工作流数据从旧版（0.13.2）迁移至新版（1.7.2）的解决方案。主要问题在于旧版导出的DSL文件与新版本不兼容，表现为版本号差异（0.1.4 vs 0.3.1）和插件配置缺失。通过对比分析新旧版DSL文件结构，发现需要手动修改DSL版本号并添加插件配置后，成功实现了工作流的迁移。该方法有效解决了离线环境下Dify版本升级导致的工作流迁移困难问题，大幅提升了工作效率。文章提供了详细的错误分析和解决方案，并附有修改前后的配置对比图，为开发者提供了实用的迁移指南。

2025-08-19 07:00:00 1616

原创 Dify私有化离线部署Plugin（插件）本地打包安装问题：以OpenAI-API-compatible为例

Dify离线插件本地打包与部署教程本文详细介绍了Dify 1.0版本后在离线环境下部署插件的解决方案。针对OpenAI-API-compatible插件，通过本地重新打包（使用dify-plugin-repackaging工具）和修改Dify配置文件（关闭签名验证FORCE_VERIFYING_SIGNATURE=false）的方式，解决了离线安装时出现的网络不通和空指针异常问题。关键步骤包括：下载指定版本插件、使用打包工具生成带"offline"标识的安装包、调整Dify配置参数（插

2025-08-18 13:21:52 7258 16

原创 Dify私有化离线部署redis启动问题：Restarting (11) Less than a second ago

摘要：Dify私有化离线部署时Redis容器反复重启，报错"fork: Cannot allocate memory"。问题根源为系统内存不足或配置不当，解决方案包括：1)修改宿主机内核参数vm.overcommit_memory=1；2)准备正确的redis.conf配置文件并挂载；3)调整docker-compose.yml配置。经测试验证，Redis容器可稳定运行，关键点在于合理配置内存参数和持久化策略，建议生产环境预留2GB以上内存并设置强密码保护。（149字）

2025-08-15 11:27:32 1108

原创 Dify最新版私有化部署遇坑指南一：Unable to create manifests file: NotFound: content digest sha256:c0a3caf

摘要：在Dify离线部署过程中，使用docker save打包ARM架构镜像时出现manifests file缺失错误。经排查发现，未在打包命令中指定平台参数（--platform=linux/arm64），导致Docker默认打包为AMD架构镜像。解决方案为：在docker save命令中显式添加平台参数（如--platform=linux/arm64），成功打包后通过docker inspect验证镜像架构为arm64。此问题提示跨平台镜像操作需严格指定目标平台参数。（字数：149）

2025-08-14 12:09:07 985

原创全网最新的Dify(1.7.2)私有化离线部署教程（ARM架构）

摘要：本文提供Dify(1.7.2)最新版在国产ARM架构环境下的私有化离线部署方案。通过本地下载Dify安装包和Docker镜像，适配ARM架构操作系统，满足政企私有化需求。内容包括：从GitHub获取Dify安装包，本地Docker环境配置，离线拉取ARM架构镜像并验证，以及两种镜像打包方式（批量/单独）供服务器迁移。部署过程涵盖核心组件如dify-api、dify-web及依赖服务（PostgreSQL、Weaviate等），确保全流程离线可用。适用于国产化环境的安全部署场景。(149字)

2025-08-13 16:06:05 4850 12

原创五分钟深度内容分析与创作神器：Doc Research Agent！

Doc Research是一款基于MS-Agent框架的内容提取工具，支持本地化部署和多模态文档分析。它能快速总结技术文档、学术报告等复杂内容，生成图文并茂的Markdown格式报告。主要特点包括：文档深度分析、多文件/URL输入、自动排版、高效信息提取。该工具结合大语言模型和MCP协议，可大幅提升科研和自媒体创作效率，支持CPU/GPU环境部署，并提供免费API调用服务。通过私有化部署保障数据安全，用户可快速将生成的报告应用于优快云等自媒体平台。

2025-08-11 17:13:46 1133

原创本地免费玩转高质量文生图：Qwen-Image + ComfyUI 8G 显存也能丝滑运行！

本文分享了在本地运行阿里Qwen-Image文生图模型的实测体验。Qwen-Image是20B参数的开源多模态模型，擅长复杂文本渲染和精准图像编辑，支持中英文等多语言输出。作者使用普通配置（8G显存）通过ComfyUI成功运行FP8量化模型，生成效果优于付费AI工具，单图耗时约360秒。文章详细介绍了模型下载、工作流配置和生成步骤，并展示了与可灵、即梦的对比效果图，证明Qwen-Image在画面质感和细节呈现上的优势。

2025-08-07 15:08:56 5474 1

原创一小时完成从设计到上线：Augment × Figma Make × MCP，AI 帮你收尾添彩！

本文介绍了一种结合Augment AI Coding、Figma Make和MCP接口的开发新方法，可快速生成高质量UI界面。通过Figma Make的AI对话功能，用户能轻松创建智能监控系统等UI设计，并利用插件转换为可编辑的Figma Design文件。再配合Augment配置的Figma MCP插件，可实现设计稿到代码的自动转换。该方法在Flutter跨平台项目中验证效果良好，UI还原度高，显著提升了开发效率。文章详细演示了从设计生成到代码转换的全流程，为开发者提供了一种高效的AI辅助开发方案。

2025-08-06 09:40:29 2838

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

weixin_42485090的博客