自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 收藏
  • 关注

原创 Google Antigravity 免费1个月无限速使用教程|解锁 Google One 高级权益!(真实有效)

本文详细解析了 Google Antigravity 的升级方式 与 Google One 权益机制,并介绍如何通过 Google 官方福利 免费获取 1 个月 Google One 权益,实现 Google Antigravity 无限额度使用。同时,文章提供了完整的注册步骤与实操方法,适合开发者快速上手。

2026-01-08 12:41:03 452

原创 Google & GitHub OAuth 第三方注册、登录快速配置指南!

本文详细介绍了如何配置Google和GitHub的OAuth第三方登录功能。主要内容包括:1)在Google Cloud Console创建项目、启用API和获取OAuth凭据;2)在GitHub开发者设置中创建OAuth应用并生成密钥;3)配置环境变量和测试登录流程;4)常见问题排查方法;5)生产环境部署注意事项。文章还提供了完整的.env配置示例和用户体验说明,帮助开发者快速实现第三方登录功能,提升用户注册体验。

2025-11-28 09:47:53 1058

原创 别只拿 DeepSeek-OCR 当识字工具,它其实能干更多!

这个项目是我用工具花了不少时间折腾出来的,主要是结合 DeepSeek-OCR 模型 的强大特性,想做一个能在本地自由玩转 OCR 的小工具。通过集成 DeepSeek-OCR,不仅能精准识别图片里的文字,还能对图像内容进行描述,效果相当不错。目前项目已经完全开源,大家可以直接拉取代码在本地部署,省去重复开发的麻烦,开箱即用!🚀基于 DeepSeek-OCR 模型的 OCR 识别平台,集成 FastAPI 后端与 React 前端,提供实时流式识别、多语言界面、对象定位等功能。✨多种解析模式。

2025-10-23 22:23:37 2119 7

原创 消费级的DeepSeek-OCR本地部署实战来了!赶紧行动起来吧~

DeepSeek-OCR是一款高效的开源OCR模型,通过创新的视觉token压缩技术显著减少了文本处理时的token数量,同时保持较高准确率。该模型仅3B大小,支持本地部署(如RTX4060 8G显存设备),处理单页PDF仅需数秒。部署步骤包括环境配置(CUDA 11.8+、PyTorch 2.6.0)、模型下载(HuggingFace/ModelScope)及推理测试。实际应用中,输入图片后模型能有效解析内容并输出结构化结果。其核心优势在于平衡了效率与性能,适合大规模文档处理任务。

2025-10-22 17:17:11 9192 13

原创 硬刚Sora2!国产殿堂级影视视频生成神器GAGA-1来临!

国内AI视频生成工具GAGA-1评测:媲美Sora2的中文视频创作利器 GAGA-1作为国内AI视频生成新秀,在人物表情、唇形同步和中文理解方面表现突出。测试显示,其单人生成效果优于马斯克的Grok Imagine,尤其在中文语音-唇形同步和微表情处理上更精准。目前完全免费,10秒视频生成仅需3分钟。 优势: 出色的中文理解与语音同步 人物微表情还原度高 完全免费开放使用 不足: 多人场景表现不稳定 道具和复杂场景处理有待提升 虽然与Sora2仍有差距,但GAGA-1为中文用户提供了优质的AI视频创作体验,

2025-10-13 10:04:51 1446

原创 ComfyUI × Qwen-Image-Edit Plus :本地部署教程,让大家自由创作,无限灵感随心掌控!

阿里巴巴近日推出Qwen-Image-Edit-2509图像编辑模型,支持本地8G显存部署。文章详解了在ComfyUI中配置该模型的完整流程:需加载UNet、LoRA、VAE和CLIP四个核心组件,通过多图输入和文本提示实现姿态调整、服装替换等编辑功能。实测显示8G显存下生成时间约2分钟,并提供了人物换装、动物场景融合等案例展示。该方案突破平台限制,支持本地自由创作,读者可获取官方工作流进一步探索优化空间。

2025-09-29 13:09:26 5264 3

原创 阿里“双生子”:Qwen-Image 与 通义万相,谁才是你的AI画笔?

阿里发布Qwen-Image和通义万相并非"重复造轮子",而是采取"双轨制"产品战略。开源模型Qwen-Image面向开发者,专注复杂文本渲染和精准编辑;商业产品通义万相则针对终端用户,提供一站式AI创作服务。两者API兼容,分工明确:前者通过开源构建技术生态,后者通过闭源实现商业变现。这种"引擎+整车"的组合,既推动技术创新又创造商业价值,展现了阿里在AIGC领域的战略布局。

2025-09-26 15:49:26 1084

原创 「重磅升级」Qwen-Image-Edit-2509上线:多图组合+一致性全面提升!

Qwen-Image-Edit-2509迎来重大升级,新增多图编辑功能,支持人物/场景/商品自由组合,并优化了一致性表现。改进包括:精准保持人物/商品ID,增强文字编辑能力(可改字体/颜色/材质),原生支持ControlNet条件控制(深度图/边缘图等)。新版本在娱乐性和专业性上均有提升,适合P图爱好者及设计营销场景。体验地址已开放,未来有望加入组图生成功能。

2025-09-23 10:35:55 1638

原创 「IndexTTS2 × ComfyUI 王炸上线,本地语音创作全面起飞!」

B站开源IndexTTS2语音模型在语音合成效果上有显著突破,支持本地部署与ComfyUI集成。本文介绍了IndexTTS2的本地部署流程,包括插件下载、模型配置及ComfyUI工作流创建。通过自定义节点,用户可实现文本到语音转换,并支持情感调节功能。主要步骤包括:下载项目到ComfyUI的custom_nodes目录、安装依赖、配置多模块模型文件,以及创建工作流进行音频处理。该方案为数字人开发提供了高质量的语音合成解决方案。

2025-09-16 19:42:10 2548

原创 Nano Banana 本地部署开发实战—— 无需提示词,局部修改随心所欲

摘要:本文介绍了如何利用Google AI Studio周末限免的Gemini API接口,结合开源项目Nano Bananary实现AI图像生成。该项目提供27种预设模板(如3D手办、高清修复等),支持一键生成和连续编辑,无需复杂提示词。文章详细说明了本地部署步骤,包括Node.js环境配置、API密钥设置和项目运行方法,并展示了3D手办生成的具体操作流程。该项目有效简化了AI图像创作过程,未来还将拓展视频生成功能,是开发者利用免费API进行创意开发的典型案例。

2025-09-08 09:08:26 4928

原创 重磅福利!Google Nano Banana模型 API 周末限时免费开放啦!

Google宣布周末免费开放Gemini API,助力开发者体验Nano Banana图像模型 摘要:Google AI Studio宣布2025年9月6日起,每周周末将开放Gemini API的免费调用权限,支持开发者零成本使用Gemini2.5 Flash Preview Image(代号Nano Banana)模型。该模型以精准的图像生成和编辑能力著称,单次调用成本约0.39美元(1024x1024px图像)。本文提供快速上手指南: API配置:通过Google AI Studio获取密钥,周末调用暂

2025-09-06 23:26:11 2381

原创 5秒钟打造爆款手办图,Nano Banana AI图像编辑神器技巧公开!

Nano Banana(Gemini 2.5 Flash Image)是谷歌推出的革命性AI图像编辑工具,凭借超强图文生成与编辑能力引爆全网。其核心亮点包括:1)一键生成逼真3D手办模型;2)智能拆解图片结构;3)精准调整人物动作;4)多图组合创意合成;5)视觉推理预测能力。测试显示该工具在保持图像一致性、细节处理等方面远超竞品,支持中英文自然语言指令,已广泛应用于媒体创作、产品设计等领域。文末还提供了6类实用提示词模板,涵盖商业摄影、极简设计等场景,助力用户高效产出专业级视觉内容。目前该模型正以病毒式速度

2025-09-03 13:57:04 2314

原创 Coze工作流中的Agent卡片设置,助你事半功倍!

本文介绍了如何利用Coze平台提供的卡片功能优化Agent智能体的多模态输出显示效果。针对当前Agent只能以链接形式展示图片、视频等内容的局限性,作者详细演示了通过配置卡片模板与工作流变量相结合的方法,实现更友好的内容预览排版。具体步骤包括:创建卡片、配置图片组件、设置循环渲染变量、绑定工作流输出数据等。最终实现了表情包生成Agent的图片直接预览功能,显著提升了用户体验。该方法不仅适用于图片展示,还可扩展至其他多模态内容的格式化输出。

2025-08-30 17:18:59 955

原创 新手小白10秒打造【智能换衣间】Agent智能体,手把手教程来袭!

本文介绍了使用COZE平台创建智能换衣Agent的全流程。从登录COZE官网、创建智能体、配置模型和插件,到详细讲解核心工作流的编排(包括指令编辑、智能抠图和换脸功能),并演示了工作流调试与发布过程。该Agent能通过图片和文字描述在10秒内完成精准换装换脸操作,展示了AI图像处理的高效能力。文章提供了完整的操作指南,适合对AI应用开发感兴趣的读者参考实践。

2025-08-29 00:43:26 1501

原创 1分钟打造爆款短视频,COZE高效工作流重磅发布!!!

这篇文章介绍了使用COZE工作流制作"老黄历运势"视频的全过程。作者详细讲解了工作流设计流程,包括用户输入、黄历信息查询、文案生成、素材制作(背景图、音频、字幕)和最终视频合成。文章还提供了资源下载和导入剪映客户端的操作指南,展示了自动化生成高质量视频的高效方法。该技术可显著提升自媒体创作效率,1分钟内即可完成从文案生成到视频制作的全流程,适合短视频创作者使用。文末还提供了获取完整工作流配置的方式。

2025-08-25 13:00:27 1134

原创 爆改短视频效率!COZE短视频工作流大公开!(实战篇)

本文介绍了如何利用COZE平台搭建【独居女孩】短视频自动化工作流。主要内容包括:1)新建工作流的基本操作;2)核心流程设计,包含文案生成、分段处理、文生图、语音合成及视频合成五个关键步骤;3)重点插件推荐:COZE官方的图像生成、语音合成插件,以及剪映小助手数据生成器插件。文章还展示了工作流思维导图和实际效果图,为自媒体创业者提供了一套完整的短视频自动化制作方案。作者表示将分享更多工作流案例,并欢迎读者点赞私信获取完整工作流模板。

2025-08-22 23:57:58 2972

原创 阿里Qwen-Image-Edit强势来袭,PS地位不保?

阿里开源Qwen-Image-Edit图像编辑模型实测:该20B参数模型具备语义与外观双重编辑能力,支持文字增删改、IP创作和风格迁移等任务。测试显示其在人物转向编辑、水印去除、文本修改等方面表现优秀,能保持原图风格一致性。虽然多轮编辑仍有提升空间,但已展现较强实用性,为视觉内容创作提供了新工具。用户可通过官方平台体验这一SOTA模型。

2025-08-20 17:30:25 1785

原创 Dify最新版私有化离线部署:分分钟解决Dify旧版工作流迁移导致的兼容性问题

本文介绍了Dify工作流数据从旧版(0.13.2)迁移至新版(1.7.2)的解决方案。主要问题在于旧版导出的DSL文件与新版本不兼容,表现为版本号差异(0.1.4 vs 0.3.1)和插件配置缺失。通过对比分析新旧版DSL文件结构,发现需要手动修改DSL版本号并添加插件配置后,成功实现了工作流的迁移。该方法有效解决了离线环境下Dify版本升级导致的工作流迁移困难问题,大幅提升了工作效率。文章提供了详细的错误分析和解决方案,并附有修改前后的配置对比图,为开发者提供了实用的迁移指南。

2025-08-19 07:00:00 1616

原创 Dify私有化离线部署Plugin(插件)本地打包安装问题:以OpenAI-API-compatible为例

Dify离线插件本地打包与部署教程 本文详细介绍了Dify 1.0版本后在离线环境下部署插件的解决方案。针对OpenAI-API-compatible插件,通过本地重新打包(使用dify-plugin-repackaging工具)和修改Dify配置文件(关闭签名验证FORCE_VERIFYING_SIGNATURE=false)的方式,解决了离线安装时出现的网络不通和空指针异常问题。关键步骤包括:下载指定版本插件、使用打包工具生成带"offline"标识的安装包、调整Dify配置参数(插

2025-08-18 13:21:52 7258 16

原创 Dify私有化离线部署redis启动问题:Restarting (11) Less than a second ago

摘要:Dify私有化离线部署时Redis容器反复重启,报错"fork: Cannot allocate memory"。问题根源为系统内存不足或配置不当,解决方案包括:1)修改宿主机内核参数vm.overcommit_memory=1;2)准备正确的redis.conf配置文件并挂载;3)调整docker-compose.yml配置。经测试验证,Redis容器可稳定运行,关键点在于合理配置内存参数和持久化策略,建议生产环境预留2GB以上内存并设置强密码保护。(149字)

2025-08-15 11:27:32 1108

原创 Dify最新版私有化部署遇坑指南一:Unable to create manifests file: NotFound: content digest sha256:c0a3caf

摘要: 在Dify离线部署过程中,使用docker save打包ARM架构镜像时出现manifests file缺失错误。经排查发现,未在打包命令中指定平台参数(--platform=linux/arm64),导致Docker默认打包为AMD架构镜像。解决方案为:在docker save命令中显式添加平台参数(如--platform=linux/arm64),成功打包后通过docker inspect验证镜像架构为arm64。此问题提示跨平台镜像操作需严格指定目标平台参数。 (字数:149)

2025-08-14 12:09:07 985

原创 全网最新的Dify(1.7.2)私有化离线部署教程(ARM架构)

摘要: 本文提供Dify(1.7.2)最新版在国产ARM架构环境下的私有化离线部署方案。通过本地下载Dify安装包和Docker镜像,适配ARM架构操作系统,满足政企私有化需求。内容包括:从GitHub获取Dify安装包,本地Docker环境配置,离线拉取ARM架构镜像并验证,以及两种镜像打包方式(批量/单独)供服务器迁移。部署过程涵盖核心组件如dify-api、dify-web及依赖服务(PostgreSQL、Weaviate等),确保全流程离线可用。适用于国产化环境的安全部署场景。(149字)

2025-08-13 16:06:05 4850 12

原创 五分钟深度内容分析与创作神器:Doc Research Agent!

Doc Research是一款基于MS-Agent框架的内容提取工具,支持本地化部署和多模态文档分析。它能快速总结技术文档、学术报告等复杂内容,生成图文并茂的Markdown格式报告。主要特点包括:文档深度分析、多文件/URL输入、自动排版、高效信息提取。该工具结合大语言模型和MCP协议,可大幅提升科研和自媒体创作效率,支持CPU/GPU环境部署,并提供免费API调用服务。通过私有化部署保障数据安全,用户可快速将生成的报告应用于优快云等自媒体平台。

2025-08-11 17:13:46 1133

原创 本地免费玩转高质量文生图:Qwen-Image + ComfyUI 8G 显存也能丝滑运行!

本文分享了在本地运行阿里Qwen-Image文生图模型的实测体验。Qwen-Image是20B参数的开源多模态模型,擅长复杂文本渲染和精准图像编辑,支持中英文等多语言输出。作者使用普通配置(8G显存)通过ComfyUI成功运行FP8量化模型,生成效果优于付费AI工具,单图耗时约360秒。文章详细介绍了模型下载、工作流配置和生成步骤,并展示了与可灵、即梦的对比效果图,证明Qwen-Image在画面质感和细节呈现上的优势。

2025-08-07 15:08:56 5474 1

原创 一小时完成从设计到上线:Augment × Figma Make × MCP,AI 帮你收尾添彩!

本文介绍了一种结合Augment AI Coding、Figma Make和MCP接口的开发新方法,可快速生成高质量UI界面。通过Figma Make的AI对话功能,用户能轻松创建智能监控系统等UI设计,并利用插件转换为可编辑的Figma Design文件。再配合Augment配置的Figma MCP插件,可实现设计稿到代码的自动转换。该方法在Flutter跨平台项目中验证效果良好,UI还原度高,显著提升了开发效率。文章详细演示了从设计生成到代码转换的全流程,为开发者提供了一种高效的AI辅助开发方案。

2025-08-06 09:40:29 2838

flash-attn-2.7.4.post1+cu124torch2.6.0cxx11abiFALSE-cp312-cp312-win-amd64.whl

支持CUDA:12.4以及12.5 支持python:3.12及以上 windows环境。

2025-10-23

COZE工作流之《老黄历运势预测》实战篇,助你每日运势抢先看!!!

通过COZE搭建的一个《老黄历运势预测》工作流,该工作流具有文案自动生成、自动剪辑、自动配图、配乐等操作,并与剪映的草稿箱接口做对接,可自动编排图文动画,文案与口播对齐等功能,仅需一句话,便可自动创作出爆款短视频,大大提高自媒体创作的门槛。

2025-08-25

dify-web-arm.tar

通过docker load -i xxxx.tar命令进行解压。

2025-08-19

dify-sandbox-arm.tar

dify相应的配置镜像包,通过docker load -i xxx.tar 可以直接导入使用。

2025-08-19

dify-plugin-daemon-arm.tar

dify-plugin-daemon arm架构,通过docker load -i xxx.tar 进行导入。

2025-08-19

dify-api-arm.tar

dify-arm镜像,通过docker load -i xxx.tar 进行导入。

2025-08-19

dify-docker-compose(arm架构镜像包下载配置)

在官方基础上修改之后的dify启动配置文件。 应用于国产化私有部署。

2025-08-13

Qwen-Image ComfyUI WorkFlow

Qwen-Image ComfyUI WorkFlow

2025-08-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除