AI袋鼠帝-优快云博客

原创一人一天，从0到1打造一个品牌VI（附实操）

不懂设计、不学PS，用AI一天打造品牌。从IP到包装...到PPT全流程复盘

2025-12-31 09:41:58 280

原创一键生成出海营销数字人！GLM-4.7+Claude Code可以封神了～

摘要：作者"袋鼠帝"利用GLM-4.7、Codex和ClaudeCode在一天内开发出海外营销数字人短视频生成平台MVP。GLM-4.7在编程、Agent能力等方面有显著提升，包括前端美观度、全栈开发能力和工具调用性能。开发过程强调需求梳理的重要性，通过AI辅助完成1300行需求文档。最终产品整合TTS、图像生成等AI能力，实现低成本数字人视频制作。作者认为AI时代关键在于快速验证需求，并分享了接入ClaudeCode和Codex的具体配置方法。

2025-12-29 14:59:03 429

原创挖到M2.1的7个神仙用法，有点上头。。

Minimax-M2.1多语言编程能力大幅提升，可以顺畅开发任意工具啦～

2025-12-29 14:19:11 648

原创招了个AI设计员工，我的一人公司终于配齐了设计部！【附6大用法】

【摘要】一位从程序员转型的自媒体博主分享AI设计工具Lovart的实战应用。通过六个场景展示：1）快速生成多平台封面图并自由编辑文字；2）制作专属IP表情包并精准修改；3）虚拟形象一键换装；4）产品效果图自动适配场景；5）元素分层编辑实现稳定改图；6）自动生成视频分镜。博主强调这款月活超千万的设计Agent（TextEdit/TouchEdit/Mockup/EditElements四大功能）能替代传统设计流程，帮助"超级个体"用1/10成本获得专业设计产出，实现"一人即团队&

2025-12-12 21:54:29 541

原创重磅！今年最好的开源9B/106B视觉模型，出现了

GLM-4.6V，今年本地Agent最后的视觉救星来了，附一手实测

2025-12-08 21:05:50 770

原创 SEO已死，GEO当立！啃完普林斯顿论文，我挖到了8条神级打法。

大家好，我是袋鼠帝。今天想跟大家聊聊最近很火的一个新概念：GEO

2025-12-04 01:04:59 634

原创强化Dify！还支持MCP，这款开源AI数据库绝了～【附喂饭级教程】

All In One 企业级AI数据库，兼容MySQL，仅需1核2G配置！本地知识库有救了

2025-12-04 00:45:14 946

原创最强国产AI IDE：Trae Solo中国版来了！完全免费～

等了4个月，Trae Solo中国版，终于来了。支持多任务并行执行、SubAgent、Plan等...

2025-11-26 23:42:47 814

原创放弃n8n！飞书多维表格才是效率的神，确实太好用了～【附喂饭级教程】

最近用过最好用的效率工具，「附教程」小白也能轻松上手～

2025-11-24 20:22:56 841

原创突然理解为什么会有数字生命计划了...

世界破破烂烂，幸好有第二个我在缝缝补补。

2025-11-20 14:56:50 776

原创阿里悄悄发布了一款全新的AI App。

阿里终于在AI App上发力了～

2025-11-17 14:52:55 554

原创最强开源0.9B级OCR模型！PaddleOCR-VL本地一键部署，私密性拉满【喂饭级教程】

哇！竟然支持OpenAI API格式，可轻松接入n8n/Fastgpt/Dify等，迈出拯救本地Agent、知识库的第一步

2025-11-16 08:47:11 1328

原创豆包也开始抢程序员饭碗了，一个月只要9块9。。

字节跳动推出首款编程模型Doubao-Seed-Code，具备256K超长上下文和视觉理解能力，可处理中大型项目和多模态输入。该模型表现亮眼，能完成复杂编程任务如3D网页游戏开发，并支持图片需求识别。API定价亲民，提供9.9元首月套餐，性价比突出。测试显示其改bug能力优于部分竞品，特别在多轮对话后效果更佳。虽然未达全球顶尖水平，但填补了国产编程模型在视觉理解和长上下文方面的空白，为开发者提供了实用工具。

2025-11-13 21:59:46 885

原创 Cursor可以删了？美团悄悄上线了个更香的平替～

美团发布自研AI编程工具CatPaw，定位为Cursor的国内替代品。CatPaw沿用了Cursor的交互逻辑，提供Ask/Agent双模式开发体验，并针对国内开发者优化：完全中文界面、解决网络访问问题、支持国产大模型（GLM-4等）。其特色功能包括文档学习（类似Cursor的@Docs）、自定义Agent、对话收藏和内置单元测试。实测显示，使用CatPaw的LongCat-Flash模型能快速完成全栈项目开发，并支持自动化测试闭环。相较于Cursor，CatPaw在功能完整性、本地化适配和使用成本方面更具

2025-11-13 21:36:07 1012

原创全网AI看不到的爱心，被这款开源全模态模型攻克了。。

你戴着它走在街上，它实时看到你所看到的画面，实时听到你所听到的声音，能够通过眼镜架上的扬声器悄悄跟你对话，要是再接上脑机接口，你还能通过意念跟它沟通，那不是妥妥在身上挂了个萧炎的药老？我们就像和真人一样，和AI面对面地交流，它能看到我们的世界，理解我们的处境，听懂我们的情绪，然后帮我们搞定一切。我当时给建议就是，得搞一个那种长着"眼睛"，"耳朵"的AI工具，然后挂身上实时感知小朋友的各种情况，才可能凑效。第二阶段（Stage-1），开始盖房子的主体框架，在保留文本能力的同时，加入语音数据，让它学会听说。

2025-11-08 09:29:18 666

原创 Dify迎来最强开源对手！这个本地Agent内置微调+超细权限控制~

摘要：LazyCraft是一款新开源的企业级AIAgent开发平台，针对Dify在实际业务场景中的不足进行了优化。该平台提供完整的闭环系统，包含多租户管理、细粒度权限控制、本地模型微调、模型评测等功能，支持私有化部署。相比Dify，LazyCraft在权限管理（支持多工作空间和角色权限）、本地模型支持（含微调和评测）、工具集成（支持远程和本地MCP）等方面表现更优，特别适合有数据隐私和定制需求的企业。平台采用docker-compose快速部署，内置23个功能模块的应用搭建画布，为企业AI应用开发提供全链路

2025-11-06 16:15:20 1107

原创快手公开最新推荐算法！强烈推荐一读。

短视频平台为何比你更懂你？揭秘快手EMER推荐算法短视频平台精准推送背后是快手最新公开的EMER算法。这套端到端多目标排序融合框架通过78个维度评估用户满意度，而非传统单一指标。其创新在于：采用相对排序机制，比较候选视频间关系动态调整各目标权重，实现自我进化解决离在线一致性难题，引入单位时间互动概率指标 EMER上线后使快手留存率和观看时长显著提升。对用户而言，优质内容更易被推荐；对创作者来说，小众精品内容获得更多展示机会。

2025-11-02 15:03:32 797

原创只打巅峰赛！MiniMax-M2配CodeX我太爱了～

MiniMax发布新一代旗舰模型MiniMax-M2，专注编程和Agent任务。该230B参数的开源模型支持200K token上下文，性能全球前五，价格仅为竞品的8%。实测显示M2在编程、3D建模、游戏开发等方面表现优异，成功实现了复杂的公众号文章同步插件开发。MiniMax凭借语音模型全球第一、视频模型第二的实力，结合自家Agent平台，展现出成为最强通用AI开发者的潜力。目前M2 API提供14天全球免费试用，性价比和稳定性俱佳。

2025-11-02 14:27:56 640

原创最强开源0.9B级OCR模型！本地Agent、知识库都有救了～

百度开源多模态文档解析模型PaddleOCR-VL，仅0.9B参数量却表现强劲。在国际评测中超越GPT-4o等大模型，在文本识别、表格解析等任务上表现优异。实测显示其能准确处理发票、医疗报告、古籍等复杂文档，支持多语言识别和图表转换。模型采用两阶段处理策略，先定位文档元素再并行识别内容，兼顾效率与准确性。该模型特别适合本地部署，可应用于医疗、法务等离线场景。未来还能集成到知识库系统中，提升多模态数据处理能力。

2025-10-17 19:07:33 917

原创这款国产编程模型在海外杀疯了！接入Claude Code是真香～

你好，我是袋鼠帝。我是真没想到，AI圈能卷到这种程度。。国庆前，Anthropic发布了Claude4.5，智谱这边也放了个大招，全面开源了他们目前最强的模型：GLM-4.6。真是不让人消停啊。最后决定还是给自己放放假，好好休息一下不过在老家待几天后，就开始有点无聊（好多同学、朋友都不在老家了）。说出来你可能不信，我无聊到开始跑Case（人还是要给自己找点事儿）。主要想看看，目前市面上哪个大模型跑出来的代码效果最好，反正也是把Prompt丢过去，几分钟后看效果。我选择了几个我常用的模型，国外的

2025-10-15 15:54:43 852

原创感谢Lovart，拯救了我这个理工男的审美和创意～

过去，像我这种AI创作者，有点像是在打游击站。哪里出了个新模型好像很🐂🍺，就去哪里注册个账号，玩几天。我们的账号，我们的积分，我们的创作历史，都分散在很多个不同的网站上（比如即梦，flux，可灵，海螺等等）。每天都要花大量的时间，去追新的模型，去试用，去切换，生怕错过了最新的SOTA模型。而Lovart这样的全家桶平台，能够结束这种混乱的状态。它能够快速上新在设计领域的SOTA模型并且所有的设计都在同一个地方，不管是图片还是视频。

2025-09-19 00:19:11 1107

原创凭什么？豆包Seedream4.0登顶全球第一，20+邪修玩法告诉你有多牛

就在昨晚，seedream4.0又在LMArena文生图上升到第一，图像编辑到第二，而且LMArena是开放问题，难度更高。说实话，国产模型，能在海外的专业榜单上，力压群雄，拿下三个第一，一个第二，这绝对的技术硬实力。

2025-09-18 23:54:14 888

原创腾讯出手了！首款国产AI CLI真有点猛，支持微信登录～

袋鼠帝分享使用腾讯AI编程工具CodeBuddyCode的体验：成功开发了隔空手势控制网页的油猴插件、全栈活动报名网站和公众号文章转Markdown工具。该工具支持自然语言编程，能自动修复bug，提供全流程开发支持，包括项目部署(如成功部署腾讯开源项目WeKnora)。CodeBuddyCode分国内版(支持DeepSeek)和国际版(支持Claude/Gemini)，安装简单(npm安装)。作者认为该工具既适合新手入门，也能满足专业开发者需求，是腾讯布局AI编程领域的重要产品。

2025-09-09 23:52:33 1095

原创还得是阿里！首款会做生意的Agent来了【附邀请码】

《AI助力跨境采购：Accio Agent让一人跨国公司成为可能》摘要：随着出海热潮兴起，AI技术博主袋鼠帝发现了一款名为Accio的跨境采购AI工具。这款面向海外买家的B2B应用，基于阿里国际站20年贸易数据开发，能独立完成从市场调研到产品设计、供应商匹配的全流程。实测显示，Accio在9分钟内就能完成AI健康戒指的产品开发方案，包括市场分析、竞品调研、产品渲染图等；还能快速分析TikTok爆款并生成改良设计，以及为宠物品牌提供多品类采购方案。其核心优势在于将传统需要数周的采购流程压缩到几分钟，让个人创

2025-08-15 09:41:02 643

原创百度终于有一个能打的Agent了！让我极度舒适～

摘要：百度文库内测的通用Agent工具GenFlow凭借强大的多任务处理能力引发关注。该工具可同时生成PPT、报告、海报等办公文档，支持在线编辑和分享，完美适配国内用户习惯。实测显示，GenFlow能在3分钟内完成包含2万字报告、30页PPT的复杂任务，且质量接近专业水准。其特色功能包括：与百度网盘联动调用个性化知识库、任务执行中随时干预、长时记忆等。相比国外竞品，GenFlow无需科学上网，使用门槛更低，目前已集成在百度文库App中，展现了百度在AI办公赛道的务实布局。

2025-08-12 14:22:21 974

原创起猛了，这个Agent搞定全栈+支付，还能自己找Bug？

AI Agent这个概念被聊了很久，但很多产品给我的感觉，要么是玩具，要么是半成品。MiniMax Agent是真正能带来生产力的Agent，而且他们迭代很快。

2025-08-12 12:41:50 836

原创 GPT-OSS-120B和GLM-4.5-Air，选哪一个？一手实测，终极二选一

OpenAI最新开源GPT-OSS120B模型引发热议，本文将其与国产GLM-4.5-Air进行多维度实测对比。测试显示：在复杂推理和指令遵循方面，GPT-OSS120B表现优异；但在代码生成能力上存在明显短板。

2025-08-07 17:18:36 949

原创一键云部署Coze后，用它终结了当代年轻人的看病PTSD【含喂饭级教程】

PromptPilot应该是目前工程化生成Prompt最好用的工具了，没有之一，功能非常完善：包括从引导用户需求初步创建Prompt，再到批量测试Prompt性能边界，最后持续优化，通过这种严格的工程化流程做出来的Prompt才是经得起生产环境考验的稳定Prompt。导致我在CT室外又忍痛等了好久。2.使用开源Coze对外提供付费服务的人群，要对外提供服务，本来就要部署到云服务器，与其自己去搞部署，还不如交给火山引擎，省心又方便，而且毕竟Coze本来就是他们自家的，火山肯定是最懂Coze的云。

2025-08-05 14:55:24 829

原创腾讯出手了！彻底入局Agent

坦白说，在深度评测后，腾讯云智能体开发平台给了我不少惊喜。它不是一个功能的简单堆砌，我能清晰地看到它背后对于企业级Agent的深刻思考。无论是RAG，还是多工具调用，多Agent协同框架，以及带有全局视野Agent的工作流，都做的不错，能稳定保质的完成预期任务。

2025-08-04 20:53:24 1073

原创 AI教父「辛顿」WAIC刷屏背后，是一场持续了13年的AI豪赌【附完整PPT】

提到百度，别再只想到百度搜索和百度网盘。他们真的还做了更多有意思的应用，有意义的事情他们搭建了像飞桨（PaddlePaddle）这样的底层框架，让中国的开发者有了自己的工具库。推出了文心杯这样的创业大赛，真金白银的扶持AI领域的创业者。培养了上千万的AI人才，为整个行业输送着新鲜血液。

2025-08-04 13:59:17 619

原创最强开源模型深夜爆火！GLM-4.5接入Claude Code直接起飞～

【国产大模型GLM-4.5实测体验：性能比肩Claude4，价格仅零头】智谱AI最新开源的GLM-4.5模型采用混合专家架构，包含3550亿和1060亿参数两个版本，在12项权威评测中斩获全球第三、国产第一的成绩。实测显示其代码生成能力已超越Claude4，2分钟内可完成复杂医疗咨询平台开发，并能无缝接入ClaudeCode框架。相比Claude4高昂的API费用（输入21.5元/百万tokens），GLM-4.5仅需2元/8元（输入/输出），性价比优势显著。目前智谱推出50元包月畅玩活动，开发者可无限调

2025-08-02 13:49:31 1685

原创阿里领投上亿！这款企业级Agent平台BetterYeah，细节太恐怖了..

《BetterYeah：AI智能体平台的新星》摘要：近期WAIC大会上备受关注的BetterYeah平台，凭借"用嘴创建Agent"的创新功能和企业级解决方案成为AI领域新焦点。该平台支持自然语言指令快速构建智能体，提供结构化提示词优化、多模型对比测试和细粒度权限控制等企业级功能。通过演示中医助手和舆情监测专员案例，展现了从开发到落地的全流程支持。平台获得阿里云亿元投资，其多智能体协作和持续学习能力代表了AI数字团队的未来方向，为企业和个人提供了高效创建数字同事的创新工具。

2025-08-01 16:37:09 677

原创最强开源9B级VLM模型！本地视觉Agent有救了～

视觉小模型，快、准

2025-07-02 15:46:39 1514

原创 DeepSeek用户慎入！体验完这款百万Tokens新“源神“，我怕你回不去了【附5个神仙用法】

5种神仙用法，AI知识库的玩法也变了

2025-06-18 10:28:34 654

原创再见Manus，热恋2个月，我们都该冷静冷静了

要求如下：场景包括：- 古埃及：猫咪作为神灵被崇拜，戴着法老头饰、中国唐朝：猫咪穿着华丽的唐装，在长安城漫步、文艺复兴时期：猫咪穿着复古服装，在达芬奇工作室里、维多利亚时代：猫咪戴着小礼帽，在英国贵族庄园喝下午茶、二战时期：猫咪戴着飞行员护目镜，坐在老式战斗机座舱里、80年代：猫咪留着爆炸头，穿着霓虹色衣服，背景是复古霓虹灯风格：写实风，细节丰富，确保猫咪表情生动。Skywork的表现如下，图文并茂，排版样式都很棒，看起来清爽又高级，我感觉，按照人类制作PPT的标准，起码都是一个80分的PPT了。

2025-05-22 17:21:21 1052

原创一手体验首款「超级搜索」：这才是AI搜索的终极形态

2.集成了MCP万能工具箱，提供数千种专为AI打造的工具，不仅能搜网页（小红书、电商比价信息、地图信息、国内外权威文库），还可以抓取图片、视频、图表、PDF等多种格式的文件，代码生成、数据分析等等。工程化、用户体验都做的很棒，包括深度研究和超级智能体的结合，极大的提升了人类从信息获取到，信息整理，数据分析，获取结果的效率。更棒的是还可以在预览的右上角，点击分享，复制互联网可访问的链接。这样的超级搜索，最终交付的是一个图文并茂的结果，而不是简单的总结搜索到的信息，这点比普通AI搜索强太多了。

2025-05-19 20:59:13 1254

原创一周内斩获20K Star！这款国产开源AI在海外杀疯了

小模型虽然在性能上无法跟大参数量的模型相比，但Qwen3的每款模型均斩获同尺寸开源模型SOTA（最佳性能）最难得的一点是可以以超低的成本去进行进一步的训练、微调，打造适配需求和业务的垂类大模型，关键可以毫无压力的本地部署，内网使用，安全私密，不怕信息泄露。我本地电脑用的Mac，配置是M2芯片+24G内存（Mac的M系列芯片GPU和CPU是共用一个内存的）意味着我的GPU可使用内存就是24G 我几乎尝试了，所有理论上我能跑的Qwen3尺寸（如下图）官方给出的数据显示，它如果不思考，可节约600%的算力！

2025-05-09 22:54:30 1105

空空如也

空空如也