- 博客(46)
- 收藏
- 关注
原创 一键生成出海营销数字人!GLM-4.7+Claude Code可以封神了~
摘要:作者"袋鼠帝"利用GLM-4.7、Codex和ClaudeCode在一天内开发出海外营销数字人短视频生成平台MVP。GLM-4.7在编程、Agent能力等方面有显著提升,包括前端美观度、全栈开发能力和工具调用性能。开发过程强调需求梳理的重要性,通过AI辅助完成1300行需求文档。最终产品整合TTS、图像生成等AI能力,实现低成本数字人视频制作。作者认为AI时代关键在于快速验证需求,并分享了接入ClaudeCode和Codex的具体配置方法。
2025-12-29 14:59:03
429
原创 招了个AI设计员工,我的一人公司终于配齐了设计部!【附6大用法】
【摘要】一位从程序员转型的自媒体博主分享AI设计工具Lovart的实战应用。通过六个场景展示:1)快速生成多平台封面图并自由编辑文字;2)制作专属IP表情包并精准修改;3)虚拟形象一键换装;4)产品效果图自动适配场景;5)元素分层编辑实现稳定改图;6)自动生成视频分镜。博主强调这款月活超千万的设计Agent(TextEdit/TouchEdit/Mockup/EditElements四大功能)能替代传统设计流程,帮助"超级个体"用1/10成本获得专业设计产出,实现"一人即团队&
2025-12-12 21:54:29
541
原创 强化Dify!还支持MCP,这款开源AI数据库绝了~【附喂饭级教程】
All In One 企业级AI数据库,兼容MySQL,仅需1核2G配置!本地知识库有救了
2025-12-04 00:45:14
946
原创 最强国产AI IDE:Trae Solo中国版来了!完全免费~
等了4个月,Trae Solo中国版,终于来了。支持多任务并行执行、SubAgent、Plan等...
2025-11-26 23:42:47
814
原创 最强开源0.9B级OCR模型!PaddleOCR-VL本地一键部署,私密性拉满【喂饭级教程】
哇!竟然支持OpenAI API格式,可轻松接入n8n/Fastgpt/Dify等,迈出拯救本地Agent、知识库的第一步
2025-11-16 08:47:11
1328
原创 豆包也开始抢程序员饭碗了,一个月只要9块9。。
字节跳动推出首款编程模型Doubao-Seed-Code,具备256K超长上下文和视觉理解能力,可处理中大型项目和多模态输入。该模型表现亮眼,能完成复杂编程任务如3D网页游戏开发,并支持图片需求识别。API定价亲民,提供9.9元首月套餐,性价比突出。测试显示其改bug能力优于部分竞品,特别在多轮对话后效果更佳。虽然未达全球顶尖水平,但填补了国产编程模型在视觉理解和长上下文方面的空白,为开发者提供了实用工具。
2025-11-13 21:59:46
885
原创 Cursor可以删了?美团悄悄上线了个更香的平替~
美团发布自研AI编程工具CatPaw,定位为Cursor的国内替代品。CatPaw沿用了Cursor的交互逻辑,提供Ask/Agent双模式开发体验,并针对国内开发者优化:完全中文界面、解决网络访问问题、支持国产大模型(GLM-4等)。其特色功能包括文档学习(类似Cursor的@Docs)、自定义Agent、对话收藏和内置单元测试。实测显示,使用CatPaw的LongCat-Flash模型能快速完成全栈项目开发,并支持自动化测试闭环。相较于Cursor,CatPaw在功能完整性、本地化适配和使用成本方面更具
2025-11-13 21:36:07
1012
原创 全网AI看不到的爱心,被这款开源全模态模型攻克了。。
你戴着它走在街上,它实时看到你所看到的画面,实时听到你所听到的声音,能够通过眼镜架上的扬声器悄悄跟你对话,要是再接上脑机接口,你还能通过意念跟它沟通,那不是妥妥在身上挂了个萧炎的药老?我们就像和真人一样,和AI面对面地交流,它能看到我们的世界,理解我们的处境,听懂我们的情绪,然后帮我们搞定一切。我当时给建议就是,得搞一个那种长着"眼睛","耳朵"的AI工具,然后挂身上实时感知小朋友的各种情况,才可能凑效。第二阶段(Stage-1),开始盖房子的主体框架,在保留文本能力的同时,加入语音数据,让它学会听说。
2025-11-08 09:29:18
666
原创 Dify迎来最强开源对手!这个本地Agent内置微调+超细权限控制~
摘要:LazyCraft是一款新开源的企业级AIAgent开发平台,针对Dify在实际业务场景中的不足进行了优化。该平台提供完整的闭环系统,包含多租户管理、细粒度权限控制、本地模型微调、模型评测等功能,支持私有化部署。相比Dify,LazyCraft在权限管理(支持多工作空间和角色权限)、本地模型支持(含微调和评测)、工具集成(支持远程和本地MCP)等方面表现更优,特别适合有数据隐私和定制需求的企业。平台采用docker-compose快速部署,内置23个功能模块的应用搭建画布,为企业AI应用开发提供全链路
2025-11-06 16:15:20
1107
原创 快手公开最新推荐算法!强烈推荐一读。
短视频平台为何比你更懂你?揭秘快手EMER推荐算法 短视频平台精准推送背后是快手最新公开的EMER算法。这套端到端多目标排序融合框架通过78个维度评估用户满意度,而非传统单一指标。其创新在于: 采用相对排序机制,比较候选视频间关系 动态调整各目标权重,实现自我进化 解决离在线一致性难题,引入单位时间互动概率指标 EMER上线后使快手留存率和观看时长显著提升。对用户而言,优质内容更易被推荐;对创作者来说,小众精品内容获得更多展示机会。
2025-11-02 15:03:32
797
原创 只打巅峰赛!MiniMax-M2配CodeX我太爱了~
MiniMax发布新一代旗舰模型MiniMax-M2,专注编程和Agent任务。该230B参数的开源模型支持200K token上下文,性能全球前五,价格仅为竞品的8%。实测显示M2在编程、3D建模、游戏开发等方面表现优异,成功实现了复杂的公众号文章同步插件开发。MiniMax凭借语音模型全球第一、视频模型第二的实力,结合自家Agent平台,展现出成为最强通用AI开发者的潜力。目前M2 API提供14天全球免费试用,性价比和稳定性俱佳。
2025-11-02 14:27:56
640
原创 最强开源0.9B级OCR模型!本地Agent、知识库都有救了~
百度开源多模态文档解析模型PaddleOCR-VL,仅0.9B参数量却表现强劲。在国际评测中超越GPT-4o等大模型,在文本识别、表格解析等任务上表现优异。实测显示其能准确处理发票、医疗报告、古籍等复杂文档,支持多语言识别和图表转换。模型采用两阶段处理策略,先定位文档元素再并行识别内容,兼顾效率与准确性。该模型特别适合本地部署,可应用于医疗、法务等离线场景。未来还能集成到知识库系统中,提升多模态数据处理能力。
2025-10-17 19:07:33
917
原创 这款国产编程模型在海外杀疯了!接入Claude Code是真香~
你好,我是袋鼠帝。 我是真没想到,AI圈能卷到这种程度。。 国庆前,Anthropic发布了Claude4.5,智谱这边也放了个大招,全面开源了他们目前最强的模型:GLM-4.6。真是不让人消停啊。 最后决定还是给自己放放假,好好休息一下 不过在老家待几天后,就开始有点无聊(好多同学、朋友都不在老家了)。说出来你可能不信,我无聊到开始跑Case(人还是要给自己找点事儿)。 主要想看看,目前市面上哪个大模型跑出来的代码效果最好,反正也是把Prompt丢过去,几分钟后看效果。 我选择了几个我常用的模型,国外的
2025-10-15 15:54:43
852
原创 感谢Lovart,拯救了我这个理工男的审美和创意~
过去,像我这种AI创作者,有点像是在打游击站。哪里出了个新模型好像很🐂🍺,就去哪里注册个账号,玩几天。我们的账号,我们的积分,我们的创作历史,都分散在很多个不同的网站上(比如即梦,flux,可灵,海螺等等)。每天都要花大量的时间,去追新的模型,去试用,去切换,生怕错过了最新的SOTA模型。而Lovart这样的全家桶平台,能够结束这种混乱的状态。它能够快速上新在设计领域的SOTA模型并且所有的设计都在同一个地方,不管是图片还是视频。
2025-09-19 00:19:11
1106
原创 凭什么?豆包Seedream4.0登顶全球第一,20+邪修玩法告诉你有多牛
就在昨晚,seedream4.0又在LMArena文生图上升到第一,图像编辑到第二,而且LMArena是开放问题,难度更高。说实话,国产模型,能在海外的专业榜单上,力压群雄,拿下三个第一,一个第二,这绝对的技术硬实力。
2025-09-18 23:54:14
888
原创 腾讯出手了!首款国产AI CLI真有点猛,支持微信登录~
袋鼠帝分享使用腾讯AI编程工具CodeBuddyCode的体验:成功开发了隔空手势控制网页的油猴插件、全栈活动报名网站和公众号文章转Markdown工具。该工具支持自然语言编程,能自动修复bug,提供全流程开发支持,包括项目部署(如成功部署腾讯开源项目WeKnora)。CodeBuddyCode分国内版(支持DeepSeek)和国际版(支持Claude/Gemini),安装简单(npm安装)。作者认为该工具既适合新手入门,也能满足专业开发者需求,是腾讯布局AI编程领域的重要产品。
2025-09-09 23:52:33
1095
原创 还得是阿里!首款会做生意的Agent来了【附邀请码】
《AI助力跨境采购:Accio Agent让一人跨国公司成为可能》 摘要:随着出海热潮兴起,AI技术博主袋鼠帝发现了一款名为Accio的跨境采购AI工具。这款面向海外买家的B2B应用,基于阿里国际站20年贸易数据开发,能独立完成从市场调研到产品设计、供应商匹配的全流程。实测显示,Accio在9分钟内就能完成AI健康戒指的产品开发方案,包括市场分析、竞品调研、产品渲染图等;还能快速分析TikTok爆款并生成改良设计,以及为宠物品牌提供多品类采购方案。其核心优势在于将传统需要数周的采购流程压缩到几分钟,让个人创
2025-08-15 09:41:02
643
原创 百度终于有一个能打的Agent了!让我极度舒适~
摘要:百度文库内测的通用Agent工具GenFlow凭借强大的多任务处理能力引发关注。该工具可同时生成PPT、报告、海报等办公文档,支持在线编辑和分享,完美适配国内用户习惯。实测显示,GenFlow能在3分钟内完成包含2万字报告、30页PPT的复杂任务,且质量接近专业水准。其特色功能包括:与百度网盘联动调用个性化知识库、任务执行中随时干预、长时记忆等。相比国外竞品,GenFlow无需科学上网,使用门槛更低,目前已集成在百度文库App中,展现了百度在AI办公赛道的务实布局。
2025-08-12 14:22:21
974
原创 起猛了,这个Agent搞定全栈+支付,还能自己找Bug?
AI Agent这个概念被聊了很久,但很多产品给我的感觉,要么是玩具,要么是半成品。MiniMax Agent是真正能带来生产力的Agent,而且他们迭代很快。
2025-08-12 12:41:50
836
原创 GPT-OSS-120B和GLM-4.5-Air,选哪一个? 一手实测,终极二选一
OpenAI最新开源GPT-OSS120B模型引发热议,本文将其与国产GLM-4.5-Air进行多维度实测对比。测试显示:在复杂推理和指令遵循方面,GPT-OSS120B表现优异;但在代码生成能力上存在明显短板。
2025-08-07 17:18:36
949
原创 一键云部署Coze后,用它终结了当代年轻人的看病PTSD【含喂饭级教程】
PromptPilot应该是目前工程化生成Prompt最好用的工具了,没有之一,功能非常完善:包括从引导用户需求初步创建Prompt,再到批量测试Prompt性能边界,最后持续优化,通过这种严格的工程化流程做出来的Prompt才是经得起生产环境考验的稳定Prompt。导致我在CT室外又忍痛等了好久。2.使用开源Coze对外提供付费服务的人群,要对外提供服务,本来就要部署到云服务器,与其自己去搞部署,还不如交给火山引擎,省心又方便,而且毕竟Coze本来就是他们自家的,火山肯定是最懂Coze的云。
2025-08-05 14:55:24
829
原创 腾讯出手了!彻底入局Agent
坦白说,在深度评测后,腾讯云智能体开发平台给了我不少惊喜。它不是一个功能的简单堆砌,我能清晰地看到它背后对于企业级Agent的深刻思考。无论是RAG,还是多工具调用,多Agent协同框架,以及带有全局视野Agent的工作流,都做的不错,能稳定保质的完成预期任务。
2025-08-04 20:53:24
1073
原创 AI教父「辛顿」WAIC刷屏背后,是一场持续了13年的AI豪赌【附完整PPT】
提到百度,别再只想到百度搜索和百度网盘。他们真的还做了更多有意思的应用,有意义的事情他们搭建了像飞桨(PaddlePaddle)这样的底层框架,让中国的开发者有了自己的工具库。推出了文心杯这样的创业大赛,真金白银的扶持AI领域的创业者。培养了上千万的AI人才,为整个行业输送着新鲜血液。
2025-08-04 13:59:17
619
原创 最强开源模型深夜爆火!GLM-4.5接入Claude Code直接起飞~
【国产大模型GLM-4.5实测体验:性能比肩Claude4,价格仅零头】 智谱AI最新开源的GLM-4.5模型采用混合专家架构,包含3550亿和1060亿参数两个版本,在12项权威评测中斩获全球第三、国产第一的成绩。实测显示其代码生成能力已超越Claude4,2分钟内可完成复杂医疗咨询平台开发,并能无缝接入ClaudeCode框架。相比Claude4高昂的API费用(输入21.5元/百万tokens),GLM-4.5仅需2元/8元(输入/输出),性价比优势显著。目前智谱推出50元包月畅玩活动,开发者可无限调
2025-08-02 13:49:31
1685
原创 阿里领投上亿!这款企业级Agent平台BetterYeah,细节太恐怖了..
《BetterYeah:AI智能体平台的新星》摘要:近期WAIC大会上备受关注的BetterYeah平台,凭借"用嘴创建Agent"的创新功能和企业级解决方案成为AI领域新焦点。该平台支持自然语言指令快速构建智能体,提供结构化提示词优化、多模型对比测试和细粒度权限控制等企业级功能。通过演示中医助手和舆情监测专员案例,展现了从开发到落地的全流程支持。平台获得阿里云亿元投资,其多智能体协作和持续学习能力代表了AI数字团队的未来方向,为企业和个人提供了高效创建数字同事的创新工具。
2025-08-01 16:37:09
677
原创 再见Manus,热恋2个月,我们都该冷静冷静了
要求如下:场景包括:- 古埃及:猫咪作为神灵被崇拜,戴着法老头饰、中国唐朝:猫咪穿着华丽的唐装,在长安城漫步、文艺复兴时期:猫咪穿着复古服装,在达芬奇工作室里、维多利亚时代:猫咪戴着小礼帽,在英国贵族庄园喝下午茶、二战时期:猫咪戴着飞行员护目镜,坐在老式战斗机座舱里、80年代:猫咪留着爆炸头,穿着霓虹色衣服,背景是复古霓虹灯风格:写实风,细节丰富,确保猫咪表情生动。Skywork的表现如下,图文并茂,排版样式都很棒,看起来清爽又高级,我感觉,按照人类制作PPT的标准,起码都是一个80分的PPT了。
2025-05-22 17:21:21
1052
原创 一手体验首款「超级搜索」:这才是AI搜索的终极形态
2.集成了MCP万能工具箱,提供数千种专为AI打造的工具,不仅能搜网页(小红书、电商比价信息、地图信息、国内外权威文库),还可以抓取图片、视频、图表、PDF等多种格式的文件,代码生成、数据分析等等。工程化、用户体验都做的很棒,包括深度研究和超级智能体的结合,极大的提升了人类从信息获取到,信息整理,数据分析,获取结果的效率。更棒的是还可以在预览的右上角,点击分享,复制互联网可访问的链接。这样的超级搜索,最终交付的是一个图文并茂的结果,而不是简单的总结搜索到的信息,这点比普通AI搜索强太多了。
2025-05-19 20:59:13
1254
原创 一周内斩获20K Star!这款国产开源AI在海外杀疯了
小模型虽然在性能上无法跟大参数量的模型相比,但Qwen3的每款模型均斩获同尺寸开源模型SOTA(最佳性能) 最难得的一点是可以以超低的成本去进行进一步的训练、微调,打造适配需求和业务的垂类大模型,关键可以毫无压力的本地部署,内网使用,安全私密,不怕信息泄露。我本地电脑用的Mac,配置是M2芯片+24G内存(Mac的M系列芯片GPU和CPU是共用一个内存的) 意味着我的GPU可使用内存就是24G 我几乎尝试了,所有理论上我能跑的Qwen3尺寸(如下图)官方给出的数据显示,它如果不思考,可节约600%的算力!
2025-05-09 22:54:30
1105
原创 效果惊艳!MCP+腾讯云知识引擎,一个0门槛打造专属AI Agent的神器诞生~
MCP(Model Context Protocol)-模型上下文协议:其实就是一套制定好的大模型使用工具的规则,以后不管是工具的调用方,还是工具的制作方,都按照这套规则来走,那么后续制作出来的所有工具,都能无缝接入任意大模型。腾讯云的LKE才刚刚上线MCP不久,所以目前的内置的MCP工具还不算多,只有13个,但每个都挺实用的,搭配上他们贼棒的知识库RAG能力,应该可以满足不少应用场景了。说实话,任何新事物,光听懂了概念是不够的 如果没有实践过,脑子里面是无法把这个事情,或者工具 具象化的。
2025-04-19 10:34:24
777
原创 【战、面试官】java队列不行了?换成Disruptor吧!
本章主要讲Disruptor的一些优秀的设计思想,我们主要学习它的设计思想和实现思路。本文对Disruptor的学习起到一个抛砖引玉的作用,也集合了个人学习过程中查阅的一些资料。通过对本章以及相关资料的学习(当然最主要的还是要自己动手去实践,debug体会)...
2022-06-23 08:00:00
314
原创 【战、面试官】小伙子告诉我,为什么说FastThreadLocal是装上火箭的ThreadLocal?
最近比较低沉且颓废,但是还是要振作起来。fighting,本期给大家带来的是netty源码中对ThreadLocal的改造->FastThreadLocal。
2022-05-24 08:30:00
171
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅