大模型
文章平均质量分 91
烤鸭的世界我们不懂
烤鸭的世界我们不懂。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
赛博 coding 杀器集结!AI 编程黑科技工具炸裂分享
AI编程工具测评:Claude、Cursor、Trae、Comate、ByteBuddy、Lingma对比 本文测评了当前主流AI编程工具,重点比较了Claude、Cursor和Trae三款产品。Claude作为通用型AI助手在逻辑处理上表现突出,但国内使用受限;Cursor基于VS Code重构,支持本地模型运行,适合隐私敏感项目;字节跳动的Trae则定位本地AI编辑器,对国内开发者更友好。原创 2025-11-28 07:45:00 · 1899 阅读 · 0 评论 -
langchain搭建智能体-更好的理解上下文管理
本文介绍了AI学习路径中的上下文工程,以LangChain为例探讨了上下文管理的演变与应用。文章指出,从单次对话到多任务协作,上下文管理经历了提示词工程到上下文工程的演进,后者更关注输入结构的系统设计。文章总结了Drew Breunig提出的四类上下文失败问题(中毒、干扰、混淆、冲突),并分析了LangChain中的记忆机制(短期/长期记忆)。最后通过代码示例展示了LangGraph在并行无上下文和有上下文场景下的应用,说明了上下文管理在智能体协作中的重要性。原创 2025-10-29 07:45:00 · 1908 阅读 · 0 评论 -
开源 Agent 平台部署全流程:从环境准备到启动运行
大家好,我是烤鸭: 前几天写了一个agent的文章,https://blog.youkuaiyun.com/Angry_Mills/article/details/151369785,今天打算写一篇开源agent的平台dify的非docker部署和aiflowy部署。原创 2025-09-17 07:45:00 · 1312 阅读 · 0 评论 -
一文讲懂agent&搭建一款属于自己的智能体
大家好,我是烤鸭:最近除了研究开源模型和工具调用,也在看智能体相关,再好的模型或者代码都只是工具,想要有生产力还是得上价值(智能体),谁不想要一个可以7*24h工作的AI助手(牛马)呢。原创 2025-09-11 07:45:00 · 943 阅读 · 0 评论 -
通义万相2.2-图/文生视频深度体验:附源码
大家好,我是烤鸭: 鲨疯了,最近陆续几个重磅开源,阿里云和openai陆续加入了战场,都是非商用显卡可以跑的,太炸裂了。文本模型: openai_gpt-oss 文本生成,文生图:Qwen-Image文生图,文/图生视频: 通义万相2.2-图生视频。今天重点体验一下 通义万相2.2文/图生视频。原创 2025-09-09 07:45:00 · 1228 阅读 · 0 评论 -
开源王者 Qwen-Image-Edit:图生图实战代码独家分享
通义千问最新推出的图像编辑模型Qwen-Image-Edit的使用体验,该模型支持图生图功能,效果强大且支持家用4090显卡运行。模型开源地址和示例代码均已给出。原创 2025-09-05 07:30:00 · 677 阅读 · 0 评论 -
从理论到代码:Qwen2.5-vl 视觉识别技术的应用落地思路(含源码)
识别图片或者视频如何使用,在哪些场景比较适合。这里说一个可能应用的场景,如果你有素材,无论是自己拍摄的还是网络上找到的,怎么快速变成自己风格的内容。具体点的案例,做一个主题是某个热点新闻(苏超之类的)的某红书的图文或者视频内容。原创 2025-07-23 07:45:00 · 621 阅读 · 0 评论 -
别再重复劳动!浏览器自动化实战: browser-use
大家好,我是烤鸭:最近在研究AI的落地应用,满世界都在做AI,以前还在研究大模型、GPT,现在都变成了agent、mcp。manus公布了3天就销声匿迹了,今天看下manus的前置开源工具browser-use。原创 2025-04-27 08:00:00 · 786 阅读 · 0 评论 -
一文了解transformer(通俗易懂版本)
最近看transformer太难懂了,就想写一篇简单的能看懂的,transformer是如何工作的。本篇不会过渡研究算法, 那玩意一般人也看不懂。原创 2025-04-14 08:00:00 · 1234 阅读 · 0 评论 -
DeepSeek本地部署:轻松搭建专属代码助手
大家好,我是烤鸭: 差不多一年没写文章了,幸运的是还没失业,不过早晚会被AI取代。最近deepseek实在太火了,也来蹭一下热度。利用deepseek-r1和qwen2.5-coder搭建自己的代码助手,vscode和idea都可以用。原创 2025-02-08 18:19:36 · 2229 阅读 · 0 评论 -
Python + WhisperX:解锁语音识别的高效新姿势
大家好,我是烤鸭: 最近在尝试做视频的质量分析,打算利用asr针对声音判断是否有人声,以及识别出来的文本进行进一步操作。asr看了几个开源的,最终选择了openai的whisper,后来发现性能不行,又换了whisperX。这是一篇实战和代码为主的文章。原创 2025-02-11 07:45:00 · 2738 阅读 · 2 评论 -
超乎想象的精准—探索Qwen2.5-vl的识别魔法
大家好,我是烤鸭:今天写一篇使用开源的视频模型来进行图像/视频识别,使用的是千问模型qwen-vl-2B。原创 2025-03-17 07:45:00 · 1765 阅读 · 0 评论 -
从规划到执行,从源码角度看Manus如何一手掌控
大家好,我是烤鸭:前几天manus很火,不过最近几天降温了,动机也被人质疑。更可怕的是,发布3小时就有其他团队做了开源版,今天就来看看这个open-manus。原创 2025-03-20 00:47:43 · 1139 阅读 · 0 评论
分享