自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(31)
  • 收藏
  • 关注

原创 [特殊字符]颠覆MCP!Open WebUI新技术mcpo横空出世!支持ollama!轻松支持各种MCP Server!Cline+Claude3.7轻松开发论文检索MCP Server!

MCPo 是一个简单、可靠的代理服务器,能够将任何基于 MCP 协议的工具转换为兼容 OpenAPI 的 HTTP 服务器。它通过标准化 RESTful API 接口,让复杂的工具变得易于使用,并支持与大语言模型(LLM)代理和应用程序的无缝交互。

2025-04-03 22:35:34 541

原创 [特殊字符]超越cursor!Roo Code+Gemini 2.5 Pro为OpenAI Agents SDK开发工作流UI!轻松拖动组件即可搭建工作流!小白也能化身软件工程师

🚀🚀🚀本篇笔记所对应的视频: 🚀超越cursor!Roo Code+Gemini 2.5 Pro为OpenAI Agents SDK开发工作流UI!轻松拖动组件即可搭建工作流!_哔哩哔哩_bilibiliRoo Code 是一款集成于 VS Code 的 AI 编程助手,能显著提高开发效率。它支持多种大模型,自动生成高质量代码,提供智能补全、实时错误检测与调试辅助,从而大大缩短开发周期。其命令行交互和自动化测试功能使得复杂任务简单易行,同时免费额度充足、生成速度快,减少了因频繁调用接口带来的成本和延

2025-03-31 21:48:11 559

原创 [特殊字符]Gemini 2.5 Pro震撼发布!OCR能力碾压一切AI大模型!全方位客观测评:轻松识别手写汉字,准确提取复杂表格,准确率百分百!超越o3-mini与gpt4.5

谷歌DeepMind昨天发布了全新大模型Gemini 2.5 Pro,这款被称为“思考型”模型的AI不仅在数学、科学和代码生成等各项基准测试中表现卓越,更以超长上下文和原生多模态能力引领了智能模型的新潮流。从LMArena排行榜上以40分优势横扫竞争对手,到在SWE-Bench Verified测试中获得63.8%的高分,Gemini 2.5 Pro正向市场证明:未来的AI不仅仅是“秒回”,而是真正具备深度推理与决策能力的“智慧大脑”。

2025-03-26 14:51:05 437

原创 [特殊字符]DeepSeek 6850亿参数开源大模型!DeepSeek-V3-0324全方位测评!编程能力、文档分析、复杂推理能力、Text-to-SQL能力!

昨天晚上DeepSeek推出其最新模型DeepSeek-V3-0324,这一小版本更新不仅在模型参数上有所提升,更在开源协议上做出了重大调整,为开发者带来了更大的自由度和便利性。DeepSeek-V3-0324模型在参数规模上进行了小幅增长,从初代V3版本的6710亿参数提升至6850亿参数。虽然参数增长幅度不大,但性能上的提升却十分显著。

2025-03-25 14:13:17 681

原创 [特殊字符]Cursor降低智商!WindSurf零代码开发MCP Server!五分钟轻松实现LightRAG+MCP为Claude和AutoGen挂载知识库!

随着人工智能技术的不断突破,编程工具正迎来前所未有的变革。由 Codeium 团队推出的 WindSurf,以全新的 AI Flow 范式和多工具协同能力,正逐步超越备受关注的 Cursor,成为开发者提高工作效率的利器。WindSurf 的最大亮点在于其深度上下文理解能力。传统的编程助手往往只能对简单代码片段进行补全,而 WindSurf 则能智能捕捉项目整体结构、变量关系以及函数调用链,无需开发者反复输入提示。

2025-03-23 17:46:37 373

原创 [特殊字符]AutoGen Studio零代码创建AI智能体工作流!三分钟从入门到精通!支持工具调用与多agents协作!微软最强开源可视化AI Agents框架!轻松打造旅游规划智能体工作流!

在人工智能领域,多智能体系统已成为解决长流程、复杂任务的重要范式。然而,传统上设计、配置和调试这些系统往往需要繁琐的编程工作。微软 AutoGen Studio 则提供了一个无代码开发环境,让用户可以在不编写大量代码的前提下,构建并观察多个 AI 代理协同工作的全过程。快速搭建团队:利用可视化团队构建器,通过拖拽组件配置代理、工具、模型和终止条件。交互式调试:内置“游乐场”环境支持实时消息流展示和流程控制,帮助用户观察每个代理的内部思考过程与调用详情。组件复用与部署。

2025-03-19 21:31:17 563

原创 24B参数模型碾压gpt4o-mini!推理速度超快!vLLM本地部署Mistral-Small 3.1+全方位测试多模态大模型!超越Gemma3.1,最适合企业项目的大模型!中文OCR能力也不弱

Mistral Small 3.1 是一款轻量级、高性能的 AI 模型,专为低延迟任务设计。相比前代 Mistral Small 3,3.1 版本在文本处理能力上显著提升,并新增了多模态功能,可同时处理文本和图像输入。其上下文窗口高达128k 标记(token),推理速度达到150 个标记每秒,效率令人惊叹。这款模型的最大亮点在于其开源性质,采用 Apache 2.0 许可证,用户可以免费下载、修改和部署。无论是个人开发者还是企业用户,都能根据需求进行定制。

2025-03-18 19:59:36 959 1

原创 实战详解MCP,从入门到开发!小白也能看懂!MCP推动AI智能体大爆发!Cline+Claude3.7打造论文搜索MCP Server!集成到AutoGen+smolagents智能体框架!

MCP(Model Context Protocol)是一个开源协议,旨在简化AI模型与外部数据源、工具和系统的连接,从而对AI智能体开发产生了深远的影响。它提供了一个标准化的方法,使得AI智能体能够更轻松地访问和利用各种资源,从而提升其功能性和开发效率。

2025-03-16 21:57:34 875

原创 [特殊字符]多方位客观测评谷歌最新多模态大模型Gemma 3 27B!综合能力是否被高估?从text to SQL能力到编程能力到逻辑推理能力到多模态ORC识别中文能力!是否适合企业项目?

2025年3月12日,谷歌宣布推出最新一代开源AI模型Gemma 3,其中27B参数版本在单GPU性能方面表现尤为出色。这一重大突破不仅展示了谷歌在AI领域的持续创新,也为开发者和企业提供了更强大、更灵活的AI工具。专家认为,这一模型可能推动自动驾驶、预测技术等领域的创新。同时,它也为人机协作开辟了新的可能性,有望在医疗、教育和金融等多个行业带来变革。Gemma 3是基于谷歌Gemini 2.0技术打造的开源模型系列,提供1B、4B、12B和27B四种参数规模。🔥这四个数是3、5、6、7。

2025-03-13 21:51:20 542

原创 OpenAI全新Agents SDK发布吊打Manus!三分钟构建电商客服AI智能体!支持任务交接!颠覆传统AI智能体,开启AI智能体新时代,小白也能轻松打造自己的AI Agents,支持ollama

2025年3月11日,OpenAI再次引爆业界,正式推出了全新的开发者工具,其中核心亮点便是全新开源的Agents SDK。这款SDK与全新的Responses API深度融合,共同为构建具备复杂任务处理能力的AI代理(Agent)提供了强大支持,标志着AI应用开发进入了一个全新阶段。

2025-03-12 20:45:44 677

原创 [特殊字符]3分钟复刻Manus智能体!AutoGen+MCP Server+Cline构建最强AI智能体,支持ollama!轻松实现网络搜索+文件操作的AI Agent!

🚀🚀🚀本篇笔记所对应的视频Manus是中国科技团队最近推出的AI智能体系统,但是这个智能体并不开源。而且很多小伙伴都没有体验到Manus。所以我们将使用开源方案来复刻Manus。通过结合AutoGen的强大框架和MCP的精细控制,开发者有潜力创建出在自主性、适应性和协作能力上超越Manus的智能体系统。

2025-03-08 20:56:47 494

原创 本地部署最强OCR大模型olmOCR!支持结构化精准提取复杂PDF文件内容!完美识别中英文文档、模糊扫描件与复杂表格!本地部署与实际测试全过程!医疗法律行业必备!轻松应对企业级PDF批量转换需求

allenai/olmocr是由Allen人工智能研究所(AI2)开发的一个开源工具包,旨在高效地将PDF和其他文档转换为结构化的纯文本,同时保持自然阅读顺序。

2025-03-01 20:42:06 2128 1

原创 [特殊字符]Anthropic最强AI震撼发布!Claude 3.7 Sonnet多方位测评!Extended模式下的思考能力完全超乎想象!从编程到物理模拟到贝叶斯推理

🚀🚀🚀本篇笔记所对应的视频Claude 3.7 Sonnet 是由 Anthropic 推出的最新型混合推理模型,这是该公司迄今为止最先进的模型,也是市场上首个将普通语言处理和推理能力集成到一个模型中的产品。

2025-02-25 14:16:08 396

原创 [特殊字符]用MCP为AutoGen开挂接入各种工具和框架!Cline零代码开发MCP Server实现接入LangFlow进行文档问答!利用MCP Server突破平台限制

AutoGen v0.4引入了对Model Context Protocol (MCP) server的支持,这是一项重要的新功能,为AI代理提供了更强大和灵活的工具使用能力。

2025-02-22 23:46:15 675

原创 [特殊字符]本地部署谷歌PaliGemma 2 mix视觉大模型!轻松识别图像!支持标记物体位置!支持ORC提取文字内容!支持自然语言问答、文档理解、视觉问答!5分钟带你掌握本地部署全流程!

PaliGemma 2 mix是Google最新发布的视觉语言模型(VLM),是PaliGemma 2系列的一个重要组成部分。这个模型在多种视觉语言任务上进行了微调,可以直接用于多种应用场景。PaliGemma 2 mix代表了视觉语言模型的最新进展,为多模态AI应用开辟了新的可能性。它的多功能性和即插即用特性使其成为研究和实际应用的理想选择。

2025-02-20 19:42:34 456

原创 [特殊字符]本地部署OmniParser v2.0与pyautogui真正实现自动化点击!支持macOS、Windows与Linux!轻松实现自动化操作电脑!从服务端部署到客户端开发

OmniParser V2.0是微软开发的一款先进开源AI工具,旨在将图形用户界面(GUI)截图转换为结构化数据。这一功能增强了大型语言模型(LLMs)与屏幕上视觉元素的互动,能够实现更加智能的自动化和用户辅助。OmniParser V2.0代表了AI视觉解析技术的重大进步,它不仅促进了用户与数字界面之间的更好互动,还在各类应用中增强了自动化能力。

2025-02-18 18:08:07 1964 4

原创 [特殊字符]vLLM本地部署Qwen2.5-VL多模态大模型!70亿参数即可打造监控视频目标查找项目!轻松实现监控视频自动找人!部署Qwen2.5-VL-7B-Instruct模型实战教

Qwen2.5-VL 是由阿里云通义千问团队开发的最新一代多模态大型语言模型。Qwen2.5-VL 能够处理图像和视频等多模态输入,准确理解其中的内容和关系。它在物体检测、场景识别、图像描述等任务上表现出色,可以应用于智能安防、图像搜索、视频分析等领域。Qwen2.5-VL 擅长处理各种类型的文档,包括扫描件、网页、PDF 等。它能够提取文档中的文字、表格、图片等信息,并进行结构化处理,方便用户进行信息检索、内容摘要和智能问答。

2025-02-14 20:16:58 772 1

原创 微调DeepSeek-R1打造SQL语言转自然语言大模型!小白也能十分钟打造自己的推理大模型!unsloth+Colab+DeepSeek-R1-Distill-Llama-8B轻松上手

DeepSeek-R1-Distill-Llama-8B 是一个基于 Llama 架构的 8B 参数语言模型,经过深度蒸馏(distillation)处理,旨在提高推理效率和精度。通过蒸馏技术,模型在保持较高性能的同时,减少了计算资源的消耗,特别适合在资源受限的环境中应用。该模型经过优化,可用于多种自然语言处理任务,如文本生成、情感分析、问答系统等。DeepSeek-R1-Distill-Llama-8B 结合了 Llama 的强大基础和蒸馏技术的优势,使得它在处理复杂问题时更加高效。

2025-02-10 22:09:45 695

原创 [特殊字符]谷歌重磅发布Gemini 2.0 Pro!多模态能力大幅提升,训练数据质量高,编程能力强!多维度测评轻松识别手写汉字、提取模糊扫描内容,

Gemini 2.0 Pro Experimental 是 Google 在 2025 年 2 月 5 日推出的最新实验性 AI 模型,作为 Gemini 2.0 系列的重要组成部分。该模型在编码能力、复杂提示处理及世界知识理解方面展现了当前最先进的性能,现通过 Gemini Advanced 订阅(每月 19.99 美元)向用户开放测试。

2025-02-07 17:56:18 395

原创 零成本复刻Deep Research!超越OpenAI Deep Research+DeepSeek R1!三分钟快速部署node-DeepResearch最强AI agent,由Jina AI打造!

OpenAI最近推出了Deep Research功能,通过自动化的多步骤互联网研究任务,生成全面的报告。该功能利用最新的o3模型,能够分析和综合来自各种在线来源的数据,包括文本、图像和PDF。用户只需提供一个提示,ChatGPT就会在10分钟内生成一份详细的报告。Deep Research在Humanity's Last Exam基准测试中取得了26.6%的得分,显示了其在处理复杂研究任务方面的能力。目前,Deep Research已集成到ChatGPT界面中,供美国的Pro订阅用户使用。

2025-02-06 19:20:19 1180

原创 [特殊字符]取代ChatGPT Operator!支持DeepSeek!Browser Use最强浏览器自动化框架,支持Roo Code轻松实现MCP Server集成Claude桌面版

一款开源的基于AI的智能浏览器自动化工具,而且这款开源项目分为命令行版本和web UI版本,并且支持deepseek、gpt-4o在内的开源和闭源模型。我们可以使用这款开源项目轻松实现浏览器自动化操作,执行订机票、**浏览网页、**点击链接、用户可以使用自然语言来指示AI执行任务,大大降低了开发者需要编写代码的需求。甚至可以替代。

2025-02-05 18:34:20 398

原创 超越gpt-4o-mini!最适合企业的24B参数大模型Mistral Small 3!部署Mistral-Small-24B-Instruct-2501 替代deepseek!支持Roo Code!

Mistral AI 是一家法国的初创公司,专注于开发最先进的大型语言模型 (LLM)。该公司由前 Meta 和 Google 的研究人员于 2023 年 5 月创立,致力于通过开源和合作的方式推动 LLM 领域的发展。Mistral AI 尤其关注模型的效率和可访问性,旨在使更广泛的用户能够受益于 LLM 技术。他们致力于推进 LLM 领域的研究,特别是在提高模型效率和对齐方面。Mistral AI 积极拥抱开源精神,例如发布了高效注意力机制的代码,并为开源 LLM 库做出了贡献。

2025-01-31 20:31:51 1306

原创 重磅首发!本地部署+真实测评阿里开源视觉大模型Qwen2.5-VL-7B-Instruct和Qwen2.5-VL-72B!轻松识别提取发票!全方位测评见证AI视觉理解能力的质的飞跃,图像识别不再是难题

2025年1月,阿里巴巴通义千问团队发布了全新的视觉语言模型——Qwen2.5-VL-7B-Instruct,作为Qwen2.5-VL系列的一员,标志着视觉语言理解领域的一次重要突破。这一中型参数模型,凭借其卓越的性能和多样化的功能,迅速吸引了业界的广泛关注。

2025-01-30 20:05:28 2596

原创 [特殊字符]阿里千问系列最强大模型-Qwen2.5-Max震撼发布!在线测评+API调用!Cline编程+AutoGen智能体!官方基准测试得分超越DeepSeek v3!

通义千问Qwen 2.5-Max是阿里云研发的一款超大规模语言模型,它采用了MoE(专家混合)架构。这意味着它内部有多个“专家”网络,每个专家负责处理不同类型的任务,从而提高效率和性能。主要特点:Qwen 2.5-Max 拥有超过 20 万亿个token的预训练数据和精心设计的后训练方案,使其能够在各种任务中实现高水平的性能。

2025-01-29 20:41:57 1538

原创 DeepSeek发布开源多模态大模型Janus-Pro-7B!本地部署+Colab部署!支持图像识别和图像生成!基准测试得分超越OpenAI的DALL·E 3 + Stable Diffusion

超越 DALL-E 3 和 Stable Diffusion: 在 GenEval 和 DPG-Bench 等基准测试中,Janus-Pro-7B 的性能优于 OpenAI 的 DALL-E 3 和 Stability AI 的 Stable Diffusion。基于 DeepSeek-LLM: Janus-Pro 建立在 DeepSeek-LLM-1.5b-base/DeepSeek-LLM-7b-base 的基础上,并对其进行了多模态扩展。图像理解: 能够准确地识别和理解图像中的对象、场景和关系。

2025-01-28 19:02:33 1339

原创 微软最强AI智能体AutoGen史诗级更新!原生支持Magentic-One和Swarm与Teams!引领AI智能体元年!支持ollama本地部署!小白也能轻松掌握AI框架保姆级教程,超详细上手指南

AutoGen是一个用于构建代理AI应用程序的开源框架,允许开发者创建可以自主行动或与人类协作的多代理AI系统。AutoGen0.4.2是一个重要的更新版本,它在代理工作流程中提高了代码质量、稳健性、通用性和可扩展性。新的异步、事件驱动的架构使AutoGen更具可扩展性和稳健性,从而支持更广泛的代理场景。

2025-01-19 22:47:58 1310

原创 最强LitGPT框架零代码微调Phi-4开源大模型!轻松实现Text to SQL!解决复杂SQL查询难题!【AI实战教程】从环境配置到模型部署全流程讲解!大模型微调从入门到精通,附详细代码与配置说明

在当前大语言模型蓬勃发展的背景下,微调大模型的需求与日俱增,选择一款优秀的微调框架尤为重要。LitGPT是一款开源的优秀微调框架。LitGPT是由Lightning AI团队开发的工具包,为用户提供了高效的大语言模型训练、微调和部署解决方案。使用LitGPT可以快速实现微调大语言模型。

2025-01-15 22:18:03 860

原创 告别Token消耗!用Roo Cline开发项目专属MCP Server,让AI编程不再烧钱,Claude app化身编程IDE,一次配置永久省钱!最强编程AI智能体!Roo Cline超越Cline

Cline 和 Roo Cline 都是基于 Visual Studio Code 的 AI 编程插件,能够通过自然语言指令与开发者交互,辅助完成代码编写、测试、调试等任务。Cline 由 Cline Bot Inc. 开发,而 Roo Cline 则是 RooVetGit 基于 Cline 3.1 进行 Fork 和改进后的版本。两者都依赖于大型语言模型 (LLM) 的能力,例如 Claude 3.5 Sonnet,来理解代码和执行指令。

2025-01-08 22:26:45 1805

原创 smolagents颠覆传统AI智能体!ollama本地部署Hugging Face开源全新AI智能体!重新定义AI智能体开发!从入门到精通只需10分钟

设计简洁,使用方便,仅需几行代码即可创建功能强大的AI智能体执行速度远超其他同类框架学习曲线平缓,新手友好代码精简但功能强大。

2025-01-04 21:46:36 5649

原创 ScrapeGraphAI颠覆传统网络爬取技术!用AI重塑数据采集方式!支持ollama本地部署!LangChain+LangGraph打造最强全自动文章采集和内容创作AI智能体!让内容创作更简单!

ScrapeGraphAI 是一个开源的 Python 库,通过结合大语言模型(LLMs)和基于图的逻辑,彻底革新了网络爬取技术。用户只需用简单的自然语言描述需要提取的信息,即可从网站或多种文档格式中提取结构化数据。

2024-12-31 19:22:56 1466

原创 6850亿参数混合专家(MoE)架构开源大模型!Deepseek V3全方位客观评测文档处理、逻辑推理、算法编程等多维度的真实能力水平!是卓越还是拉胯?真能超越Claude还是言过其实?

【代码】6850亿参数混合专家(MoE)架构开源大模型!Deepseek V3全方位客观评测文档处理、逻辑推理、算法编程等多维度的真实能力水平!是卓越还是拉胯?真能超越Claude还是言过其实?

2024-12-26 19:34:13 323

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除