自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1504)
  • 收藏
  • 关注

原创 AI的“智商测试”被破解了?何恺明团队将其变为视觉题,ViT一举达到人类水平!

今天来自MIT的Kaiming He(何恺明)等研究者们提出了一种全新的思路来解决被誉为“通用人工智能的试金石”之一的ARC(Abstraction and Reasoning Corpus)基准测试。他们旗帜鲜明地提出观点:**ARC本质上是一个视觉问题**!基于此,团队设计了一个名为**Vision ARC (VARC)**的框架,将这个复杂的抽象推理任务巧妙地转化为一个图像到图像的翻译问题,并取得了惊人的成果。

2025-11-24 17:31:56 358

原创 大模型训练的“第一道坎”就是数据标注?Label Studio,让你把繁琐工作交给工具,专注模型本身!

无论是预训练模型,还是大模型微调,又或是大模型应用,我们都离不开数据标注,本文介绍一个开源项目,非常容易上手,并且功能很强大,按照步骤操作,你也能做数据标注!重点支持 AI 标注!

2025-11-24 17:30:47 737

原创 告别东拼西凑!这才是RAG技术的完整图谱,20种方法,高手必看!

告别东拼西凑!这才是RAG技术的完整图谱,20种方法,高手必看!

2025-11-24 17:29:08 312

原创 (建议永久收藏)AI Agent的“记忆圣经”!一文讲透如何用文件系统玩转上下文工程!

* 对于现代 AI 智能体 (agent) 来说,上下文 (context) 是非常关键的资源。它决定了模型在做下一步推理时能访问哪些信息。

2025-11-24 17:04:28 338

原创 DeepAgents避坑指南!我踩过的坑,你不必再踩!附完整问题清单与解决方案!

昨天我在体验过LangChain的Agent builder后,满怀期待地写下了对DeepAgents的理解,认为它是"AI智能体的思想进步"。今天,我带着这份理论认知投入实践,结果现实给了我一记响亮的耳光。整整一天的折腾,让我对DeepAgents有了更深刻、更接地气的认识。

2025-11-24 17:03:46 32

原创 LLM的“快”与“好”终于可以兼得!英伟达“扩散+自回归”组合拳,颠覆传统生成范式!

近年来,大型语言模型(LLMs)在自然语言处理任务中取得了突破性进展,但其生成效率仍面临严峻挑战。主流的自回归(AR)模型在生成文本时只能逐词输出,导致 GPU 计算资源利用率低,生成速度受内存带宽限制。另一方面,扩散语言模型(dLMs)支持并行生成多个词,理论上能大幅提升吞吐量,但往往以牺牲生成质量为代价。这种“效率与质量不可兼得”的困境,成为制约语言模型实际应用的关键瓶颈。

2025-11-24 17:02:24 775

原创 10分钟搞定一个全栈应用!Antigravity + Gemini 3,这才是真正的“AI驱动开发”!

在AI迅猛发展的今天,全栈开发正在进入一个全新的篇章。过去,我们需要一行行敲代码、搭环境、踩坑调试,才能凑出一个前后端系统。如今,只要掌握强大的 AI 工具,比如 Antigravity + Gemini 3,开发效率已经不再是瓶颈。

2025-11-24 17:01:17 369

原创 别再用MySQL“硬扛”Agent了!万字长文,解析下一代数据库的演化路径与投资机会!

数据基础设施正在从“描述世界”转向“Agent 理解世界并在其中行动”,数据库作为 Data Infra 的核心组件,也在经历从传统架构向 Agent 时代的转型。核心不是数据形态,而是 Data → Knowledge → Context → Decisions → Actions → Feedback 的闭环。

2025-11-24 16:58:53 410

原创 严重警告:纯LLM已是死路一条!未来属于Agent,再不转型就晚了!

最近即将离职的Meta首席AI科学家、图灵奖得主杨立昆表示,全球大型科技公司投入巨额资金在 ChatGPT、Google Gemini、Meta Llama这类大型语言模型是个错误。

2025-11-23 15:30:00 848

原创 保姆级教程!精选国内20个高潜AI Agent赛道,从市场分析到变现模式,手把手教你落地!

京东在十二年后,将会实现全球第一个无人配送站。马云也曾经说过,随着AI的产生,制造业会越来越不会解决就业。未来10年,AI正在淘汰重复性劳动,无论是工厂、快递员工。办公室职员同样逃不出被替代的命运,硅谷裁员10万人,已经说明问题。

2025-11-23 08:30:00 624

原创 我给Data Agent画了张“成长地图”!L0-L5分级标准,每一步都是一次能力飞跃。

你可能在各种技术发布会上见过**Data Agent(数据智能体)** 这个词。有的厂商说:“我们的 Data Agent 能自动帮你分析财报。”有的开发者说:“我给数据库装了个 Agent,它能自己写 SQL。”甚至你的 Excel 插件现在都号称是 Agent 了。

2025-11-23 07:45:00 1461

原创 逼自己练完这48页你的Agent就很牛了!!

AI Agent在于其能自动执行复杂任务,大幅提升自动化和智能决策的效率,让任务自动化,主要包括感知、记忆、规划与决策、行动/使用工具。

2025-11-22 16:50:35 638

原创 别再折腾Obsidian和Notion了!我宣布,RAGFlow才是知识管理的“未来形态”!

这,就是我理想知识库的最终形态趁着假期,我终于把传说中的AI知识库项目RAGFlow完整安装并深度体验了一番。结论只有一个:震撼。

2025-11-22 11:35:09 937

原创 面试必问:“如何优化大规模RAG系统的延迟?” 回答这篇,直接甩开90%竞争者!

面对大规模RAG系统在生产环境下的延迟挑战,很多工程师下意识地会去优化向量检索的速度,或者去抠大模型推理的每毫秒。这当然没错,但仅仅聚焦于局部优化,往往会陷入“头痛医头脚痛医脚”的窘境。真正的瓶颈,远不止于此。

2025-11-22 11:33:02 1216

原创 “你的RAG为什么总在‘一本正经地胡说八道’?” 切分策略,才是真正的“幕后黑手”!

2025 年,仍然存在很多关于“RAG是否过时”的讨论。随着支持超长上下文模型的发展,似乎把整本书丢给 AI 就能解决所有问题。但现实的工程实践告诉我们:成本、延迟和精度的“不可能三角”依然存在,这就是为什么高阶RAG技术在今天仍然被广泛使用。

2025-11-22 11:29:19 975

原创 这才是真正的Agent!谷歌Gemini 3实现“全链路”思考,从规划到执行一气呵成,Claude还在第一步!

刚刚,谷歌发布了其划时代的 AI 模型——Gemini 3.0,与过去以往发布模式不同的是,这次谷歌甚至连一场发布会都没有召开。过去几个月,谷歌的 Gemini AI 一直深陷争议之中。隐私诉讼、图像生成失败、API 变更破坏性升级激怒了开发者,各种负面新闻层出不穷。人们纷纷指责谷歌急于将产品推向市场,偷工减料,最终在人工智能竞赛中败给了 OpenAI。

2025-11-22 11:28:34 1038

原创 “你的AI-Coding为什么还在制造Bug?” 别再傻傻地换模型了,问题出在你的项目规范!

我们都知道,模型越智能,生成效果越好,决定了AI编程的上限。但在工业界,比起追求更高的上限,稳定的下限往往更为关键。毕竟,大部分代码都是在既定的业务与技术框架中完成的,能持续输出稳定、规范的代码才是真正的竞争力。那么,如何保障这一“稳定的下限”呢?下面是我的一些心得。

2025-11-22 11:27:25 462

原创 Anthropic引爆AI圈!揭秘Agent效率提升98.7%的“秘密武器”,或开启下一代AI革命!

今天路上在浏览 Anthropic 的工程博客时,看到了一篇关于代码执行与 MCP 协议[1]结合的技术文章,读完之后感触颇深。文章中提出的优化思路非常巧妙——通过让 AI Agent 编写代码与工具交互,而非传统的直接调用方式,竟然能将 Token 使用量降低 98.7%。这种「回归软件工程基本原理」的设计哲学,让我意识到在 AI Agent 快速发展的今天,我们或许过于关注模型能力的提升,而忽视了架构层面的优化空间。

2025-11-22 11:26:22 689

原创 警告!你还在聊GPT-4?全球顶尖大模型Top 10已“大换血”!再不看就晚了!

这些模型在绝大多数基准测试中都位列前三,代表了当前大模型的最高水准。

2025-11-21 15:21:25 801

原创 你的赛道选对了吗?姚期智:投身大模型行业革新,就是拥抱AGI的未来!

11月16日,由国家高新区人工智能产业协同创新网络、中央广播电视总台《赢在AI+》节目组、清华大学可持续社会价值研究院、中国人民大学交叉科学研究院、赛迪研究院人工智能研究中心、中关村发展集团等联合主办的2025人工智能+大会在北京中关村国际创新中心&中关村国家自主创新示范区会议中心举行。图灵奖得主、中国科学院院士、清华大学交叉信息研究院院长、清华大学人工智能学院院长姚期智发表演讲。

2025-11-21 15:20:31 1069

原创 万字长文,深度剖析!2025AI大模型开发生态白皮书,从框架到应用的终极指南。

原件《2025AI大模型开发生态白皮书.pdf》已上传知识星球,文章结尾处识别二维码,加入“产业智能研究院”领取。

2025-11-21 15:18:06 388

原创 全国首部AI大模型私有化部署标准,公开征集起草单位和个人!

大模型(LLMs)的浪潮已席卷全球,企业对AI的投入从“观望”转为“all in”。然而,面对外部API调用带来的数据安全、高昂成本、网络延迟等核心痛点,越来越多的企业,尤其是金融、政务、制造等数据敏感或对性能要求极高的行业,正将目光投向私有化部署。但现实是:从算力规划到模型微调,再到最终的业务集成,私有化部署缺乏一套成熟、可复制、经行业验证的实施框架。

2025-11-21 15:16:59 738

原创 万字长文,从零到一!基于RAPTOR RAG构建工业设备故障诊断系统全复盘。

随着工业4.0时代的到来,设备故障诊断已经从传统的被动响应转向主动预测和智能 决策。RAPTOR(Recursive Abstractive Processing for Tree-Organized Retrieval)作为一种新兴的检索增强生成(RAG)技术,为工业设备故障诊断提供了 全新的技术路径。本文将深入解析基于RAPTOR技术的工业设备故障诊断系统的实现细 节,从核心技术原理到工程落地实践,全面展示这一创新解决方案。

2025-11-21 15:15:21 614

原创 警告!你的调研方式,已经“过时”了!ChatGPT Atlas Agent,让你一天干完一周的活!

很多人为此非常兴奋。也有不少人嗤之以鼻,抛出来一句 —— 和 Perplexity 的 Comet 有啥区别?嗯,第一个区别,就是这回免费用户不需要邀请码就可以下载使用。要知道,Comet 这个邀请码政策,曾经导致不少网友见识到了人性的考验。收到邀请码后下载激活,自己又可以得到两个邀请码。原本讲好了,发一个继续接龙薪火相传,于是群里的大家都能用上。但是无数次,有人就是悄悄领了码,然后一去不回。

2025-11-21 15:12:48 806

原创 你的AI真的公平吗?警惕“礼貌偏见”!FiSCo教你如何把它量出来。

很多人以为,只要模型不爆粗口、不说冒犯性词汇,就算“公平”。但在开放式回答里,真正影响用户机会与走向的,往往不是词本身,而是答案背后的“理由与期待”。看似温和、礼貌、正向的建议,可能对不同人群形成系统性的分流:有人被鼓励冲刺名校和更高阶的路径,有人却被建议求稳与折中。FiSCo(Fairness in Semantic Context)正是为这种“看不见的偏差”建立量尺:以语义与统计为核心,让模型的群体公平性变得可观察、可量化、可治理。令人惊讶的是更大或标称“推理更强”的模型,并不必然更公平。比如GPT

2025-11-21 15:11:24 741

原创 【Agent落地“秘籍”】SAP、Salesforce、Palantir的阳谋,我给你“扒”出来了!

聊了SAP的发展带给Agent建设的启示:把业务概念讲清楚并结构化、分层次构建智能体、形成业务数据基座用于大模型理解和对其进行反馈评价。本篇来聊聊Salesforce的发展带给智能体建设哪些启示?

2025-11-21 15:10:48 635

原创 (深度复盘)AI Agent教育第一枪:手把手拆解斑马口语“超人类”外教的技术实现!

中国孩子学英语,最常见的情况是:掌握几百上千个单词后,口语能力却突然停住。考试能拿高分,却无法在真实场景中自然开口——不是不会,是说不出来。

2025-11-20 14:08:41 783

原创 别再当LangChain的调包侠!从0到1手撸Agent框架,彻底搞懂底层原理!

2025 年,注定是 Agent 从技术概念走向商业主流的转折点。无论是企业还是个人,若想在这场智能化浪潮中不被淘汰,拥抱 Agent 已不再是选择题,而是生存题。

2025-11-20 14:07:14 617

原创 AI架构师的必修课:AIGC、RAG、Agent、MCP四大天王的设计哲学与实战场景!

是因为我前几天看到一个报告,报告显示,大部分人还只是停留在简单与模型对话,甚至只有2%的人开发过智能体,更离谱的是30%多仅仅是听说过。表明整体AI技能基础相对薄弱。

2025-11-20 14:05:52 631

原创 2025年求职新风向!精通这些AI Agent(Cursor 2.0, v0 iOS版),薪资翻倍不是梦!

Cursor 推出了 2.0 版本,其核心亮点是发布了首个编码模型 Composer,以及多 Agent 并行系统。此外,这次版本还包括:智能体浏览器、语音模式、改进的代码审查等功能。

2025-11-20 14:04:43 579

原创 不止是快!从架构设计看懂这个GitHub轻量级RAG框架,这才是性能优化的天花板!

LightRAG是一个专注于检索增强生成技术的开源项目,旨在简化并加速信息检索与文本生成的过程。

2025-11-20 14:03:34 615

原创 20251120_140056_AI界的“四大天王”:AIGC、RAG、Agent、MCP,

今天我们来聊下AI相关的一些知识点。是因为我前几天看到一个报告,报告显示,大部分人还只是停留在简单与模型对话,甚至只有2%的人开发过智能体,更离谱的是30%多仅仅是听说过。表明整体AI技能基础相对薄弱。

2025-11-20 14:01:48 872

原创 (保姆级教程)一张图看懂RAG评估!手把手教你把单元测试“塞进”CI/CD流水线!

检索增强生成(RAG)已成为为LLMs供额外上下文以生成定制输出的最流行方法。这对于聊天机器人或 AI 代理等LLM应用来说非常有用,因为 RAG 能为用户提供比 GPT-4 等LLMs训练数据更为情境化的体验。

2025-11-20 14:00:49 722

原创 下一个“黄金十年”!华为医疗AI一体机发布,懂这个技术的人才太抢手!

医疗AI大模型一体机的推出,证明了“华为+核心伙伴+行业ISV”生态模式的有效性。在全民健康成为国家发展重要方向的背景下,医疗行业迫切需要技术革新打破资源供需失衡的困境,AI技术也因此被寄予厚望。但受限于多重现实难题,当前医疗AI大模型在下沉到医疗场景时面临困难,先进技术尚未真正普惠于民。

2025-11-20 13:59:33 943

原创 从“数据仓库”到“数据大脑”:AI大模型赋能,开启数据治理的下一个时代!

2025年AI大模型赋能智能数据治理体系——构建“认知驱动”的新一代治理范式

2025-11-20 13:53:37 756

原创 收藏这一篇就够了!LMArena底层逻辑全拆解,这才是普通人的“避坑”指南!

这两年有越来越多的AI 大模型了ChatGPT、Claude、Gemini、Llama、DeepSeek……每个发布会都在说炸裂

2025-11-20 13:52:40 559

原创 别再让Agent“原地打转”!从“浅层循环”到“深度智能体”,打破架构的“天花板”。

当下很多 AI Agent 都还停留在一个非常基础的循环结构:接收用户指令 → 调用 LLM 推理 → 调用工具 → 再回到 LLM,如此反复。一般将这种设计称为 Agent 1.0(浅层智能体)。它非常适合处理简单事务,比如查天气、查股票等,但一旦任务变成跨天、跨模块、需要规划、记忆和分工的长期工程,它就会暴露出局限性 — 报错、走偏、甚至丢失目标。

2025-11-19 10:48:08 691

原创 大模型“减肥”神器!模型稀疏化:如何让百亿参数模型“瘦身”90%,性能不降反升?

稀疏化是一种通过减少不必要的计算和内存消耗来优化机器学习模型的技术。它的基本理念是通过增加模型中零值元素的比例(比如权重或激活中的零),减少计算过程中的资源消耗。在大语言模型中,稀疏化通常被应用到权重和注意力激活层。通过有效忽略这些零值,稀疏化能帮助提高模型的效率,并节省计算和存储资源。

2025-11-19 10:47:16 592

原创 你的智能体,你做主!DeepAgents 0.2可插拔后端,LangChain开启智能体开发的“自由市场”!

两个月前,LangChain团队提出了"深度智能体"(Deep Agents)的概念,用来描述那些能够执行复杂、开放式任务并在更长的时间范围内运行的AI智能体。

2025-11-19 10:45:43 902

原创 我悟了!LLM推理的瓶颈不是算力,是“犹豫”!OPPO ReSpec用“信息熵”根治AI的选择困难症。

推测解码(Speculative Decoding, SD)已成为一种有效加速大语言模型(LLM)推理的技术,且不会牺牲输出质量。然而,所能实现的加速效果在很大程度上取决于草稿模型(drafting model)的有效性。基于模型的方法(如 EAGLE-2)虽然准确,但计算成本高昂;而基于检索的方法(如 SAM-Decoding)则依赖于启发式的切换策略,常常引发不必要的检索操作。

2025-11-19 10:44:59 869

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除