自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1729)
  • 收藏
  • 关注

原创 全行业瑟瑟发抖,程序员却在偷笑?MIT模拟AI冲击波,揭秘“代码”为何成为终极护城河!

不都说AI要取代人类工作吗~取代多少?取代什么岗位?影响多少经济?怎么量化评估?最近,麻省理工学院(MIT)联合橡树岭国家实验室搞了一个大型打工人职场模拟实验。

2025-12-01 15:49:04 368

原创 【AI进化史诗】1000天,从“聊天玩具”到“数字同事”,我们亲历了怎样的革命?

AI走进大众视野,其实也不到1000天。可就在这短短1000天里,很多事已经彻底换了样。三年前,人们用GPT-3写诗、讲段子,它能把一句话写顺就是奇迹。现在的Gemini 3,会读文件、查资料、跑代码、建网站,甚至能把十年前的旧数据整理成一篇14页的学术论文。

2025-12-01 15:47:21 413

原创 一手交钱,一手交“未来”!深度解密英伟达的疯狂账本,如何同时掌控AI的现在与明天?

ChatGPT涨价的讨论又冲上了首页。Plus到手价从20美元涨到22美元、美区Team从25美元涨到30美元,Claude在20美元的Pro之外,又新增了30美元的Team档和Max档,

2025-12-01 15:43:20 364

原创 【深度质问】GPT-5为何“挤牙膏”?揭秘OpenAI创新乏力与 Scaling Law 的瓶颈!

OpenAI核心预训练,接连翻车?传言称,GPT-5的基石仍是GPT-4o,且GPT-4.5之后的预训练版本,都被OpenAI放弃了!

2025-12-01 15:42:22 432

原创 AIGC检测的“猫鼠游戏”已到瓶颈?腾讯优图:我们都搞错了方向,问题在数据!

在AIGC技术飞速发展的背景下,只需一行简单的prompt就可生成高逼真内容,然而,这一技术进步也带来了严重的安全隐患:虚假新闻、身份欺诈、版权侵犯等问题日益突出。AI生成图像检测也成为了AIGC时代的基础安全能力。

2025-12-01 15:39:44 608

原创 【小身材,大能量】阶跃开源4B Agent模型:如何在所有安卓设备上实现丝滑操作?

首次将GUI Agent模型与完整配套基建同步开放,支持手搓党一键部署!这就是阶跃星辰刚刚开源的**GELab-Zero**。其中4B版本的GUI Agent模型在手机端、电脑端等多个GUI榜单上全面刷新同尺寸模型性能纪录,取得SOTA成绩。

2025-12-01 15:38:37 584

原创 当AI开始“审判”AI:21%的ICLR 2026评审纯AI生成,深度剖析学术圈的“效率陷阱”!

上面这个相当扎心的答案,来自Pangram实验室的分析报告。**这件事被发现的起因颇具戏剧色彩**:CMU的AI研究员Graham Neubig,感觉自己收到的同行评审AI味超级重。他之所以起疑心,是因为这些评审内容“非常冗长,且包含大量符号”,并且所要求的分析方式并非“审稿人通常在AI或ML论文中所要求的那种标准统计分析方式”。

2025-12-01 15:37:46 694

原创 【惊天内幕!】Transformer作者爆料:GPT-5.1已存在,OpenAI内部命名已乱套!

过去一年里,关于**AI发展**,出现了两种观点的分化:* 一边是“AI增长放缓、模型到顶、预训练无用论”* 另一边则是隔三差五就来一次“AI大周”:**GPT-5.1**、**Gemini 3**、**Grok 4.1**。

2025-12-01 15:36:41 439

原创 让每一分广告费都花在刀刃上!对话布尔向量,看视频营销Agent如何为ROI兜底!

得益于广阔的市场空间和逐渐加码的政策支持,**跨境电商**近几年来一直是创业者入局的热门赛道。但对于出海的商家而言,营销推广一直是个“老大难”问题。

2025-12-01 15:35:39 391

原创 【下一个Google?】ChatGPT广告计划曝光,我们正在见证一个新广告帝国的诞生?

近年来,视觉大语言模型(LVLM)的空间智能受到了广泛关注,高水平的空间理解能力对于自动驾驶、具身智能等领域发展有着重要意义。然而,当前的LVLM在空间理解方面仍显著落后于人类。近期,来自上海人工智能实验室、上海交通大学、香港中文大学等机构的研究团队提出了名为Spatial-SSRL (Self-Supervised Reinforcement Learning) 的全新自监督RL范式,无需任何外界标注,旨在提升LVLM空间理解能力。实验证明,该范式在 Qwen2.5-VL(3B&7B) 和最新的 Q

2025-12-01 15:34:42 436

原创 【企业落地】RAG实战:手把手教你用数据库,打造一个“懂你业务”的私有大模型!

在大模型的应用中,如何实现知识的动态更新与私有化定制化,是许多企业亟需解决的挑战。大模型的知识源自预训练,因此一旦完成训练,它所掌握的知识就无法再更新。如何让大模型不断学习新知识,是行业中的一大难题。

2025-11-30 10:45:00 640

原创 RAG的“终极形态”?AutoDev DocQL深度解析:Agentic RAG如何用结构化检索实现“精准打击”!

AutoDev Knowledge Agent 的想法是来源于一次与客户的交流中,说到的 RAG 相关的问题:结构化数据优于非结构化数据,JSON 还可以采用 JSONPath 来使用。

2025-11-30 10:30:00 586

原创 【AI实战】告别“上下文地狱”!6个高级战术,让你的LLM应用“思路清晰”!

你的AI智能体,是不是也越来越“傻”?明明给了百万Token的长上下文,它却开始胡言乱语。明明喂了海量数据,它却对关键信息视而不见。明明工具库武装到了牙齿,它却在关键时刻掉链子。

2025-11-30 09:45:00 452

原创 【深度解密】ReAct的“上位替代”来了!新范式凭什么同时实现SoTA和高效率?

近年来,大型语言模型(LLM)在文本生成、对话系统等领域展现出强大能力,但它们有一个天生的短板:无法直接与现实世界互动。比如,你无法让一个LLM直接查询天气预报或预订机票,除非它能够调用外部工具(如API)。这种“工具增强”的能力让LLM从“纸上谈兵”升级为“实干家”,成为当前研究的热点。

2025-11-29 11:21:21 840

原创 【多模态】从HunyuanOCR看RL+VLM(附:腾讯技术专家解读与核心思想)

最近腾讯混元开源了 HunyuanOCR,其实看到这个消息时,大家心里大概都有数——现在的多模态端到端 OCR 模型,架构上基本已经收敛了。不用翻技术报告也能猜个八九不离十:无非就是 Vision Encoder(视觉编码器)加上 Adapter,再接一个 Decoder-only 的 LLM。

2025-11-29 11:19:36 583

原创 大模型时代的 YOLO:从实时检测到开放词汇与多模态理解(附:YOLO家族进化史全景图)

大模型时代的 YOLO:从实时检测到开放词汇与多模态理解(附:YOLO家族进化史全景图)

2025-11-29 11:17:42 615

原创 【智能体开发新范式】一文掌握MCP,构建你的“AI工具链”知识体系!

随着模型能力不断增强,AI Agent 正在从“单轮对话助手”向“能够连续运行数小时甚至数天的自主系统”进化。然而,工程实践一再证明:让一个 Agent 在长时任务中持续、稳定地推进,远比想象困难。上下文窗口有限、会话之间没有记忆、反复返工、误判进度等问题,会让一个复杂项目在数轮执行后彻底失控。

2025-11-29 11:11:33 580

原创 《使用MCP进行代码执行:构建更高效的智能体》——Anthropic MCP实战经验总结(附:完整项目Demo

**模型上下文协议(MCP)**是一个用于将智能体连接到外部系统的开放标准,由Anthropic于2024年11月发布。传统上,将智能体连接到工具和数据需要为每对组合进行自定义集成,这会造成碎片化和重复劳动,使得真正连接的系统的扩展变得困难。MCP 提供了一个通用协议——开发者在其智能体中实现一次 MCP,就能解锁整个集成生态系统。

2025-11-29 11:10:14 668

原创 Text2SQL的“底层逻辑”!手撸Ollama+Qwen3-Coder,让你彻底搞懂AI是如何写SQL的!

Text2SQL的“底层逻辑”!手撸Ollama+Qwen3-Coder,让你彻底搞懂AI是如何写SQL的!

2025-11-29 11:08:20 585

原创 LangChat Pro 新特性:Toon格式,让AI对话更省成本!(附:成本对比与使用指南)

**LangChat Pro** 是基于Java生态构建的**企业级AIGC应用开发平台商业版**,为企业提供完整的AI大模型集成解决方案。基于Spring Boot 3和Vue 3构建,支持快速构建智能知识库、多模态AI应用和智能工作流,助力企业实现AI驱动的数字化转型。

2025-11-29 11:05:44 662

原创 LangGraph实战:打造你的AI“项目经理”!一个会“暂停思考”的Planner有多强?

整体架构

2025-11-28 15:03:12 745

原创 别再以为是“百度文库”了!大模型训练数据的“真面目”,可能让你大吃一惊!

你可能听过:

2025-11-28 15:01:50 797

原创 【架构升级】LangGraph:用“图”的思维,重新定义多工具Agent的“智能编排”!

很多做 Agent 应用的朋友,都会遇到两个共性问题:

2025-11-28 14:59:19 312

原创 【硬核解析】阿里AgentEvolver如何实现“自进化”?一文读懂其核心机制与7B>14B的秘密!

无需人工标注数据,智能体就能在环境中持续自我迭代——阿里最新推出的端到端自进化框架AgentEvolver,正在重新定义AI Agent的训练范式。

2025-11-28 14:58:40 391

原创 “报告,发现新大陆!”LATTICE如何让LLM像哥伦布一样,在知识海洋中主动探索?

现代信息检索系统正面临越来越复杂的挑战。用户的查询不再是简单的关键词匹配,而是需要深度推理的复杂问题。比如,用户可能会描述一个代码bug的行为来寻找解决方案,或者询问需要应用特定定理的数学问题。

2025-11-28 14:57:51 648

原创 Claude Skills一出,谁与争锋!40分钟“点化”一个智能客服,看懂AI时代的“降本增效”!

Anthropic在几天前发布了Claude Skills(智能体技能)功能,这项新特性在某种程度上比Model Context Protocol(MCP)更具实用价值。Claude Skills允许开发者为Claude Code提供定制化的技能包,使其能够理解和使用未曾接触过的开发框架和工具包。

2025-11-28 14:55:35 818

原创 别再瞎卷了!2025顶会Agent Memory的最新赛道,这几篇论文已经指明了方向!

NeurIPS、ICML 2025 的接收论文数据显示,**Agent Memory** 已成为智能体领域的 “爆款选题”,谷歌 DeepMind、斯坦福等团队提出的**记忆架构创新**,成功解决了传统智能体 “长程推理断层”“多任务记忆干扰” 等核心痛点。

2025-11-28 14:53:51 450

原创 别再只调Top-K了!Context Engineering开篇:10个高级上下文处理技巧,彻底优化你的RAG!

对大部分开发者来说,搭一个RAG或者agent不难,怎么把它优化成生产可用的状态最难。在这个过程中,检索效率、准确性、成本、响应速度,都是重点关注问题。

2025-11-28 14:53:05 256

原创 VLA模型的“外挂”来了!深度解析PLD如何让机器人“越用越聪明”?

SFT已成为VLA模型事实上的训练后策略,但其对高成本人类演示数据的依赖限制了模型的可扩展性与泛化能力。本文提出“Probe, Learn, Distill,PLD”框架——这是一种三阶段即插即用框架,通过残差RL和分布感知的数据收集来改进VLA模型。

2025-11-28 14:46:44 220

原创 架构师必看!Agentic AI安全全景:威胁建模、攻击向量与防御矩阵全解析!

随着人工智能技术的演进,Agentic AI(智能体 AI)正引领着从传统生成式 AI 向自主智能系统的跨越。与被动响应用户指令的“聊天机器人”不同,Agentic AI 被定义为一种具有目标感和自主性的智能框架。在该框架下,AI 不再仅仅是信息的生成者,而是具备了推理规划、记忆存储、工具调用和自主执行能力的主动实体。

2025-11-28 14:45:38 387

原创 模型太大,显卡扛不住?这篇“大模型瘦身术”教你量化+蒸馏,体积狂砍90%,性能几乎无损!

Agent其实就是个工具,底层有各种各样的能力。有点像包工头指挥着泥工、瓦工等。也像是前端时间爆火鸡排哥的名言:做完你的做他的。

2025-11-27 13:33:36 904

原创 3张动图,让你彻底搞懂A2A!附赠Multi-Agent协同设计思路,代码都能直接抄!

本文通过一起真实的法律案例揭示了大语言模型的根本缺陷:律师因使用ChatGPT生成虚假判例而受到严厉处罚。文章深入探讨了为何LLM在关键应用中会失败,以及如何通过知识图谱(KG)与LLM的混合架构构建可信赖的智能顾问系统,为专业领域的AI应用提供可验证、可解释、可持续更新的知识基础。

2025-11-27 13:32:03 347

原创 你的LangChain还在“走直线”?早过时了!LangGraph来了,让Agent学会“拐弯”和“记忆”!

前面九篇文章,我们用Chain构建了各种应用:RAG问答、Agent工具调用、数据分析。Chain确实很强大,但它有个根本性的限制:**执行路径是固定的有向无环图(DAG)**。

2025-11-26 14:38:49 700

原创 硬核长文!LangGraph高级实战:揭秘动态Prompt与反馈循环,如何让AI Agent摆脱“新手村”!

代理系统或者 RAG 方案,基本都需要一个双层记忆架构,这样 LLM 既能保持对当前上下文的专注,又能记住过往交互的内容。短期记忆负责单个会话内的即时信息管理,长期记忆则跨会话存储知识,让系统能够持续学习和进化。两者配合,代理才能表现出连贯性、上下文感知能力,看起来更加智能。这些记忆组件在现代 AI 架构中的位置如下图所示:

2025-11-26 14:37:25 797

原创 告别“无效提问”!我用这套方法,让AI从“瞎猜”进化到“深度思考”,我把方法整理成了万能公式!

近年来,大型语言模型(LLM)领域出现了新的分化趋势:**通用大模型**与**推理大模型**。通用模型(如GPT-4、DeepSeek-V3等)擅长广泛的语言任务,而推理模型(如OpenAI的O1/O3系列、DeepSeek-R1等)则在复杂逻辑推理上表现卓越。这种能力上的差异直接影响了我们与模型交互的方式——即**提示词(Prompt)**的设计策略。一个常见的疑问是:为什么在使用推理模型时,我们往往不需要像通用模型那样明确指定模型扮演的角色?本文将深入剖析这两种模型的核心区别,并据此探讨提示词设计的差

2025-11-26 14:35:24 380

原创 5分钟上手!手把手教你用LLM打造一个专属的SQL小助手,附完整代码!

如何高效的利用数据库里面的相关信息,十分重要,“Text-to-SQL”是从数据库中获取知识的重要手段。具体代码参考如下(建议大家在沙箱中运行):

2025-11-26 14:34:30 976

原创 MCP终极指南:AI产品经理必看!一文搞懂“上下文操作系统”的过去、现在和未来!

你有没有遇到过这些场景?* 开发Agent时,发现模型会忘了之前的操作步骤;* 多个工具调用状态丢失,导致任务中断;* 不同AI系统协作时,上下文无法传递,各自为战;* 想让AI记住用户偏好,却只能靠Prompt?

2025-11-26 14:32:58 927

原创 万字长文深度复盘:AI Agent的“前世今生”,揭秘驱动其爆发的三大核心技术!

人工智能(AI)作为现代科技的核心领域之一,其发展历程中,AI Agent(智能体)扮演了至关重要的角色。AI Agent是指能够在特定环境中感知、推理、学习和行动的软件或硬件系统,其目标是实现自主决策和任务执行。

2025-11-26 14:29:34 922

原创 我用Retrv-R1,把多模态检索速度提了3倍,成本降了一半!这套NeurIPS新方法,老板当场给我加薪!

搭建跨模态检索系统时,有两个难题:一是处理图文混合候选集时,token数量爆炸导致GPU直接内存溢出;二是用RL训练模型时,要么收敛不了,要么推理过程漏洞百出,检索准确率始终上不去。直到看到这篇 NeurIPS 2025 的 Retrv-R1 论文,才发现原来不用复杂架构,只要针对性解决“信息冗余”和“训练不稳定”两个核心痛点,就能让多模态检索的准确率和效率同时突破瓶颈——这篇研究给出了新的技术方案,更提供了“推理驱动检索”的全新思路。

2025-11-26 14:27:27 752

原创 AI就绪 vs AI Native:不是升级,是换物种!这才是企业转型的“底层逻辑”!

那么如何将这些方法应用于企业AI项目实践呢?那么今天我想和大家分享企业AI战略的演变之路:从"AI就绪"到"AI原生"。

2025-11-25 17:19:52 552

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除