- 博客(1339)
- 收藏
- 关注
原创 一文读懂LLM智能体:定义、方法与应用前景(建议收藏)
本文系统综述了基于大型语言模型(LLM)的智能体,将其视为通往通用人工智能的潜在路径。文章详细阐述了LLM智能体的定义、核心组件(规划、记忆、反思等)、与强化学习智能体的对比,以及单智能体和多智能体系统的架构。同时介绍了主流数据集、基准测试,探讨了在自然科学、工程系统等领域的应用前景,并分析了LLM固有约束、安全信任等挑战及持续学习、多模态融合等发展趋势。
2025-11-04 14:55:44
1681
原创 DeepSeek新手必看!全功能详解与实操指南
对于有特定需求的用户,DeepSeek还支持上传文件建立自定义知识库。将与自己工作、学习相关的文档、资料上传后,DeepSeek就能基于这些知识为你提供更个性化、针对性更强的回答和建议。例如,企业用户可以上传公司的内部规章制度、业务资料等,让DeepSeek成为企业内部的智能助手;学生可以上传自己的学习笔记、专业文献等,帮助自己更好地学习和复习。
2025-02-05 18:05:20
24014
原创 一文带你搞懂什么是生成式人工智能(GenAI)
AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!
2024-11-13 11:43:32
11992
原创 工业大模型市场图谱:53个工业大模型全面梳理(通用、行业、场景大模型)看这一篇就够了!
AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!
2024-09-21 10:11:41
6192
原创 AI大模型之Prompt工程指南:什么是Prompt工程?Prompt工程的格式与要求
Prompt是一种基于人工智能(AI)指令的技术,通过明确而具体的指导语言模型的输出。在提示词工程中,Prompt的定义涵盖了任务、指令和角色三个主要元素,以确保模型生成符合用户需求的文本。Prompt明确而简洁地陈述了用户要求模型生成的内容。这包括在特定应用场景中,用户希望模型完成的任务或生成的文本类型。模型在生成文本时应遵循的指令是Prompt中的关键要素之一。这些指令具体规定了模型生成文本的方式,通过清晰的语言来引导模型以获得所需的输出。Prompt中还包括模型在生成文本时应扮演的角色。
2024-08-01 22:18:51
24041
1
原创 (建议永久收藏)万字长文!8大主流AI Agent框架深度测评,企业&开发者选型终极指南!
在AI应用快速发展的今天,选择合适的Agent框架平台已成为企业和开发者的关键决策。本文将对8个主流AI Agent框架进行全方位对比分析,帮助您找到最适合的解决方案。
2025-11-24 15:37:02
329
原创 提示词内卷时代,你还在“喂”AI垃圾?掌握这套心法,让你和同事拉开差距!
提示词工程是上下文工程中至关重要的基础,而上下文工程已成为与大语言模型协作的核心环节。简单说,**提示词工程就是通过合理组织指令,让 AI 模型输出更符合需求的结果,**比如:怎么提问、指定输出风格、提供背景信息,最终引导 AI 按你的目标做事。
2025-11-24 15:36:08
268
原创 技术拆解:当生图模型“长出”大脑!Nano Banana Pro + NotebookLM如何实现从文本到PPT的“降维打击”?
最近这一周,Google 展示出的能力实在是太猛了!先是 **Gemini 3 Pro** 的编程能力,让我以前得调试半天的代码,现在 20 秒就搞定了,简直是光速。
2025-11-24 15:34:58
471
原创 20251124_143934_AI工作流(workflow)框架调研_-_如何拥抱工作流即
生成式AI技术飞速发展,正在重构各领域的底层技术范式。各种新模型、创意工具的更新节奏也越来越快,这一趋势迫使我们必须开始思考:如何能更高效的跟踪、验证并上线各种新AI能力。
2025-11-24 15:32:04
560
原创 大厂面试新风向!LLM如何让客服实现“情感连接”?从标准响应到商业闭环,一文说清!
随着人工智能技术的飞速发展,特别是大语言模型(LLM)的突破性进展,智能客服正经历一场深刻变革。传统的客服系统主要依赖规则和简单的机器学习模型进行文本分析,无法准确识别用户的情感变化,导致用户在体验过程中常常感到冷漠和缺乏个性化服务。而如今,大语言模型凭借其强大的语言理解和生成能力,正将智能客服从被动应答的"数字前台",转变为能够主动解决问题的"AI员工",实现从标准响应到情感连接的质的飞跃。
2025-11-24 14:30:25
607
原创 面试官:“Transformer底层原理说一下?” 别再只会背概念了!ToyNLP带你从零手撕,彻底搞懂!
终于到了介绍 ToyNLP 项目的时候,这应该是个人今年投入时间最多的项目了。其实就是这个项目开发过程中的一个记录。今天我们来简单谈谈这个项目的来龙去脉。
2025-11-24 14:28:25
574
原创 (建议永久收藏)万字长文,熬夜整理!吃透这27个AI应用场景,让你彻底看懂AI的现在与未来!
应用于深度挖掘文本、音视频、图像、办公文件中的高频词、人物、价格、甲乙方、指标参数、时间、地名、企业名称、专有名词、主题、热点、话题、正负面情感等,自动对其打上数据标签等功能,将企业原有历史沉淀海量无序的内容结构化处理,实现更精准的检索、分类、搜索、推荐能力。系统标签覆盖上百个大类、过万个小类,通用场景主题标签600+,行业关键词标签百万级。同时提供模型训练工具,边标边训练可进一步降低成本。
2025-11-24 14:26:59
339
原创 老板问:“你的RAG知识库效果怎么样?” 别再凭感觉回答了!我们用评估框架,让效果“开口说话”!
过去半年我们花了很多工夫来建设企业内部研发知识库,除了智能体的搭建,在知识输入上,我们梳理导入了包含研发架构管理制度与规范、各类内部平台操作与引导的知识内容,但始终不好回答一个关键问题:
2025-11-24 14:24:59
602
原创 面试必问:“如何看待多模态的未来?” 回答Qwen3-Omni,直接甩开90%竞争者!
一个模型能够同时处理文字、图片、语音和视频了!新一代原生全模态大模型 Qwen3-Omni 正式发布。在 36 项音视频基准测试中,取得了 32 项开源模型最佳效果,22 项达到 SOTA 水平。
2025-11-23 14:15:00
435
原创 天花板被捅穿了!当LLM实现百万步零错误,你的“Prompt Engineering”还有用吗?
** 这篇题为《SOLVING A MILLION-STEP LLM TASK WITH ZERO ERRORS》的论文提出了一个突破性的框架MAKER,首次实现了在超过100万步LLM任务中零错误完成的壮举。论文挑战了当前LLM研究的核心局限——**错误率随任务步数增加而累积**的问题,并提出了一种全新的解决范式。
2025-11-23 11:15:00
384
原创 AI的“镜像世界”!深度解析AutoDev CLI,如何为AI Agent构建一个“质量分身”?
在新的 AutoDev MPP (Multiplatform Paradigm) 架构下,我们也基于 MPP Core 构建了 CLI 体系。而与免费送 Token 的 Gemini CLI 等相比, 作为一个开源项目,我们设计 CLI 并不是为了追随潮流。我们的初衷是为了解决上一代 AutoDev 基于 Intellij UI 框架的智能体测试困难问题
2025-11-23 07:30:00
1550
原创 Agent开发的“工业革命”来了!GitHub这个开源工具,让“写代码”变成“画流程图”!
这些现成的AI代理直接接管全流程,选题到发布自动跑,还能按你的风格来。
2025-11-22 16:06:35
712
原创 珍藏指南:OpenHands Software Agent SDK:构建大模型应用的完整开发框架
该团队还系统地比较了其 SDK 与 OpenAI Agents SDK、Claude Agent SDK 和 Google ADK 的 31 个特性,发现尽管有 15 个特性与它们中的至少一个共享,但 OpenHands 的 SDK 独特地结合了 16 个额外特性,包括原生远程执行、带沙盒功能的生产服务器,以及跨越 100+ 供应商的模型无关的多 LLM 路由。唯一可变的实体是会话状态,它是一个单一的、明确定义的真值来源(source of truth),用于跟踪正在进行的执行。因此,全面的重构势在必行。
2025-11-22 16:04:31
706
原创 搞定这篇,面试官追着给你开20K+!智能体工程师核心能力全揭秘!
一句话总结——**掌握大模型的“落地三件套”**:微调、Agent、部署。 这三块构成了一个合格 AI 应用开发工程师的核心能力,也决定了你在行业里的天花板。
2025-11-22 14:16:15
554
原创 同事都惊了!我把公司产品手册喂给Dify,一个能回答所有问题的“专家”诞生了。
导语:在上一期中,我们完成了 Dify 的本地部署,如果你已经走到这一步,恭喜你——你的“AI 知识中枢”已经初具雏形!但真正的效率提升,往往藏在细节里。本期我们将**聚焦实战优化**,手把手教你:
2025-11-22 14:15:27
282
原创 AI的“iPhone时刻”来了!智能体(Agent)产业链爆发,10倍增长风口,核心龙头全解析!
近日互联网大厂阿里动作频频,先是将旗下通义APP更名为千问APP,全面对标ChatGPT,后正式宣布“千问”项目全力进军C端市场。
2025-11-22 14:14:08
356
原创 “还在帮人写SQL?” AI+RAG智能问数,让你从“人肉取数机”变回工程师!
小伙伴们,今天给大家推荐一款只能问数系统SQLBot!本系统基于AI大模型与RAG技术,打造了一款智能问数工具。用户只需接入SQLBot,即可通过自然语言提问(如“帮我查一下上个月新增用户”),系统将自动生成SQL语句并返回查询结果,极大降低了非技术同学使用数据的门槛。
2025-11-22 14:12:24
501
原创 行业天花板!我们拆解了头部企业的12个AI应用,发现他们都在做同样
基于2025年最新行业报告和案例,以下是对企业内部成熟AI应用场景的综合总结。
2025-11-22 14:11:05
677
原创 万字长文 | 彻底搞懂Agent记忆!这套九大技术实践,打通你的技术任督二脉!
本文参考和整理了业界领先的Agent记忆优化技术,以一个典型的**工业设备维护与诊断Agent(工控智维Agent)**为应用场景,为读者提供从基础到高级的九大记忆优化技术参考,并提供代码框架和思路。
2025-11-21 17:37:45
894
原创 想拿高薪Offer?先搞懂实时RAG!从流式索引到消息队列,构建企业级知识更新体系。
在企业级知识问答系统、智能客服、行业知识库等场景中,**Retrieval-Augmented Generation**(RAG)已成为结合大模型与私有知识的核心技术。然而,大多数现有RAG系统采用**T+1批处理模式**——即每天凌晨将新增或修改的文档批量向量化后写入向量数据库。
2025-11-21 17:03:04
988
原创 深度好文 | LLM是“淘金热”,AI才是“工业革命”!别把泡沫当未来,这才是普通人的破局点!
Hugging Face联合创始人兼CEO克莱姆·德朗格(Clem Delangue)表示,我们并非处于AI泡沫之中,而是陷入了“大语言模型(Large Language Models,简称LLM)泡沫”——且这一泡沫可能即将破裂。在周二举办的Axios活动上,这位热门AI平台及社区网站背后的创业者认同,“泡沫论”是当下的关键议题,但他强调,即便该泡沫破裂,AI的未来也不会面临风险。
2025-11-21 17:02:25
436
原创 AI的“哥白尼革命”!腾讯让LLM从“响应”走向“沉思”,“我思故我玩”Agent到底有多牛?
你是否曾想过,AI 是否能像人类一样,通过“思考”来学习一款全新游戏?传统的人工智能系统,如 AlphaGo 或 OpenAI Five,虽然能在围棋或 Dota 2 中击败人类冠军,但它们的学习过程依赖海量数据和“黑箱”神经网络,既不透明也难以理解。近年来,大型语言模型的崛起为我们提供了新的可能:能否让 AI 通过自然语言进行推理 (reasoning) 和规划 (planning),从而更高效、更可解释地学习?
2025-11-21 17:01:35
522
原创 Agent Lightning 惊艳发布!一行代码让你的 Agent 学会自我进化,强化学习不再是巨头专利!
当前的 AI Agent 在复杂任务中虽然展现出了灵活性,但仍然面临显著挑战:它们容易出错,特别是在未经训练的场景下(如私有数据集、多轮交互工作流)表现不佳。虽然提示工程能带来一些改进,但要真正释放 Agent 的潜力,我们需要对模型进行**训练和微调**。
2025-11-21 17:00:12
673
原创 (保姆级综述)遥感大模型微调“天花板”!六大范式、九大方向,一篇给你划好重点!
🔥随着大数据和遥感基础模型(RSFM)的爆发,遥感图像解译范式已从单一模型设计转向“基础模型 + 微调”的高效应用。传统的全参数微调面对土地调查、气象预报等领域的“小样本、长尾目标”挑战时,面临巨大的算力与数据成本。为系统解决这一痛点,清华大学胡事民院士团队联合南开大学范登平教授团队、湖南大学李树涛教授、武汉大学杜博教授和中科院孙显研究员联合发布首篇系统性遥感微调综述。该综述的核心贡献在于,它将遥感微调技术清晰地划分为 **Adapter**、Prompt、LoRA等六大核心范式,首次系统梳理了技术脉络,
2025-11-20 14:48:56
563
原创 万字长文,彻底榨干文心5.0!深度实测,它凭什么说多模态超越GPT-5?
2025年11月13日,在百度世界大会上,中国搜索巨头百度正式发布了其最新一代基础大模型——文心一言5.0预览版(ERNIE 5.0 Preview)。这款模型不仅在多项关键基准测试中宣称“击败”OpenAI的GPT-5和谷歌的Gemini 2.5 Pro,更标志着百度在全球企业级AI市场的雄心进一步升级。
2025-11-20 14:47:16
993
原创 (保姆级解读)澳门大学唐教授雄文!一文读懂医学多模态LLM的“前世今生”!
*Intelligent Oncology* 2025年第4期发表了由**澳门大学唐远炎教授**作为通信作者的综述文章"*Medical multimodal large language models: A systematic review*",该文对医学多模态大语言模型(MLLMs)这一新兴领域进行了系统梳理与总结,深入剖析了其核心架构、训练方法、评估体系及临床应用,并指明了当前面临的挑战与未来发展方向。文章旨在为构建能够理解复杂临床语境、进行跨模态推理的医疗人工智能(AI)系统提供全面技术指南。
2025-11-20 14:45:02
729
原创 ACM MM 2025 | 不用重训,也能消除偏见!这个方法让多模态模型更“公平”!
在计算机视觉和自然语言处理领域,多模态大型语言模型(MLLMs)已成为不可或缺的工具,能够熟练地基于视觉输入生成文本回复。尽管取得了进展,我们的研究揭示了一个值得注意的偏见:生成内容往往更多地受底层大型语言模型(LLMs)固有先验驱动,而非输入图像本身。
2025-11-20 14:41:02
821
原创 你的大模型又慢又贵?Uni-MoE-2.0来了,用MoE架构实现“降本增效”!
Uni-MoE-2.0-Omni是哈尔滨工业大学(深圳)研究团队推出的开源全能多模态大模型,基于Qwen2.5-7B架构构建,在语言核心的多模态理解、推理与生成能力上实现显著突破。模型通过三大核心技术贡献——动态容量混合专家(MoE)设计、渐进式训练策略与多模态数据匹配技术,实现了对文本、图像、音频、视频等10种模态的统一处理,并在85个基准测试中超越或媲美主流全能模型(如Qwen2.5-Omni)。其关键优势包括:视频理解平均提升7%、全能模态理解提升7%、长语音处理错误率降低4.2%,以及在图像生成与控
2025-11-20 14:39:27
704
原创 重新定义“看懂”!港理工&腾讯的像素级模型,让AI精准到每一个像素点!
UniPixel 是一款大型多模态模型,能灵活处理图像和视频中的目标指代与分割任务,通过创新的目标记忆库将像素级感知与视觉推理结合,在 10 个基准测试中表现最优,还新增了 PixelQA 任务并建立基准。是由香港理工大学和腾讯ARC实验室等机构联合发表的研究成果,已被NeurIPS 2025接收。它首次在一个统一的模型中实现了像素级的视觉推理能力。
2025-11-20 14:38:14
901
原创 (深度拆解)商汤如何用800万数据“喂”出空间智能?这篇把SenseNova-SI的技术路线扒给你看!
今天想和大家聊一篇非常有意思的新工作。我们都知道,现在的多模态大模型,像Qwen、InternVL这些,看图说话的能力已经非常惊人了。但如果让它们理解三维空间,比如判断物体远近、想象不同视角下的场景,它们往往就“犯迷糊”了。这其实是个挺关键的问题,毕竟,要让AI真正融入物理世界,空间智能(Spatial Intelligence)是绕不过去的一道坎。
2025-11-20 14:37:23
858
原创 王炸!ICCV 2025 PURE提出“理解式超分”,传统算法彻底out了!
带大家速读一篇真实图像超分论文,作者提出了首个将 **自回归多模态大模型** 引入 Real-ISR 的统一范式 **PURE**。该方法通过“感知退化—理解语义—逐步重建”的链式推理,使模型在生成高分辨率细节前先真正看懂低质量图像内容,并结合基于熵的动态 Top-k 采样显著提升局部结构真实性。实验显示 PURE 在真实场景中获得更高的视觉自然度与语义一致性,在主观评测中明显优于 SeeSR、OSEDiff 等扩散模型。该研究代表底层视觉从“生成细节”迈向“理解驱动重建”的新方向,为大模型赋能真实图像恢复
2025-11-20 14:36:08
834
原创 我悟了!AI的终极形态不是“单核大脑”,而是“分布式网络”!南大&蚂蚁用图思维链给出答案。
图思维链(Graph-CoT)使大型语言模型(LLMs)能够对图结构知识进行逐步推理,但现有技术方案因采用单智能体整体提示、上下文重复编码(re-encoding)及低效的服务执行,存在准确率低、token消耗过高、延迟严重及吞吐量低等问题。
2025-11-19 11:15:56
874
原创 别只选模型,在选“世界观”!从文本到多模态,Embedding的底层逻辑与选型心法
通过将原始输入转化为固定维度的高维向量以捕捉语义信息,Embedding(嵌入)模型在构建 RAG、推荐系统,甚至自动驾驶模型训练中都发挥着极为关键的作用。近年来,OpenAI、Meta、Google、阿里、腾讯等科技巨头纷纷加大对 Embedding 模型研发的投入。以 OpenA I为例,其最新推出的 text-embedding-3-small 模型能够生成1536维向量,在保持高语义表达能力的同时,实现了更低的延迟和更小的模型体积,非常适合对性能要求较高的大规模语义检索场景。阿里和腾讯最近也推出了
2025-11-19 11:14:47
636
原创 AI Agent的“GPS导航系统”!一文搞懂ReAct思想,让Agent告别“迷路”,精准抵达目标(附完整案例)。
ReAct Agent,也称为ReAct框架,是一个用于提示大语言模型(LLM)的创新方法。它首次出现在2022年10月的论文《ReAct:Synergizing Reasoning and Acting in Language Models》(https://arxiv.org/pdf/2210.03629) 中,并于2023年3月进行了修订。该框架旨在将大语言模型中的推理(Reasoning)和行动(Acting)有机结合,从而使AI代理(Agent)变得更加强大、通用且易于解释。通过交替进行推理和行动
2025-11-19 11:13:42
662
原创 给AI客服一颗“心”!大小模型协同实战,打造第一个真正“有温度”的智能体。
随着大规模语言模型在自然语言处理领域取得突破性进展,基于通用大模型的智能客服系统展现了强大的对话生成能力。然而,其在垂直业务场景下面临着成本高昂、专业知识不足、情感感知迟钝及事实性幻觉等挑战。
2025-11-19 11:12:16
548
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅