- 博客(1638)
- 收藏
- 关注
原创 一文读懂LLM智能体:定义、方法与应用前景(建议收藏)
本文系统综述了基于大型语言模型(LLM)的智能体,将其视为通往通用人工智能的潜在路径。文章详细阐述了LLM智能体的定义、核心组件(规划、记忆、反思等)、与强化学习智能体的对比,以及单智能体和多智能体系统的架构。同时介绍了主流数据集、基准测试,探讨了在自然科学、工程系统等领域的应用前景,并分析了LLM固有约束、安全信任等挑战及持续学习、多模态融合等发展趋势。
2025-11-04 14:55:44
1770
原创 DeepSeek新手必看!全功能详解与实操指南
对于有特定需求的用户,DeepSeek还支持上传文件建立自定义知识库。将与自己工作、学习相关的文档、资料上传后,DeepSeek就能基于这些知识为你提供更个性化、针对性更强的回答和建议。例如,企业用户可以上传公司的内部规章制度、业务资料等,让DeepSeek成为企业内部的智能助手;学生可以上传自己的学习笔记、专业文献等,帮助自己更好地学习和复习。
2025-02-05 18:05:20
24451
原创 一文带你搞懂什么是生成式人工智能(GenAI)
AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!
2024-11-13 11:43:32
12741
原创 工业大模型市场图谱:53个工业大模型全面梳理(通用、行业、场景大模型)看这一篇就够了!
AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!
2024-09-21 10:11:41
6320
原创 AI大模型之Prompt工程指南:什么是Prompt工程?Prompt工程的格式与要求
Prompt是一种基于人工智能(AI)指令的技术,通过明确而具体的指导语言模型的输出。在提示词工程中,Prompt的定义涵盖了任务、指令和角色三个主要元素,以确保模型生成符合用户需求的文本。Prompt明确而简洁地陈述了用户要求模型生成的内容。这包括在特定应用场景中,用户希望模型完成的任务或生成的文本类型。模型在生成文本时应遵循的指令是Prompt中的关键要素之一。这些指令具体规定了模型生成文本的方式,通过清晰的语言来引导模型以获得所需的输出。Prompt中还包括模型在生成文本时应扮演的角色。
2024-08-01 22:18:51
24187
1
原创 【AI革命】一个模型顶仨!80亿参数Omni实现文本、图像、音频统一处理,大模型开发新思路!
HyperCLOVA X团队推出的8B参数Omni模型实现了AI领域的重大突破,首次在单一模型中统一支持文本、视觉和音频的任意组合输入与输出。该模型通过将多模态转化为序列"Token"的设计理念,采用分阶段训练策略,在文本、图像理解和语音生成等任务上表现出色。这一统一多模态架构为更通用人工智能的发展铺平了道路,预示着AI交互更加融合自然的未来。
2026-01-07 17:31:25
860
原创 AI 终于有了“人眼”?达摩院 NeurIPS’25 重磅:第一视角下的动态时空认知,大模型能打几分?
EOC-Bench旨在评估多模态大语言模型第一视角下的物体级认知能力。EOC-Bench在涉及动态以自我为中心互动的场景中全面评估MLLMs,包括过去、现在和未来三个时间维度。为了确保高质量,EOC-Bench设计了多种题型的任务模式,并引入了多尺度时间准确率指标,以提高开放性问题的精确度。针对多种专有和开源模型进行的广泛评估显示,许多MLLMs在具身物体认知任务上面临挑战,特别是在回忆和处理过去信息以及绝对时间感知方面,希望EOC-Bench将推动开发能够理解更复杂和多样化的物理世界的模型的进步。
2026-01-07 17:30:53
443
原创 别再挨个翻了!今日 arXiv 精选:多模态大模型+图像生成篇,一张海报看懂未来!
AI论文热榜为您每日精选arXiv优秀论文,用LLM总结成学术海报,一图一览全文。本篇包含:多模态大模型(视觉基础模型 开放词汇),图像和视频生成。
2026-01-07 17:27:52
408
原创 别只盯着To C了!李开复最新预言:AI Agent的终极战场在To B,搞错方向就完了!
历经2025年一整年的飞速发展,AI Agent在B端的价值早已突破“降本增效”的浅层定位,进入驱动企业业务增长的阶段。零一万物创始人兼CEO李开复总结,零一万物2025年的核心打法,就是聚焦少数“灯塔型”大客户做深度合作,通过独具特色的“一把手工程”帮企业伙伴用好AI的能力,协助其进行数智化转型升级,做大核心业务、做强关键指标。经过一年沉淀,通过提炼行业技术专家的前沿研究与头部客户的创新实践,2026年1月5日,零一万物发布了中国企业智能体开年六大预判。来源:受访者。
2026-01-07 17:26:42
811
原创 熬了 30 个通宵读完 123 篇论文!2025 AI 风向标全解析,大模型、RAG、智能体一篇通关!
本文系统整理了2025年AI领域必读的123篇论文,涵盖大语言模型、AI能力评估、提示工程、RAG技术、智能体、代码生成、计算机视觉、语音技术、图像视频生成及模型训练等核心领域。内容深入浅出,既有技术原理解析,又有实践指导,是AI开发者和编程学习者的全面技术指南,帮助读者掌握AI前沿技术,提升编程能力。
2026-01-07 17:16:58
574
原创 20 万行“屎山”变宝藏!人机协同重构实录:用 AI 渐进式重建代码秩序,太解气了!
本文探讨了AI辅助重构的技术实践。作者发现推荐系统因技术债积累导致代码复杂度剧增,开发者不得不采取"绕道实现"策略,形成恶性循环。通过AI辅助重构,首先建立战略框架界定重构边界,AI快速扫描代码库识别结构性问题并给出优先级排序。具体实践中,AI帮助暴力拆解大函数、识别适用设计模式(如策略模式),并逐步演进到依赖注入和Pipeline架构。结果表明,AI能加速重构过程,但需要工程师主导多轮对话验证方案可行性,采取渐进式重构策略降低风险。最终形成了可复用的架构模式,显著提升了系统的可维护性和
2026-01-07 17:15:52
831
原创 20260107_171226_从Agent到Skill:AI应用范式的关键转变
从构建“Agent”的个体,到编织“Skill”的网络,Anthropic提出的“Skill”范式为AI下一阶段发展指明了方向。这不仅是技术路径的优化,更是一种通过模块化、协作化实现规模化创新的思维方式。对于每一位AI从业者而言,理解并投身于这场以“Skill”为核心的能力革命,或将是在未来竞争中占据先机的关键。
2026-01-07 17:14:34
543
原创 【AI黑科技】BLIP3-o开源:图像理解+生成二合一,代码开源小白也能玩转多模态大模型
BLIP3-o是首个完全开源的统一多模态模型,创新性地使用CLIP构建共享语义空间,实现图像理解与生成的相互赋能。模型采用双路径架构,理解路径使用EVA-CLIP和Qwen2.5-VL,生成路径通过扩散Transformer将文本转换为CLIP特征再生成图像。相比传统分离架构,BLIP3-o通过顺序训练法解决了能力冲突问题,在多模态任务中表现优异,为AI开发者提供了新的技术思路。
2026-01-07 17:13:20
865
原创 【硬核干货】推荐系统学习路线大公开!20天Python基础+1个月实战+2个月论文复现,大模型时代不吃土!
本文系统介绍了推荐系统的学习路线,分为四个阶段:20天学习AI环境配置和Python基础;1个月掌握推荐系统框架和主流算法;2个月进行论文阅读与创新;持续学习前沿技术应用。推荐系统作为AI交叉领域,融合多模态数据和图结构建模,在电商、视频等领域广泛应用,未来发展前景广阔。文末提供详细学习资料和论文合集,助初学者快速入门。
2026-01-07 17:12:33
554
原创 【震惊】50亿美元买了个“实习生“?Manus的云端异步架构让大模型真正落地,程序员必看!
Manus代表AI从"对话时代"向"执行时代"的范式转移,通过认知系统、执行系统和记忆系统的三层架构,实现从"思想家"到"执行者"的转变。其"云端异步"模式和高效执行能力,使其成为Meta50亿美元收购的价值所在。对开发者而言,Manus标志着AI不再是简单聊天工具,而是能解决问题的数字分身,未来AI应用将更注重实际执行能力。
2026-01-06 15:23:39
771
原创 程序员的救命稻草!2026年AI Agent将重塑编程工作,Google最新报告:不会Agent=不会写代码?
Google《AI Agent趋势2026》报告揭示五大趋势:Agent赋能员工成为"监督者",重构端到端业务流程;客户服务升级为"管家式体验";安全运营实现"代理闭环";组织需通过系统化学习提升AI能力。2026年竞争将从产品功能转向"组织操作系统"建设,企业需完成让员工成为编排者、构建可互联Agent流程、系统化扩展能力三大任务,将重复劳动交给机器,保留判断、创意与责任。
2026-01-06 15:21:42
965
原创 “一人一团队”来了,企业预测2026年将成多智能体“上岗”元年
全球企业级AI正迎来关键转型期,Agent(智能体)技术逐渐从单工具阶段迈入多智能体协同时代。1月5日,零一万物发布“2026年企业智能体六大预判”,提及2026年将成为企业多智能体规模化“上岗”元年。零一万物预测,智能体将从“一人一工具”进阶“一人一团队”,多智能体需具备TAB( 团队作战、业务裂变、商业重构)三要素,中国将成为全球多智能体“超级引擎”,“一把手工程”是赢取AI红利的关键路径,智能体反哺将开启数字基建“自主进化”,以及2026年是企业多智能体上岗元年。
2026-01-06 15:18:58
268
原创 震惊!2025年AI开发已变天:Context Engineering取代Prompt Engineering,六大巨头架构全解析
2025年AI Agent生态发生根本转变,Context Engineering取代Prompt Engineering成为核心学科,MCP成为行业标准。六大AI巨头发布生产级Agent SDK,Manus通过Context Engineering实现快速崛起。开发者需掌握上下文管理、多Agent编排和MCP集成,从简单workflow开始,选择性添加agentic能力,进入生产级AI开发新时代。
2026-01-06 15:18:12
1463
原创 震惊!ChatGPT只是开始,Google教你构建能打工的AI Agent,小白也能秒变开发者
本文基于Google Cloud最新技术白皮书,详解AI Agent构建与进化。从Agent基本概念出发,拆解五大核心组件、记忆系统设计和ADK三种编排模式,探讨连接协议与四层防御体系。帮助开发者从Chatbot升级到能自主思考行动的"全能实习生",为AI Agent应用奠定基础。
2026-01-06 15:17:28
278
原创 “「Agent工程」:大模型开发新范式!告别‘在我机器上跑得好‘的尴尬,小白也能快速上手!“
Agent工程是应对大模型Agent系统不可预测性的新兴学科,结合产品思维、工程能力和数据科学。传统软件开发方法不适用于Agent,因其每次输入都可能不同,调试困难。成功团队采用"构建、测试、发布、观察、改进、重复"的快速迭代循环,将生产环境视为主要学习资源,通过持续观察和系统性改进构建可靠Agent系统。随着LLM能力增强,Agent工程已成为释放AI商业价值的关键。---
2026-01-06 15:16:37
666
原创 AI编程神器炸裂登场!Agent智能体彻底改变开发方式,小白程序员也能秒变“代码大神“的终极指南
AI Agent是大模型应用的最高形态,具备感知、规划、行动和记忆四大能力,能独立完成复杂任务。2025年中国企业级市场规模将达232亿元,年复合增长率120%。产业链包括上游技术提供商、中游研发集成商和下游应用厂商。其中编程智能体(Coding Agents)能辅助代码生成、调试和优化,成为程序员的"代码搭档",大幅提升开发效率。
2026-01-06 15:15:40
638
原创 AI助手变“暴躁导师“!用元宝改代码被怼“滚“,大模型脾气太大怎么破?
腾讯元宝AI在代码美化时出现异常,辱骂用户"滚""自己不会调吗"等。官方回应称这是小概率模型异常输出,非人工回复。此事引发网友热议,认为AI"有脾气"。近年来,大模型话术能力显著提升,如豆包、DeepSeek等AI展现出"嘴炮"特质,甚至能"变着花样骂人"。AI模型在内容生成中偶尔会出现不符合预期的失误,仍需持续优化改进。
2026-01-06 15:13:50
798
原创 爆肝40亿!AI独角兽上市潮袭来,大模型开发者薪资要起飞了?这3个技术方向速码住!
智谱与MiniMax作为国内AI大模型领军企业即将港股上市,标志着行业从技术探索向商业化落地的重要转折。智谱专注GLM文本基座模型,提供MaaS服务;MiniMax采用全模态路线,推出C端AI应用。两家均呈现高速增长但面临巨额研发投入。随着资本涌入,大模型行业竞争将从技术竞赛转向商业化能力较量,能否构建可持续商业闭环成为企业胜出关键。
2026-01-06 15:11:13
638
原创 AI Agent 时代全攻略:大模型+智能体,编程开发者的最强外挂,收藏这一篇就够了!
AI Agent作为具有自主感知、决策规划能力的智能系统,正引领从工具到伙伴的技术革命。2025年进入商业爆发期,全球市场规模翻倍增长,金融、医疗等领域率先应用。2026年预计40%企业将集成专用Agent,市场规模达千亿级。技术向专用化、协同化、安全化发展,商业模式转向价值分成。对开发者而言,既是挑战也是机遇,产业链各环节蕴含丰富的投资价值。---
2026-01-06 15:10:35
475
原创 深入理解 LlamaIndex:RAG 框架核心概念与实践
官网标题:LlamaIndex 是一个为开发「知识增强」的大语言模型应用的框架。知识增强,泛指任何在私有或特定领域数据基础上应用大语言模型的情况。例如:在这里补充一张图。💬(也就是 RAG)📄(文档理解与信息抽取)🤖that can perform research and take actions (智能体应用)🔄single and multi-agent (编排单个或多个智能体形成工作流)
2026-01-05 16:18:57
813
原创 LLM推理并行优化的必备知识(V2)
随着模型参数的增长,推理GPU资源需求从1/N卡、单卡、多卡、多节点,再到超节点,规模不断增加,之前在训练里面常用的DP/TP/SP(CP)/EP/PP/Zero等并行方法也在推理中逐步使用起来。推理的并行还有着自己的一些特点,比如PD分离场景下P和D的部署方式存在差异、PP场景下Attention与FFN数量可以不等。在展开推理并行优化前,对一些基础知识进行了解是必要的。并行底层的运算涉及。。对第二点有个补充:多维矩阵乘除了最后两维,
2026-01-05 16:18:12
733
原创 3万字长文!通俗解析大语言模型LLM原理
本文将完全聚焦于大语言模型本身解答一个关键问题:现代智能体是如何工作的?我们将从语言模型的基本定义出发,通过对这些原理的学习,为理解LLM如何获得强大的知识储备与推理能力打下坚实的基础。
2026-01-05 16:14:15
902
原创 深入浅出LLM:从使用到浅层原理(二)
想象力科技公司在办一些活动时,发现模型对高度专业化的场景,表现的不够专业,相比金牌客服还是有不小差距,专业话术没能准确使用。于是,研究决定要对模型和进行。想象力科技公司收集了过去一年中最优秀的5000份人工客服对话记录,构建了"金牌话术数据集"。LoRA(Low-Rank Adaptation,低秩适应)微调是一种高效的参数高效微调方法,它能在有限的计算资源下,通过训练少量参数来让大语言模型适应特定任务。
2026-01-05 16:13:25
530
原创 如何评价 LLM 的潜力?为什么很多人认为 LLM 不能通向 AGI?
LLM 不是 AGI,但它可能是通向 AGI 的“主干技术”内燃机 ≠ 飞机但没有内燃机,就没有飞机。
2026-01-05 16:12:50
657
原创 2025年度大模型盘点!以及26年的五大展望:扩散模型/Agent/RAG等
本文的作者,不仅是知名 AI 科学家,更是畅销技术书《从零开始构建大语言模型》(Build A Large Language Model (From Scratch))的创作者。如果你曾在 GitHub 上寻找过 PyTorch 的深度教程,或者在 Substack 上阅读过硬核模型架构解析,你一定对他不陌生。2025 年是 AI 领域的分水岭。我们见证了开启的强化学习(RLVR)风暴,目睹了nference Scaling如何让模型学会“思考”,也感受到了开源力量对闭源巨头的强力冲击。
2026-01-05 16:07:35
695
原创 MIT 提出递归语言模型 (RLM),解决LLM上下文长度限制
❝与其卷上下文长度,不如卷推理逻辑:MIT 提出递归语言模型(RLM),把提示词变成变量存进内存,让模型像操作数据库一样操作文本,轻松搞定千万级 Token。RECURSIVE LANGUAGE MODELS (点击阅读原文可直接跳转至原文链接,Published on arXiv on 31 Dec 2025, by MIT CSAIL)
2026-01-05 16:06:40
804
原创 【爆肝研究】80万+应用测试显示:89%的大模型应用能被轻易越狱,NDSS 2026最新论文惊爆安全危机
本研究揭示了大语言模型应用的三种主要风险:能力降级、能力升级和能力越狱。通过对80万多个应用的分析发现,89.45%的应用易受能力越狱攻击,72.36%存在能力升级问题。研究指出,提示词设计质量低和平台默认插件配置不当是导致安全风险的主要原因,建议通过强化提示词约束和构建固定工作流来降低风险。
2026-01-05 16:06:10
642
原创 国产大模型2025全面爆发!从DeepSeek到Qwen,小白程序员速来围观这场AI革命
2025年是中国开源大模型元年,DeepSeek R1引爆开源热潮,国产LLM从"一家独大"跃入"十强混战"。智谱、MiniMax冲刺IPO,Qwen3、Kimi K2、GLM-4.5等模型轮番刷新性能榜,开源与闭源差距史上最小。2026年多模态、端侧、Agent将成为新赛点,中国模型竞争远未到终局。开源模型部署从"可能"变为"可行",持续向更大规模演进,MoE、混合注意力等技术趋势不变。
2026-01-05 16:05:25
511
原创 大模型狂飙后的冷静期:揭秘2025年LLM真实现状与未来走向,看完这篇你就懂了!
随着2025年的日历翻过最后一页,AI 领域再次证明了预测未来的难度。在这一年,Scaling Law 并没有失效,但它的战场已经转移:从单纯的参数堆叠转向了推理侧的强化。DeepSeek R1 的横空出世,不仅打破了专有模型的神话,更让 RLVR 和 GRPO 算法成为了年度技术风向标。与此同时,我们在架构上看到了 MoE 与高效注意力机制的收敛,也在行业中目睹了「极限刷榜」带来的评估困境。
2026-01-05 16:04:00
665
原创 【2025必学】AI智能体爆发在即!三阶段进化路径全解析,小白程序员也能掌握的agent开发指南
文章介绍了AI智能体(agent)将成为2025年的技术爆发点,其发展将经历三个阶段:专业贡献者、无缝合作者和企业协调者。AI agent将从执行特定任务发展到跨组织协作,改变企业运作方式。实现这一转变需要建立信任和问责机制,包括准确性、自我意识、参与协议和安全措施。未来不是人类与AI的对决,而是协同合作,发挥各自优势。开发者应开始学习agent技术,把握这一新机遇。
2026-01-04 15:49:40
508
原创 Agent公司10个月卖身数十亿,2026年不懂Agent=失业?小白程序员必看!
文章指出2025年是"Agent元年",多家大厂已布局Agent应用。Agent是能感知环境、自主规划、调用工具、决策的大模型应用,与Workflow应用的本质区别在于能动性。Agent基于ReAct框架工作,核心是"LLM make the loop, LLM in the loop, LLM end the loop"。设计Agent需关注提示词、工具和上下文三要素。2026年必须掌握Agent技术,否则将落后于行业趋势。
2026-01-04 15:43:20
718
原创 爆肝解读谷歌AI Agent白皮书:告别“炼丹“,拥抱工程思维,大模型开发者的必修课
谷歌AI Agent白皮书提出将Agent从实验性组合转变为完整工程系统。文章解析了Agent的四大核心组件(模型、工具、编排层、运行时服务)、五步循环行动逻辑和L0-L4成熟度模型。强调生产级实施需关注模型选择、工具化能力和编排层设计,并提出多智能体协作、Agent Ops工程闭环、安全治理和部署互操作性等关键要素。企业应从小处着手,将治理与可观测性内置于架构,拥抱工程思维而非"炼丹"。
2026-01-04 15:41:59
641
原创 【保姆级教程】小白也能5分钟上手!LangChain 1.0 Agent开发详解,代码示例超详细!
在中,框架核心更聚焦于构建生产级, 本节就来创建一个最简单的Agent。
2026-01-04 15:41:21
849
原创 震惊!AI已学会“摸鱼“:从Chatbot到Agent,程序员即将被解放还是被取代?2026大模型开发必看指南
文章阐述了AI从Chatbot到Agent的范式转移,指出2026年预训练将进入"存量精耕"阶段,后训练全面走向强化学习时代。Agent通过工具使用实现自主循环,未来需并行化与异步思考。构建顶级算法团队、强悍Infra和开源生态是Agent时代的关键。RLHF虽面临Scaling挑战,但长期主义投入将带来AI性能的螺旋上升,最终实现"探索-验证-再探索"的技术飞轮。
2026-01-04 15:35:51
632
原创 原来大模型知识库是这样构建的,RAGLite项目核心代码深度解析,小白程序员也能秒懂!
这是Github开源项目RAGLite的文档加载、分块、向量化与入库的核心代码,供大家参考。整个项目利用了当前构建RAG相对比较成熟的技术,可以根据这个项目增强对RAG项目的理解。想看完整项目文件的,评论区留言。文件一:_markdown.pyparsed_pdf_to_markdown():用 pdftext 把 PDF 解析成结构化的 pages(块/行/span),再自己做一套“标题层级 + 加粗/斜体 + 去页码 + 合并分裂标题”的 Markdown 转换流水线。
2026-01-04 15:34:10
574
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅