- 博客(1533)
- 收藏
- 关注
原创 在个人电脑上运行Llama 3 70B大规模模型指南
随着人工智能和机器学习技术的迅猛发展,像Llama 3 70B这样的庞大语言模型已经成为了研究、开发和应用中的重要工具。这篇文章将详细介绍如何在个人电脑上运行Llama 3 70B大模型,并涵盖硬件要求、软件环境配置、安装步骤、运行示例和常见问题的解决方案。虽然运行这样一个大规模的模型在性能上有限制,但对于实验和学习非常有帮助。
2024-06-15 10:35:11
8397
原创 2024!国内AI大模型平台哪家强?全方面测评来了
这篇仅是开坑哈,后面会持续更新的~主旨就是想要在滚滚浪潮中帮助AI开发者发现、汇聚到简单、好用的AI大模型平台&开发者社区上来,共建国内繁荣AIGC生态!!有些规模太小、不好用、吃相太难看(没几个模型就要走付费变现路子的)的平台我就先不放上来啦。
2024-06-05 17:14:02
8599
原创 如何学习训练大模型——100条建议(附详细说明)_如何训练自己的大模型
通过深入了解本文中的这些细节,并在实际项目中应用相关知识,将能够更好地理解和利用大模型的潜力,不仅在学术研究中,也在工程实践中。通过不断探索新方法、参与项目和保持热情,并将其应用于各种领域,从自然语言处理到计算机视觉和自动驾驶。通过不断学习、实践和探索,可以不断提升自己在深度学习领域的技能和洞察力,同时也能为社会和行业带来创新和改进。从小规模的项目和模型开始,逐渐迭代和扩展到更大的模型,逐步积累经验,最终能够处理大模型和复杂任务。分享您的研究成果和代码,以获得反馈和建立声誉。
2024-04-17 11:56:47
8301
原创 AI 入门,从零搭建完整 AI 开发环境,并写出第一个 AI 应用
在本文中,我们从零开始,一步步搭建了一个完整的AI开发环境,并创建了一个简单的AI应用。您学习了如何安装Python、Anaconda、TensorFlow,以及如何使用Jupyter Notebook进行开发。通过这个简单的手写数字识别应用,您不仅学习了AI的基本概念,还亲身体验了AI的应用。AI是一个广阔而充满机遇的领域,希望这个教程能够激发您继续深入学习和探索AI的兴趣。
2024-04-10 11:02:43
12438
1
原创 国内超大型智能算力中心建设白皮书 2024
智算中心建设通过领先的体系架构设计,以算力基建化为主体、以算法基建化为引领、以服务智件化为依托,以设施绿色化为支撑,从基建、硬件、软件、算法、服务等全环节开展关键技术落地与应用。一、体系架构(一)总体架构图8 智算中心总体架构智能算力中心建设白皮书,重点围绕基础、支撑、功能和目标四大部分,创新性地提出了智算中心总体架构。其中,基础部分是支撑智算中心建设与应用的先进人工智能理论和计算架构;支撑部分围绕智算中心算力生产、聚合、调度、释放的作业逻辑展开;功能部分提供算力生产供应、数据开放共享、智能生态建设和产业创
2024-04-08 15:07:31
12826
1
原创 爆肝整理!AI Agent记忆系统全指南:一篇搞定记忆三大核心问题,建议收藏!
AI Agent记忆系统研究综述 本文系统阐述了AI Agent记忆系统的关键技术与前沿发展。研究指出,大语言模型存在"金鱼脑"缺陷,需要构建可读、可写、可生长的记忆系统。论文提出三大核心问题(记忆形成、进化与检索)、三种形态(Token级、参数化与潜变量)和三大功能(事实记忆、经验记忆与工作记忆)。介绍了20+开源框架和30+评估基准,并展望生成式记忆、自动管理等7大发展方向。该研究为AI产品经理设计记忆系统提供了理论框架和实践指导,对提升Agent持续学习能力和个性化服务具有重要意义
2026-01-09 19:14:02
532
原创 智能体路由模式深度解析:4种实现方式+5步落地方法,收藏级干货
路由模式:智能体的动态决策引擎 路由模式作为智能体系统的核心控制机制,通过"输入评估-路径决策-执行导向"的三步闭环,实现了从固定流程到上下文感知的升级。文章系统分析了4种主流实现方案:基于LLM的方案灵活性高但成本较高,嵌入方案擅长语义匹配,规则方案简单高效,机器学习方案则适合高并发场景。典型应用覆盖对话系统、自动化办公和多智能体协作三大领域,并提供了从需求分析到迭代优化的五步落地方法论。该技术使智能体能够像人类一样根据情境动态调整行为,大幅提升了系统的适应性和扩展性。
2026-01-09 19:12:25
607
原创 收藏!揭秘:90%的前端AI项目都是“伪AI“,大厂级AI产品的前端核心能力深度解析
文章揭示了当前前端AI开发的现状:多数项目仅停留在简单调用API的Demo阶段。真正的企业级AI产品需要前端掌握流式输出、模型状态管理、Tool Calling调度等核心能力,将AI产品视为状态机+UI而非简单聊天框。前端开发者需深入理解AI模型工作原理,参与Agent决策循环,才能构建出真正的大厂级AI产品,而非仅仅包装API的伪AI应用。
2026-01-09 19:11:45
453
原创 【必看收藏】LangChain v1.0大更新!create_agent核心功能详解,让你的AI助手更强大
摘要:LangChain v1.0更新引入create_agent作为核心入口,简化AI助手构建流程。通过@tool装饰器定义工具(如天气查询、数学计算)作为AI的"手脚",Middleware机制实现业务逻辑解耦(如脏话过滤)。新版本采用更优雅的语法结构,支持统一配置模型、工具和中间件,适用于从简单问答到复杂任务处理等多种场景。
2026-01-09 19:10:59
446
原创 收藏!2026大模型行业格局剧变:从追赶者到引领者,从业者必看的赛道选择指南
自2025年春节Deepseek R1发布以来,短短半年时间里,国内大模型领域迎来爆发式突破——以纯文本大规模MoE(混合专家模型)为核心的推理模型飞速迭代,国产开源大模型不仅稳稳占据全球开源领域头把交椅,至今仍保持遥遥领先的优势,甚至倒逼OpenAI推出GPT-OSS开源方案跟进。其中,DeepSeek、GLM、Kimi、Qwen等国产模型凭借强大的技术实力积累了广泛行业影响力,依托万亿参数级MoE模型成功跻身全球顶级玩家阵营,稳稳坐上大模型赛道的核心牌桌。
2026-01-09 15:38:37
524
原创 收藏!腾讯加码AI赛道,零基础也能入局的36万年薪岗位,普通人抓风口必看
据央广网12月17日报道,腾讯正式升级大模型研发架构,全新组建AI Infra部、AI Data部与数据计算平台部三大核心部门。这一动作释放出明确信号:大厂正全力加码AI赛道,加速构建核心技术壁垒。事实上,2024年整个科技圈的AI热潮早已势不可挡。不止腾讯,阿里、百度等头部企业早年间就已布局AI领域,今年更是密集推出技术成果与业务布局;就连中小型科技公司、初创团队,也纷纷扎堆AI赛道,试图抢占行业红利。AI的渗透早已超出我们的想象:日常打开手机,AI修图、智能配音、对话式助手随手可得;
2026-01-09 15:37:32
465
原创 零基础入门RAG技术:用这个项目轻松掌握大模型私有数据调教秘籍
如果说大模型是一座蕴藏着无限可能的金矿,那么RAG技术就是那把开启金矿大门、并从中高效提炼价值的钥匙。在未来很长一段时间内,“私有数据 + LLM”的模式都将是企业端AI应用的主流形态。掌握RAG全栈技术,意味着你拥有了将大模型的通用能力转化为特定领域生产力的核心竞争力。Datawhale的all-in-rag项目,以其开源精神和高质量的内容,为我们提供了一份不可多得的实战指南。它不仅教会我们How(怎么做),更启发我们思考Why(为什么这么做)。
2026-01-09 15:35:56
420
原创 收藏备用!RAG落地实践核心:知识库三层架构与关键组件全解析
当前RAG技术已经度过了“demo级可用”的阶段,正在向“生产级好用”进阶。对于想要落地RAG的技术人员(尤其是小白)和产品经理来说,不能只沉迷于LLM的生成能力,更要建立对知识库这一核心底座的系统性认知——这是搭建稳定、高效RAG系统的前提。本文梳理的“知识存储-知识处理-知识管理与检索”三层架构,核心不是简单罗列技术组件,而是提供一种“分层设计、精准选型”的落地思路。希望能帮助大家在每个环节都做出符合业务需求的技术选型和工程设计,最终搭建出具备商业价值、能稳定运行的AI智能咨询或内容生成系统。
2026-01-08 15:19:01
627
原创 收藏!Java开发者转型AI应用开发指南:优势、路线与实战全解析
对于Java开发者来说,转型AI应用开发不是“跨界”,而是“技术延伸”。你无需抛弃多年积累的工程能力,只需将现有优势与AI工具结合,就能在企业级AI落地浪潮中抢占先机。按照本文的学习路线,从基础概念到实战项目,从框架使用到平台赋能,循序渐进推进,1-3个月就能具备独立开发AI应用的能力。记住:AI应用开发的核心是“工程落地”,而这正是Java开发者的强项。现在就行动起来,从第一个AI聊天接口开始,开启你的转型之路吧!
2026-01-08 15:17:37
519
原创 【收藏必看】大模型落地的最后一公里之争:7大推理引擎选型与实战指南
本文全面解析大模型推理引擎技术栈,对比Transformers、llama.cpp、vLLM、SGLang、KTransformers和MindIE等核心引擎的适用场景与技术亮点。深入讲解KV Cache、Prefill/Decode阶段、批处理策略等关键概念,提供性能基准测试和实战选型决策树,帮助开发者根据硬件资源、业务需求选择最合适的推理引擎,实现大模型高效落地与成本优化。理解推理引擎,本质上是理解如何通过极致的显存管理与算子调度,将静态的模型参数转化为动态、高并发、低延迟的流式服务。
2026-01-08 14:29:00
600
原创 AI Agent的记忆奥秘:短期VS长期记忆详解
假设你(用户)和你的聪明助理(AI Agent)还是需要协作完成一个市场分析报告项目。1、向量数据库向量数据库构建的长期记忆系统,就像升级为智能语义索引档案馆工作原理每份档案都有“内容指纹”:无论报告标题是什么,系统都会分析内容本质,生成语义标识相关档案自动聚类:“市场趋势分析”、“竞争对手研究”、“用户调研”会被放在相邻区域跨时空关联:2022年的“移动端增长”与2024年的“App用户分析”自动关联技术实现类比。
2026-01-07 19:15:39
693
原创 必藏!LLM Agent记忆系统完整架构设计:短期记忆+长期记忆+RAG实现指南(附架构图)
文章探讨如何为LLM构建记忆系统,使其从无状态函数进化为具有时间积累能力的智能Agent。系统解析了短期记忆(上下文窗口管理)和长期记忆(向量数据库)的区别与优化策略,提出通过RAG机制实现记忆检索增强生成,并设计记忆巩固机制实现两种记忆的融合。强调真正的智能记忆不仅是信息存储,更是对有价值信息的选择与整合能力。该研究为AI系统实现持续学习和知识积累提供了技术框架,对推动AI从工具向Agent演进具有重要意义。(149字)
2026-01-07 19:14:00
487
原创 分布式智能体工具权限控制优化
摘要: 智能体应用开发中,工具权限控制是关键。权限控制可通过两种方式实现:1)前置处理,根据用户权限动态加载工具创建智能体,安全性更高;2)后置处理,执行时校验权限,但存在滥用风险。需注意提示词(含工具描述)需与权限动态适配,且记忆管理需区分内存/外部存储以避免数据丢失。技术上,智能体工具权限与传统权限体系(如角色配置工具列表)可无缝结合,本质仍是基于用户角色的访问控制。核心在于通过权限隔离工具,而非限制智能体本身。
2026-01-07 19:13:17
508
原创 知识图谱的自适应优化:基于多智能体协同决策的框架
这份资料由我们和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。
2026-01-07 19:12:02
607
原创 收藏!AI基础入门(应用开发篇)——从零手写实现一个Agent
清晰列出大模型可调用的动作,包括动作名、格式要求、功能说明和示例。这一步的核心是“约束性”——通过严格的格式要求(比如动作名和参数的分隔符、示例样式),让我们后续能用正则表达式轻松提取动作和参数,降低代码解析难度。这里我们故意简化了动作列表(仅2个动作),目的是让新手聚焦于ReAct的核心逻辑;实际应用中,你可以扩展动作列表,比如添加“search_web(网页搜索)”“read_file(读取文件)”“call_api(调用外部API)”等动作。提示词定义规则 + 代码执行动作 + 上下文循环传递。
2026-01-07 16:12:54
805
原创 收藏!字节员工转岗大模型岗拿11W月薪,传统开发的AI风口逆袭指南
最近科技圈一个话题彻底火了——一位字节跳动的传统开发工程师,成功跨界转型算法大模型岗位后,直接在社交平台晒出了月薪11万的工资条。帖子一经发出,评论区瞬间被“羡慕哭了”“这波转型太值了”“我也想转”的留言刷屏,满屏的羡慕嫉妒恨,精准戳中了无数传统开发从业者的心声。其实只要最近打开BOSS直聘等招聘平台不难发现,传统开发岗位的就业环境早已不如从前:薪资涨幅停滞不前,甚至部分岗位还出现了薪资回落,而企业对求职者的要求却越来越苛刻,不仅要精通多门编程语言,还得有丰富的项目经验,入门门槛一升再升。
2026-01-07 15:35:34
345
原创 【必学收藏】智能体是什么?深入解析ReAct范式,助力AI开发者快速上手大模型智能体技术
智能体在广义上难以给出明确定义,但是 ReAct 是基于 LLM 的智能体的基础范式。•LLM 是智能体的规划器,大模型自主推理生成 Thought,规划 Action,更复杂的范式还会进行反思 Reflection;•智能体通过工具与外界产生交互,获取的 Observe 为后续规划提供信息。
2026-01-07 15:32:40
644
原创 必看收藏!有手就行!50分钟教会你用LoRA微调打造专业会议语音助手
本文介绍了使用LoRA技术微调Qwen2.5-0.5B-Instruct模型实现会议语音助手功能的完整流程。作者在普通笔记本(i7-8850H+16G内存)上仅用50分钟完成训练,展示了低成本微调大模型的可行性。文章详细讲解了从环境配置、模型下载、数据集生成到代码实现的每个步骤,重点分享了数据处理和LoRA微调的核心代码。通过实践表明,LoRA微调能有效提升模型在特定领域的表现,同时大幅降低计算资源需求。
2026-01-06 18:21:09
243
原创 高效协作:工程团队与LLM共建可维护代码的标准化流程
摘要: 本文探讨了与LLM协作编程的最佳实践,提出中等层次工作流程(位于完全自主编程与氛围式编程之间),强调在保持代码控制权的同时提升效率。核心方法包括:学习新工具时自主练习、框架协作策略、规范驱动开发、双重测试验证、单智能体监督等。作者指出极端氛围式编程仅适用于原型设计等有限场景,而长期项目需结合人工架构设计与AI协作。文章还分享了优化提示词、分解任务、规范驱动开发等实用技巧,并类比国际象棋发展,认为人机协作将长期存在。最后指出AI时代需持续学习,并附大模型学习资源引导。 (字数:149)
2026-01-06 18:19:56
765
原创 实战指南:LangChain 与 AgentRun 的浏览器沙箱集成
摘要:AgentRun Browser Sandbox 为智能体提供云原生无头浏览器沙箱服务,支持通过 Chrome DevTools Protocol 远程控制浏览器实例。该服务具有无头浏览器能力、实时可视化、安全隔离和 Serverless 架构等核心特性,适用于AI Agent赋能、自动化测试、数据采集等场景。通过AgentRun SDK可快速集成到LangChain等框架,实现浏览器自动化操作。用户需在控制台创建浏览器模板,并通过环境变量配置相关密钥和端点,即可使用Playwright等工具连接云端
2026-01-06 18:11:39
557
原创 【值得收藏】构建可扩展的语音对话系统:端到端实现与最佳实践
本文介绍了使用Pipecat框架构建生产级语音对话代理的完整方案,整合Deepgram(语音转写)、Venice.ai(LLM推理)、LlamaIndex+Qdrant(知识检索)和Cartesia(语音合成)等技术组件。系统采用模块化设计,通过Pipecat框架编排各服务间的数据流,确保低延迟、高可靠的端到端交互体验。文章详细展示了从环境配置、提示词管理到知识检索工具的实现过程,特别强调了保持实时性和自然对话体验的关键设计考量。该方案为开发者提供了构建可扩展"声音原生"对话系统的实用参
2026-01-06 18:09:09
840
原创 【珍藏干货】零成本打造智能文档问答系统!Everything plus RAG实战:让AI帮你从海量文档中精准找答案
本文介绍了一个基于RAG技术的开源智能文档问答系统"Everything plus",该系统结合BM25关键词检索与向量检索技术,实现从海量文档中精准查找答案。系统采用三层架构设计,支持30+种文件类型扫描,包含混合检索、RRF融合算法、查询重写和提示词工程等核心技术。文章详细阐述了系统架构、技术选型、核心算法原理,并提供了完整的部署指南和使用演示,帮助读者从零开始构建实用可靠的智能文档问答系统。该系统有效解决了传统全文搜索和AI问答工具的局限性,兼具检索速度和语义理解能力,可应用于技术
2026-01-06 18:05:52
243
原创 收藏!开发人太难了!AI时代下,转大模型应用开发才是破局关键
当下的开发圈,真的太卷太“难”了!AI技术的爆发式迭代,正在重塑整个开发行业的就业格局——曾经安稳的CRUD开发工程师岗位需求迎来断崖式下跌,甚至被不少行业报告预判为。放在过去,写业务代码、调第三方接口、日常修Bug这套“传统技能包”,足够支撑我们在行业里立足。但在AI全面渗透的今天,这些技能的“含金量”正在快速贬值,仅凭这些想稳住职场竞争力,越来越难!与之形成鲜明对比的是,AI相关岗位的需求却在逆势飙升。有行业调研数据显示,,无论是互联网大厂、中厂还是细分领域的头部企业,都在争抢懂AI的开发人才。
2026-01-06 15:31:12
934
原创 【收藏必学】突破LLM瓶颈:AI Agent记忆系统架构设计与实践全攻略
会话级记忆(短期记忆):特指用户与 AI Agent 在单次会话中的多轮交互数据,包括用户查询、Agent 响应、工具调用及执行结果等,直接服务于当前会话的实时交互。跨会话记忆(长期记忆):从多次会话中抽取提炼的通用信息,涵盖用户偏好、核心事实、领域经验等,能够跨会话辅助 Agent 进行个性化推理。需要注意的是,短期记忆与长期记忆并非单纯以时间维度划分,核心区别在于是否能够跨 Session 复用。
2026-01-06 15:30:10
562
原创 程序员必看!大模型技术学习路径与实战指南,建议收藏
文章为普通人提供了学习大模型技术的系统路径,涵盖提示词工程、RAG技术、LangChain应用、模型微调、AI Agent开发及多模态学习等关键领域。详细介绍了各项技术的原理、实践方法和应用场景,对比了AI测试与传统测试的区别,强调了数据质量验证、模型评估等核心维度。通过Coze等工具的实践指导,帮助读者从零开始构建AI应用能力,是AI入门者的实用指南。
2026-01-06 15:29:17
881
原创 MegaRAG:基于多模态知识图谱的新一代检索增强生成框架
MegaRAG突破传统GraphRAG的单模态局限,创新性地将视觉信息纳入知识图谱构建,实现对富视觉文档的深度理解。其核心采用"Page-level并行提取+子图Refinement"策略:首先分页提取多模态实体,再通过检索全局子图进行关系补全,构建包含图表实体的多模态知识图谱(MMKG)。系统采用统一向量空间编码和双路检索生成机制,在保留视觉细节的同时支持跨模态推理。实验显示其在全局问答和图表理解任务上显著优于传统方案,为处理复杂文档提供了新范式。该技术特别适用于研报、教材等视觉密集型
2026-01-05 18:40:55
856
原创 收藏级深度分析!2026年Agent时代来临:AI技术路线图与实战指南
摘要 2026年AI领域正经历从Chatbot到Agent的范式转移,标志着预训练进入"存量精耕"阶段,后训练全面转向强化学习(RL)时代。文章指出依赖模型蒸馏已不可行,必须构建自主RL基础设施。Agent技术将实现并行化与异步思考,带来革命性用户体验。作者强调长期主义的重要性,认为AI领域"The more you invest, the more you save",呼吁在工程和科研上坚持长期投入,以应对技术快速迭代的挑战。
2026-01-05 18:37:10
744
原创 【干货收藏】世界模型+具身智能:2026年Agentic AI架构与应用全景解析
2026年AI领域新趋势聚焦世界模型与具身智能的融合,推动Agentic AI在物理世界的应用落地。文章剖析了三大架构范式:模块化(分工明确)、顺序化(先规划后执行)和统一化(端到端融合),各有优劣。世界模型将AI从"感知-语言-行动"单向链升级为闭环认知系统,使机器人具备预测与规划能力,显著提升样本效率、长程推理和安全性能。该技术正引发学术界和产业界广泛关注,清华、复旦等顶尖高校已成立专门研究机构,预示物理世界AI应用将迎来突破性发展。
2026-01-05 18:36:21
557
原创 【干货收藏】LangGraph长短期记忆管理详解,手把手教你实现智能记忆系统
摘要: 本文探讨了LangGraph框架下AI智能体的长短期记忆管理机制。短期记忆通过Checkpointer实现,保障单次对话的连贯性;长期记忆则通过BaseStore存储跨对话的持久知识。文章详细介绍了记忆的存储、更新和检索策略,并通过代码示例展示了InMemorySaver的内存会话实现。最后以航班预订案例说明如何融合长短期记忆构建智能系统,并指出未来需优化记忆管理策略以实现更自主的智能决策。
2026-01-05 18:34:51
885
原创 收藏!LangChain 1.1.0深度解析:从面向对象到函数式组合,夺回LLM应用控制权
LangChain 1.x版本实现了从面向对象到函数式响应编程的范式转变,通过LCEL和LangGraph重构架构。新版本采用原子化组件设计,支持显式数据流和状态管理,解决了旧版的黑盒问题。LangGraph将Agent建模为状态机,实现确定性执行、持久化和人机协同。升级后系统具备细粒度流式控制、异步并发等生产级特性,显著提升了可观测性、可控性和用户体验。这一架构革新使开发者能够构建高可用的LLM应用,彻底告别"魔法"时代的限制。
2026-01-05 18:32:16
974
原创 从能跑到可靠:Agent Engineering如何重塑AI智能体赛道
【摘要】Agent工程正在成为AI领域的新兴学科,它专注于将非确定性大模型系统优化为可靠的生产级应用。与传统软件开发不同,Agent工程强调"构建-测试-发布-观察-优化"的快速迭代循环,通过持续观察生产环境中的实际表现来改进系统。这一方法被Clay、LinkedIn等成功应用Agent的企业采用,需要产品、工程和数据科学团队的协同合作。随着大模型能力的提升,Agent已能处理复杂工作流,但其不可预测性也带来了新挑战。掌握大模型技术成为职业发展新机遇,相关学习资源包括成长路线、专业书籍、
2026-01-05 18:31:10
817
原创 收藏!2026 AI风口下,Java程序员靠大模型弯道超车的3条高薪赛道
2026年的AI风口,直接把大模型焊死在技术圈顶流宝座!对咱们Java程序员来说,这根本不是需要焦虑的挑战,而是的黄金窗口期!Java作为企业级开发的“老大哥”,与大模型融合完全不用推倒重来——给现有项目加装一个智能“外挂”,就能轻松解锁高薪新赛道,性价比拉满!!咱们只需站在大模型的肩膀上“借东风”,聚焦“让Java项目变智能”这个核心目标就行。这种技术融合直接铺好了3条前景拉满的赛道,难度梯度清晰,且每一条的高薪回报都实打实,选对方向就能直接起飞!
2026-01-05 16:46:53
615
原创 【必收藏】2026大模型Agent完全指南:从原理到实践,一文掌握智能代理核心技术
最近大家都在提Agent,例如AutoAgent、Dify、Manus等,突然想到一个问题,那么什么才是Agent,有没有明确的定义呢?为此关于Agent的定义,网上搜索了一圈,说其最早“Agent”这个词可以追溯到古罗马时期,并且还能够从一些哲学家的哲学作品找到影子。一篇文章中说Agent的哲学概念泛指具有自主性的概念或实体,它可以是人造的物体,可以是植物或动物,当然也可以是人。这定义挺好的,我没意见。感兴趣的小伙伴可以就这个定义去搜索了解一下,把故事线梳理清楚了可以整篇论文了。
2026-01-05 16:41:02
684
原创 Attention注意力机制全解析:原理、代码与应用,大模型入门必学,建议收藏!
在普通的RNN结构中,Encoder需要把一个句子转化为一个向量,然后在Decoder中使用,这就要求Encoder把源句子中所有的信息都包含进去,但是当句子长度过长的时候,这个要求就很难达到,或者说会产生瓶颈(比如,输入一篇文章等场长内容),当然我们可以使用更深的RNN和大多的单元来解决这个问题,但是这样的代价也很大。那么有没有什么方法能够优化现有的RNN结构呢?为此,Bahdanau等人在2015年提出了Attenion机制,Attention翻译成为中文叫做注意力,把这种模型称为。
2026-01-04 15:54:24
1419
原创 收藏!2025 AI高薪浪潮来袭:大模型学习入门指南(小白/程序员必看)
当特斯拉Optimus人形机器人在工厂精准校准机械臂,当AI算法将新药研发周期缩短一半,当大模型赋能各行各业实现效率跃迁,这些场景背后,藏着无数普通人的薪资跃迁机会。那些刷屏的千万offer只是AI行业的“冰山一角”,真正的机遇,藏在大模型基建、跨学科融合、机器人协同这些“技术落地层”赛道中。无论你是想靠技术突围的程序员,还是想从零开始的行业小白,只要选对赛道、补足对应的大模型学习技能,2025年的AI高薪浪潮,就能带你实现职业的“跨越式成长”。
2026-01-04 15:52:20
447
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅