- 博客(2311)
- 收藏
- 关注
原创 无需网络,轻松在手机上离线布署本地大模型
一旦模型加载完成,进入“聊天”页面并开始与加载的模型对话!生成性能指标也会显示。如果感兴趣,可以通过观察聊天气泡查看实时性能指标:每秒令牌数和每个令牌的毫秒数。AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源。
2024-11-16 11:30:00
9797
1
原创 大模型LLM | 一文彻底搞懂大模型Agent(智能体):Agent、Agent + RAG
AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!
2024-10-16 19:58:47
53873
1
原创 大模型 | 一文彻底搞懂预训练和微调(Pre-training vs Fine-tuning)
AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!
2024-08-19 09:46:08
19965
原创 别瞎买!AI Agent 只有这些是真龙头!全景解析(附标的),帮你省下 90% 的研究时间!
如果移动互联网时代,超级APP主宰了人们的线上活动;那AI大模型时代,超级Agent将可能成为下一代智能生活的入口。11月17日,阿里通义APP更名为千问APP,对标ChatGPT,项目全力进军C端市场。阿里计划将“千问”接入全场景生态,未来将地图、外卖、订票、办公、学习、购物、健康等各类生活场景接入千问APP,其核心目标是构建能自主理解需求、规划任务、调用资源的AI智能体。
2026-01-07 16:30:56
827
原创 AI Agent = 最强大脑 + 记性超好 + 计划周密 + 手脚麻利!编程开发新纪元,小白也能秒变大神!
本文将AI Agent定义为集"最强大脑、记性超好、计划周密、手脚麻利"于一体的智能系统。对于编程开发者而言,AI Agent提供强大计算能力、持久学习记忆、周密规划和高效执行能力,成为编程开发得力助手。文章探讨AI Agent如何改变传统编程模式,提高开发效率,并为不同水平开发者提供实用指导,帮助小白快速上手,提升开发能力。
2026-01-07 16:29:11
182
原创 震惊!ReAct让大模型从“智障“变“智能“,程序员必学的AI架构!代码示例超详细,小白也能秒上手!
ReAct是一种"推理-行动-观察"(TAO)的AI智能体架构范式,通过构建闭环机制破解传统大模型的"事实幻觉"难题。它采用三层模块化架构,使大模型能调用外部工具获取实时信息,生成可解释的推理轨迹,实现复杂任务的动态处理。相比传统方法,ReAct在幻觉抑制、可解释性和场景适应性上表现优异,适用于知识密集型任务、智能规划、客服机器人等领域,是AI智能体开发的重要基础范式。
2026-01-07 16:28:16
511
原创 AI也要“外挂“?揭秘Agent架构三大神器,让ChatGPT秒变项目经理,小白也能秒变大神!
章揭示了ChatGPT与AutoGPT/Devin性能差异的根源在于Agent架构设计。Agent系统包含三大核心组件:Planning(任务拆解与自我反思)、Memory(短期上下文与长期记忆存储)和Tools(通过API连接外部世界)。开发者可通过LangChain、AutoGen等框架构建Agent,不必迷信模型参数大小,而应注重给AI配备"战术手册"和"兵器",这才是产品护城河。AI时代,规划能力决定高度。
2026-01-07 16:27:26
544
原创 程序员必看!Google最新报告:AI不是来替代你的,而是来给你发升级包的!
Google《2026年AI Agent趋势报告》揭示AI时代将人类变成"超级管理者"。五大趋势:每人拥有"数字副驾"AI团队;工作流进入"自动驾驶"模式;客服升级为"五星级管家";用AI守护AI安全;技能保质期缩至4年。程序员需转变心态,从"我会做什么"变为"我能指挥什么",学习Agent管理思维,驾驭AI团队才能在科技浪潮中不被淘汰。
2026-01-07 16:26:30
305
原创 20260107_162111_2026,AI_Agent爆发的真正元年:从工具到智能体的时
AI智能体时代加速到来:2025-2026年关键趋势分析 摘要: 2025年被广泛视为"AI代理元年",市场数据显示AI Agent已成为最热门的科技投资领域,相关初创企业快速崛起。AI Agent正从被动工具转变为具备"感知-思考-行动"闭环能力的主动参与者,推动企业自动化逻辑重构。核心技术突破包括大语言模型作为"大脑"、工具调用作为"手脚"、多模态感知作为"感官"等。预计2026年中国企业级智能体市场规模
2026-01-07 16:24:42
516
原创 别被高大上的名词吓跑!AI Agent 到底是个啥?这篇指南太良心了,一看就懂!
AI Agent 是人工智能领域中的一个概念,它是一种能够自主执行任务的智能体它具有以下特点:AI Agent 能够自主执行任务,不需要人工干预AI Agent 能够理解任务,并自主执行任务AI Agent 能够适应不同的任务,并自主执行任务AI Agent 能够与其他 AI Agent 协作,共同完成任务只有一个 AI Agent 独立完成任务多个 AI Agent 协作完成任务能够理解任务,并自主执行任务如基于规则的 Agent、基于模型的 Agent、基于强化学习的 Agent 等AI Agent 能
2026-01-07 16:23:18
410
原创 【深度干货】AI Agent的“六神合体“术:从感知到优化的完整闭环,小白也能懂
AI Agent的六大核心模块构成完整智能闭环:感知交互、任务规划、记忆管理、工具调用、执行反馈和自主优化,通过"感知-规划-记忆-工具-执行-反馈-优化"的协同工作,实现从"被动执行"到"自主智能"的进化,让AI具备理解需求、拆解任务、调用资源、落地执行和持续迭代的自主能力。
2026-01-07 16:22:04
616
原创 AI Agent正在消灭编程岗位?真相是:这是程序员的最好时代!小白开发者如何抓住这波AI红利?
AI Agent时代已全面到来,将带来交互革命(从指令式计算到意图式计算)、入口革命(从平台中心到智能节点)和商业模式革命(从订阅到效果付费)。产业数字化平台将迎来三次进化:SaaS变AaaS、B2B变A2A、S2B2C变S2A2B/C。到2026年,未能深度融入AI Agent的产业平台将被淘汰,这是开发者拥抱AI、共创新未来的关键机遇。
2026-01-07 16:21:34
381
原创 【爆肝整理】OpenAI官方发布!2026 Agent元年,手把手教你从零搭建LLM智能体,小白也能秒变AI大神!
OpenAI发布《构建智能体实用指南》,助开发者打造能替代人类完成复杂工作流的AI系统。指南全面覆盖智能体设计基础、防护机制及构建方法,解决开发者在Agent设计与安全落地中的关键问题。阅读后,开发者将掌握构建下一代智能应用所需的基础知识,清晰规划从组件到复杂编排的开发路径。
2026-01-07 16:20:27
419
原创 【编程新趋势】AI Agent时代已来临!零基础小白也能开发智能应用,大模型技术不再神秘!
AI Agent代表AI发展的第三阶段,能自主执行复杂工作流。其核心特征包括利用LLM进行决策、调用外部工具、主动纠正错误。适合处理复杂决策、难以维护规则和非结构化数据场景。架构包含模型、工具和指令三要素,正从单智能体向多智能体协作演进。开发中需关注可靠性、可观测性、并行处理和可测试性等工程挑战。2026年或迎来AI Agent普及期。
2026-01-06 14:34:33
958
原创 用友重磅发布BIP“本体智能体”(Ontology-Driven Agent),引领企业AI迈向自主决策时代!
当大模型从技术突破走向商业应用,企业已跨越“有无”的边界,却困于“真伪”的抉择。如何让大模型真正读懂企业特有的运营逻辑,以可信、可控的方式支撑关键决策,成为所有企业亟需攻克的核心议题。
2026-01-06 14:32:05
747
原创 程序员别卷了!AI Agent才是真·外挂,57%团队已投产,小白也能轻松驾驭大模型开发
2026年调研显示,57%企业已在生产环境部署AI Agent,大型企业领先。质量仍是最大障碍(32%),89%组织实施可观测性。多模型并用成常态,OpenAI GPT领先但非唯一。客户服务(26.5%)和数据分析(24.4%)是主要用例。编码Agent如GitHub Copilot已成为开发者日常工具。微调未广泛采用,多数团队依赖提示工程和RAG。
2026-01-06 14:30:50
258
原创 震惊!大模型开发者的‘生死劫‘:智能体工程,让AI应用不再‘翻车‘!
智能体工程是将非确定性的大语言模型系统转化为可靠生产体验的迭代过程,遵循"构建、测试、发布、观察、改进、重复"的循环。它结合产品思维、工程开发和数据科学三大技能,应对LLM能力跨越阈值但不可预测性高的挑战。与传统软件开发不同,智能体工程将生产环境视为最佳学习场所,通过快速迭代和持续优化,让AI应用真正落地并稳定运行。
2026-01-06 14:30:13
625
原创 AI智能体编排“神操作“:小白程序员也能让大模型变聪明,代码示例超详细!
文章深入探讨AI智能体的编排策略,详述六种智能体类型及适用场景,分析三种工具选择方法和四种执行拓扑结构。强调上下文工程确保有效执行的核心作用,提供设计智能体系统的最佳实践,帮助开发者构建高效可靠处理现实世界多步骤任务的智能体系统。
2026-01-06 14:29:14
875
原创 AI Agent编程革命:国家战略背书,2025年最火爆开发方向,小白也能快速上手!
AI Agent作为国家战略级赛道,正从"被动响应"向"主动闭环"质变,成为"新质生产力"核心引擎。文章解析了7大应用赛道:对话式智能分析、智能办公、营销、陪伴式硬件、数字人、开发管理平台及对话式AI,并给出企业布局三大原则:场景适配优先、技术架构可靠、落地能力为王。到2030年,Agent渗透率将突破90%,是企业数字化转型的"必修课"。
2026-01-06 14:27:35
559
原创 【爆肝实测】阿里AgentScope 1.0让大模型智能体开发“原地起飞“!小白秒变AI大神!
AgentScope 1.0是阿里巴巴开源的智能体应用构建框架,通过模块化设计与ReAct范式,解决了LLM智能体开发的四大痛点:API调用复杂、任务执行难以中断、多智能体协作混乱、行为难以调试。其四大基础模块(消息、模型、记忆、工具)高度解耦,内置多种智能体,并提供完整工具链,覆盖开发、调试、部署全流程,让开发者能像搭积木一样快速构建灵活、高效、可控的智能体应用。
2026-01-06 14:26:33
762
原创 大模型开发“躺平“不了?智能体工程硬核指南,让AI Agent从Demo到生产稳如老狗
文章介绍智能体工程(Agent Engineering)这一新兴领域,解决AI智能体从Demo到生产的工程鸿沟。系统阐述10大核心维度:交互工程、模型工程、推理与执行核心、上下文工程、记忆工程、知识工程、集成工程、可观测性工程、安全工程和治理工程。强调工程化对构建可靠生产级AI系统的重要性,指出AI开发者需从"写提示词"升级到"做生产级Agent系统"。
2026-01-06 14:24:49
974
原创 AI大模型实战——探索智能体世界:LangChain与RAG检索增强生成
起初,LangChain 只是一个技术框架,使用这个框架可以快速开发 AI 应用程序。这可能是软件开发工程师最容易和 AI 接触的一个点,因为我们不需要储备太多算法层面的知识,只需要知道如何和模型进行交互,也就是熟练掌握模型暴露的 API 接口和参数,就可以利用 LangChain 进行应用开发了。LangChain 发展到今天,已经不再是一个纯粹的 AI 应用开发框架,而是成为了一个 AI 应用程序开发平台,它包含 4 大组件。LangChain:大模型应用开发框架。LangSmith。
2026-01-06 14:23:43
728
原创 震惊!腾讯复旦联手推出Youtu-Agent:AI智能体开发从“手工业“迈入“自动化时代“,小白也能秒变AI大牛!
Youtu-Agent是腾讯优图实验室、复旦大学和厦门大学联合开发的智能体规模化框架,通过"分层YAML配置+双模式自动生成+免训练经验累积+分布式RL"四大创新,解决了智能体开发手工配置成本高和部署后能力僵化的痛点。其核心创新包括Training-free GRPO算法实现零梯度更新,三层解耦架构设计,工具合成成功率81.25%,使智能体构建从"手工业"升级为"自动化生产线",支持部署后持续进化,将开发周期从"周"缩短到"小时"。
2026-01-06 14:23:01
757
原创 【AI炸场】2025年大模型年度总结!DeepSeek-R1、Qwen3、Z-Image,小白也能起飞!✈️
文章回顾2025年发布的大模型,按类型分类介绍了LLM、VLM、文生图、视频生成、TTS、OCR等多个领域的重要模型。DeepSeek-R1开源对AI认知产生重大影响,TTS领域发展迅速,PaddleOCR-VL表现优异。展望2026年,多模态、TTS、OCR和图片处理可能成为发展重点。
2026-01-05 15:14:41
930
原创 【程序员必看】大模型中文回答更“懂你“?真相让人惊掉下巴!原来我们一直在自我脑补!
文章揭示了为什么大模型在中文回答时显得更"聪明"。核心观点是:中文"留白"让用户自己脑补另一半内容,产生"它懂我"的错觉;中文环境评价标准更宽容,不需要完全展开;在编程等需要精确推理的领域,中文并无优势;我们用"命中感"衡量模型能力,而非真正的推理能力。理解这一点有助于正确评估和使用大模型。
2026-01-05 15:13:46
534
原创 震惊!AI竟有“双重人格“?Gemini坚持2024年是真实世界的惊天秘密,程序员必看!
AI模型存在"双重人格":图书管理员(参数化记忆)和思考者(上下文处理)。Gemini坚持2024年是真实世界的问题源于其知识库在训练完成后不再更新,导致基于过时知识做出错误判断。随着上下文长度增加,问题可能加剧。理解这一机制对AI开发和使用至关重要,有助于规避AI模型中的潜在缺陷。
2026-01-05 15:11:39
896
原创 震惊!大模型让代码自动写?2026年AI编程技术大揭秘,小白也能秒变大神!
本报告全面复盘大模型技术发展历程,分析其在编程开发领域的创新应用,并展望未来趋势。报告指出大模型正深刻改变编程范式,提高开发效率,降低技术门槛。同时,大模型与各行业融合加速,创造新商业模式。建议关注技术领先、应用落地能力强的企业,把握AI编程时代的投资机遇。
2026-01-05 15:10:49
631
原创 百万token轻松处理!MIT递归语言模型RLM破解大模型“记忆障碍“,编程小白也能学会!
MIT研究团队提出RLM(递归语言模型)解决大模型"上下文腐烂"问题。RLM借鉴外存算法思想,将超长Prompt作为外部环境而非直接输入,模型通过生成操作指令按需调取内容处理。该技术包含外部化上下文、符号化交互、迭代执行与反馈三大步骤,支持递归调用子模型处理复杂任务。实验证明RLM能有效突破物理上下文限制,在长文本处理任务上表现优异,尤其在传统方法难以处理的复杂任务中优势明显。
2026-01-05 15:10:04
761
原创 “震惊!2025大模型技术大爆发:RLVR+GRPO引领推理革命,小白程序员也能秒变AI大神!“
2025年AI领域迎来RLVR与GRPO技术革命,推理模型表现超预期。文章详解了推理侧缩放、工具调用等关键技术,探讨了AI对编程、写作和科研的影响,指出私有数据是企业的核心竞争力。预测2026年将看到RLVR扩展应用、推理侧缩放普及以及持续学习技术突破,强调LLM进步依赖多维度技术协同发展。
2026-01-05 15:09:28
731
原创 大模型开发者的春天来了!智谱VS MiniMax港股双雄争霸:B端开源VS C端爆款,小白程序员该站队哪边?
文章对比中国AI独角兽智谱AI和MiniMax的上市与商业化策略。智谱采用B端开源+API路径,服务8000+机构客户,收入稳定;MiniMax押注C端多模态产品,收入增速快但波动大。两者均处亏损阶段,MiniMax面临知识产权诉讼风险。两家均获头部资本支持,但投资逻辑不同:智谱适合看好B端生态的长期投资者,MiniMax适合看好C端商业化的风险承受型投资者。
2026-01-05 15:08:47
887
原创 【AI革命】告别Token内卷!字节DLCM技术让大模型“智商“提升34%,计算量反而减少,小白程序员必看!
字节跳动Seed团队推出DLCM技术,将大模型推理单位从Token提升到Concept层级,通过动态分割Token序列为概念,在压缩空间中进行深度推理,再将结果重构为Token级预测。实验显示,该方法在推理阶段FLOPs降低34%的同时,平均准确率提升2.69%。DLCM实现了计算资源自适应分配,大幅提升大模型推理效率。
2026-01-05 15:08:12
1249
原创 AI大模型狂飙时代:Sora、World Model如何重塑编程与开发?【深度解析】
文章介绍了大模型、世界模型和Sora的概念及其应用。大模型具有强大表示能力和泛化能力;世界模型使AI能像人类一样理解预测环境;Sora作为OpenAI的文生视频模型,被视为"世界模拟器"。这些技术对自动驾驶意义重大,世界模型有望提升自动驾驶的感知预测能力,可能成为自动驾驶及具身智能领域的基础模型,推动行业格局变革。
2026-01-05 15:07:28
802
原创 大模型应用开发学习路线,一文打通前后端转AI之路,内附大厂面试秘籍!
文章提供AI大模型应用开发完整学习路线,强调Post-training和AI-Agent是当前工业界最缺人且性价比高的方向。学习内容包括大模型基础认知、核心技术(RAG、Prompt、Agent)、开发能力、应用场景、项目落地及面试准备。指出大模型技术虽迭代快但核心逻辑不变,为想转行AI的开发者提供系统化学习框架和资料。
2026-01-05 15:06:47
804
原创 【AI编程黑科技】R2R:多模态+深度研究+知识图谱,这个RAG系统直接卷到飞起!
R2R是一个生产就绪的AI检索系统,支持检索增强生成(RAG)技术,具备多模态内容摄取、混合搜索、知识图谱和深度研究API等高级功能。与传统RAG不同,它提供完整的RESTful API设计,支持文本、图片、音频等多种格式,内置多步骤推理系统,能自动抽取知识图谱并动态调整检索策略。R2R开箱即用,集成成本低,部署友好,解决了"能跑≠能用,能用≠能进生产"的痛点,是小白程序员和大模型开发者的理想选择。
2026-01-04 14:54:04
882
原创 RAG架构从入门到精通,一篇搞定AI“胡说八道”,收藏这一篇就够了!
本文详解9种RAG架构及其适用场景,提供选择框架和决策指南。RAG技术能减少大模型"幻觉",提高回答准确性。强调从简单开始、持续评估、避免过度设计的重要性,是企业安全采用生成式AI的关键技术。
2026-01-04 14:53:25
862
原创 【爆肝干货】Deep Thinking RAG架构横空出世:传统RAG被吊打,小白程序员也能秒变AI大神!
文章介绍了传统RAG系统的局限性,提出了Deep Thinking RAG架构,通过将RAG与Agent技术深度融合,实现了从"工具"向"智能体"的范式跃迁。该架构包含规划代理、检索监督者等四个智能模块,通过LangGraph编排实现循环推理机制。实战对比显示,Deep Thinking RAG在Context Precision、Context Recall和Answer Correctness等指标上显著优于传统RAG,为企业级AI应用提供了新的技术范式。
2026-01-04 14:45:33
653
原创 从Java到Agent开发:3个月转型指南,轻松掌握大模型应用核心能力
2026年的程序员赛道,早已不是“会写代码就稳了”的时代——某大厂消息显示,引入AI Agent协作后,30人的基础架构组仅需5人留存,被淘汰的多是固守传统开发、拒绝拥抱AI的开发者。而另一边,Agent(智能体)开发岗位月薪已飙至5万+,市场疯狂争抢兼具Java工程能力与AI思维的复合型人才。深耕Java多年的你,与其焦虑被AI替代,不如主动转型入局Agent开发——如何借助现有技术积累快速破局?
2026-01-04 14:44:58
876
原创 【程序员必看】RAG技术让大模型不再“胡说八道“,5大模块详解+实战案例,小白也能变专家!
RAG(检索增强生成)是一种解决LLM幻觉、时效性和数据安全问题的技术框架。文章详细介绍了RAG的五大核心模块:版面分析、知识库构建、大模型微调、文档检索和Reranker。同时提供了多个开源项目实战案例,帮助开发者从零构建基于RAG的知识问答系统,提升大模型回答的准确性、可解释性和安全性。
2026-01-04 14:44:13
851
原创 救命!RAG终于能理解复杂关系了!HGMEM框架让大模型推理能力原地起飞,代码已开源小白也能玩转!
HGMEM是港中大&WeChat AI团队提出的超图记忆框架,通过超图结构和动态演化机制解决多步RAG系统中的记忆静态化、关系建模薄弱和推理碎片化问题。该框架支持n元关系建模,通过更新、插入、合并三种操作实现记忆动态演化,并采用自适应检索策略。实验表明,HGMEM在多个数据集上显著优于现有方法,甚至在某些场景超越了GPT-4o的性能,为RAG技术向"理解-推理"跃迁提供了重要支撑。
2026-01-04 14:43:25
880
原创 AI技术大洗牌:RingAttention杀疯了,RAG如何绝地求生?开发者必看的技术演进路线
Ring Attention技术突破上下文限制,对RAG构成挑战但不会完全取代。由于成本、延迟等问题,RAG将进化为"长上下文RAG",与Ring Attention形成互补:RAG负责粗筛,Ring Attention负责精细推理。两者结合将推动AI从简单搜索转向真正的知识推理,RAG演变为上下文管理系统,Ring Attention成为超级推理核心,共同提升AI知识处理能力。
2026-01-04 14:42:26
553
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅