- 博客(1339)
- 收藏
- 关注
原创 在个人电脑上运行Llama 3 70B大规模模型指南
随着人工智能和机器学习技术的迅猛发展,像Llama 3 70B这样的庞大语言模型已经成为了研究、开发和应用中的重要工具。这篇文章将详细介绍如何在个人电脑上运行Llama 3 70B大模型,并涵盖硬件要求、软件环境配置、安装步骤、运行示例和常见问题的解决方案。虽然运行这样一个大规模的模型在性能上有限制,但对于实验和学习非常有帮助。
2024-06-15 10:35:11
8298
原创 2024!国内AI大模型平台哪家强?全方面测评来了
这篇仅是开坑哈,后面会持续更新的~主旨就是想要在滚滚浪潮中帮助AI开发者发现、汇聚到简单、好用的AI大模型平台&开发者社区上来,共建国内繁荣AIGC生态!!有些规模太小、不好用、吃相太难看(没几个模型就要走付费变现路子的)的平台我就先不放上来啦。
2024-06-05 17:14:02
8474
原创 如何学习训练大模型——100条建议(附详细说明)_如何训练自己的大模型
通过深入了解本文中的这些细节,并在实际项目中应用相关知识,将能够更好地理解和利用大模型的潜力,不仅在学术研究中,也在工程实践中。通过不断探索新方法、参与项目和保持热情,并将其应用于各种领域,从自然语言处理到计算机视觉和自动驾驶。通过不断学习、实践和探索,可以不断提升自己在深度学习领域的技能和洞察力,同时也能为社会和行业带来创新和改进。从小规模的项目和模型开始,逐渐迭代和扩展到更大的模型,逐步积累经验,最终能够处理大模型和复杂任务。分享您的研究成果和代码,以获得反馈和建立声誉。
2024-04-17 11:56:47
8141
原创 AI 入门,从零搭建完整 AI 开发环境,并写出第一个 AI 应用
在本文中,我们从零开始,一步步搭建了一个完整的AI开发环境,并创建了一个简单的AI应用。您学习了如何安装Python、Anaconda、TensorFlow,以及如何使用Jupyter Notebook进行开发。通过这个简单的手写数字识别应用,您不仅学习了AI的基本概念,还亲身体验了AI的应用。AI是一个广阔而充满机遇的领域,希望这个教程能够激发您继续深入学习和探索AI的兴趣。
2024-04-10 11:02:43
12244
1
原创 国内超大型智能算力中心建设白皮书 2024
智算中心建设通过领先的体系架构设计,以算力基建化为主体、以算法基建化为引领、以服务智件化为依托,以设施绿色化为支撑,从基建、硬件、软件、算法、服务等全环节开展关键技术落地与应用。一、体系架构(一)总体架构图8 智算中心总体架构智能算力中心建设白皮书,重点围绕基础、支撑、功能和目标四大部分,创新性地提出了智算中心总体架构。其中,基础部分是支撑智算中心建设与应用的先进人工智能理论和计算架构;支撑部分围绕智算中心算力生产、聚合、调度、释放的作业逻辑展开;功能部分提供算力生产供应、数据开放共享、智能生态建设和产业创
2024-04-08 15:07:31
12553
1
原创 大模型应用技术演进与实战:从RAG到GraphRAG,从Function Calling到MCP,一篇收藏
接下来详细介绍 RAG 技术的原理,其主要包括数据准备与知识库构建、知识召回与生成增强两个阶段:数据准备与知识库构建**:**原始数据处理:将各类异构的原始数据(如 web 文档、Word、PDF 等)进行清洗与格式转换,完成信息抽取,使其便于后续处理;文档切片(Chunking):将处理后的文档分割成较小的片段,避免大模型处理时超出上下文长度限制,同时提升模型生成回答的速度;
2025-12-02 15:08:44
543
原创 【收藏必备】RAG技术详解:让大模型获取外部知识的完整实现方案
RAG(检索增强生成)是一种解决大模型幻觉问题的技术,通过检索外部知识库增强上下文,提高回答准确性。文章详细介绍了RAG的工作原理、关键技术(如Embedding向量转换、向量数据库、相似度计算等),以及在Spring AI框架下的实践方法。通过离线处理文档分块、向量化存储和在线检索、重排序等步骤,RAG使大模型能够获取外部知识,提供更专业、个性化的回答。目前 LLM 生成的内容都是基于其训练时已知的信息,其无法访问外部的信息,因此无法回答训练数据以外的内容。
2025-12-02 14:57:10
777
原创 Agent-Graph多智能体系统开源项目:10大核心功能详解,收藏级教程
Agent-Graph是一款开源多智能体系统,支持可视化工作流编排、任务分解和双层记忆架构,提供团队协作、定时任务和对话分享功能。内置工具集帮助开发者构建复杂AI工作流,适合研究多智能体系统的技术人员使用。项目包含完整文档和团队管理功能,可通过官网体验或GitHub获取源码。
2025-12-01 17:05:14
464
原创 收藏必备!Agent架构设计中的上下文压缩实战方案,助你拿下大厂P7
本文探讨了Agent架构设计中的上下文压缩方案,提出5种工程实践方法。无损压缩包括:1)省略一致出入参;2)长文后期省略;3)分段读取。有损压缩包括:4)就地压缩长文;5)LLM+压缩口令Prompt终极方案。文章强调应优先采用无损压缩,必要时结合有损方案,以解决大模型上下文窗口限制和注意力衰减问题,确保Agent稳定运行。这些方案既可单独使用,也可组合实施,为Agent开发提供实用指导。
2025-12-01 17:04:22
472
原创 收藏!程序员年薪36万+揭秘:薪酬报告出炉,技术+AI才是程序员不败之道
人社部数据显示程序员年薪中位数达24-36万元。AI热潮下,程序员无需焦虑,技术仍是立身之本,AI只是效率工具。二者相辅相成:技术决定职业高度,AI拓展能力边界。程序员应深耕技术,同时善用AI提升效率,避免沦为"AI代码搬运工",实现职业升级。掌握技术核心并驾驭AI工具,才是应对行业变革的最优解。
2025-12-01 17:03:30
688
原创 【深度收藏】程序员应对AI变革:三阶段转型路径,从恐慌到自信
摘要:文章探讨程序员如何应对大模型带来的职业焦虑,提出三阶段转型路径:建立认知(理解原理)、掌握技能(提示词工程、RAG开发等)、深化能力(智能体系统)。作者强调通过实践而非速成课程来应对变革,承诺分享开源项目和实践经验。同时提供大模型学习资源包(路线图、书籍、视频、项目等),帮助从业者系统掌握新技术,适应AI时代需求。文章指出,掌握大模型技能是把握未来高薪机会的关键,并附学习资料获取方式。(150字)
2025-12-01 17:02:06
640
原创 收藏这份35+程序员转型指南:避开年龄陷阱,5条高薪路径详解
本文针对35岁程序员面临的职业危机,提出5条高薪转型路径:技术转管理、深耕垂直领域、跨界产品岗、自由职业及AI新兴赛道。强调转型不是放弃技术,而是用积累的底层能力打开新天花板。通过具体案例和实操建议,帮助程序员避开年龄焦虑陷阱,用可迁移技能切入高增长赛道,实现职业跃迁。
2025-12-01 15:21:28
1004
原创 【干货收藏】AI Agent架构与实践:让大模型从“回答问题“到“完成任务“
如果要用一句话来概括 AI Agent 的价值:它让我们从“告诉机器怎么做”,变成“告诉机器想要什么”。五大特征:自主决策、持续学习、多模态理解、工具生态、多智能体协作;六大模块:感知、决策、执行、记忆、反馈优化等完整技术架构;四种工作模式:目标导向、事件触发、人机协作、多智能体协同;以及一整套围绕任务分解、自我优化、开发实践、平台生态、行业应用展开的体系。2025 年之后,AI Agent 很可能会像当年的移动应用、云服务一样,逐步从“新鲜概念”变成基础设施。
2025-12-01 15:20:20
578
原创 【强烈收藏】Google Agent架构深度剖析:让大模型具备状态、工具调用与执行流程能力
工具类型执行位置应用场景ExtensionsAgent 端实时服务调用、系统查询、结果反馈FunctionsClient 端安全隔离、异步流程、UI交互、审批类调用Agent 端文档检索、知识问答、结构化数据支持、RAG增强Agent 系统不是对模型的增强,而是对“任务执行框架”的重构。语义识别能力(通过模型)工具调用能力(通过插件/API)状态控制能力(通过流程编排)自动化控制系统;智能流程平台;多轮状态机调度系统。
2025-12-01 15:19:21
729
原创 【必藏】8大LLM Agents框架实战:MCP Server集成指南与代码详解
MCP(Model Context Protocol)Server是一个标准化的工具接口协议,它允许AI Agent通过统一的方式调用各种外部工具和服务。无论是搜索引擎、数据库查询,还是API调用,MCP Server都能提供标准化的接入方式。Stdio模式:通过命令行进程通信,适合本地开发SSE模式:通过HTTP连接,适合生产环境部署"""自定义MCP工具包装器""""""执行MCP工具"""try:kwargsreturn f"工具调用失败: {str(e)}"@property。
2025-11-30 15:30:00
1512
原创 LangGraph实战指南:从基础到落地,构建生产级AI智能体
在构建图之前,首先要明确状态的存储结构,即定义状态模式。状态类型核心优势适用场景TypedDict执行速度快,类型标注清晰简单场景,无需默认值的状态存储dataclass支持属性式访问(state.foo),支持默认值中等复杂度场景,需要灵活配置默认值Pydantic自带数据验证,支持复杂类型校验生产环境,对数据规范性要求高的场景import syssys.path.append("..") # 导入上级目录模块# 导入自定义工具(实际开发中需提前实现)
2025-11-30 10:30:00
790
原创 【必学技术】Agent RFT:OpenAI让AI Agent自我进化的突破性技术(附GitHub实战)
摘要 Agent RFT是OpenAI提出的强化微调技术,通过奖励机制让AI Agent在实际任务中自我优化。与传统监督微调(SFT)不同,RFT不提供标准答案,而是定义"好的行为"让模型学习,从而提升工具使用效率和推理能力。该技术适用于任务明确、有基线性能且需优化效率的场景,已在金融、医疗、代码生成等领域取得显著成效,如FinQA任务中工具调用次数减少53%,响应时间降低10%。RFT成功的关键在于精心设计的评估器,需具备梯度奖励、抗欺骗等特点。OpenAI建议先尝试传统优化方法,在遇
2025-11-29 17:47:06
141
原创 Transformer架构完全指南:从Attention机制到Hugging Face实战,一篇就够了(建议收藏)
Transformer架构彻底革新了自然语言处理领域,其核心创新在于完全基于注意力机制,摒弃了传统RNN结构。该架构包含三大关键组件:Embedding层负责将单词向量化,Self-Attention机制实现并行信息处理,Encoder-Decoder结构完成输入理解与输出生成。如今,Transformer已成为GPT、BERT等大语言模型的基础,广泛应用于各类NLP任务。通过Hugging Face等工具,开发者可轻松调用预训练模型实现翻译等功能。掌握Transformer原理及实践已成为AI从业者的必备
2025-11-29 17:45:44
564
原创 【必藏】RAG技术全攻略:解决大模型幻觉的钥匙,开发者必备技能
检索增强生成技术(RAG)通过外部知识库提升大模型问答准确率,解决幻觉问题。技术从基础版演进到模块化RAG,支持自由组合功能。应用涵盖文本、代码、图像等多领域,关键技术包括向量化(Embedding)、索引(Index)和重排序(Rerank)。随着AI发展,掌握大模型技能成为高薪关键,相关学习资源包括路线图、书籍、视频教程和实战项目,帮助从业者快速掌握核心技术。
2025-11-29 17:44:43
678
原创 【收藏必备】4种文档切片方法详解:从固定大小到结构化分块的全面指南
本文介绍了四种主要的文档切片技术:固定大小切分、语义切分、基于文档结构的切片和递归切分。其中,文档结构化分块能有效保留语义完整性和上下文连贯性。文章还指出AI大模型技术正在催生Prompt工程师等新兴岗位,并提供了包含学习路线、书籍、视频教程等在内的大模型全套学习资源,帮助读者把握AI时代的就业机遇。
2025-11-29 17:43:27
545
原创 RAG技术演进:从基础到智能,程序员必备大模型应用指南,建议收藏
检索增强生成(英语:Retrieval-augmented generation, RAG ) 是赋予生成式人工智能模型信息检索能力的技术。检索增强生成优化大型语言模型(LLM) 的交互方式,让模型根据指定的一组文件回应用户的查询,并使用这些信息增强模型从自身庞大的静态训练数据中提取的信息。检索增强生成技术促使大型语言模型能够使用特定领域或更新后的信息。应用案例,包括让聊天机器人访问公司内部资料,或来自权威来源的事实信息。简易RAG流程元宝 RAG示例。
2025-11-29 16:04:04
550
原创 收藏学习!一文搞懂多模态检索增强生成(MRAG):从入门到精通,降低大模型幻觉率必知技术
这篇文章系统阐述了多模态检索增强生成(Multimodal Retrieval-Augmented Generation,MRAG)的研究现状,其核心是通过整合文本、图像、视频等多模态数据,突破传统文本型RAG的局限,在检索阶段定位多模态相关知识,在生成阶段借助多模态大型语言模型( multimodal large language models,MLLMs)生成更全面的响应,显著降低幻觉率。该综述梳理了MRAG的三阶段演进(MRAG1.0至3.0)
2025-11-29 16:01:57
613
原创 【必藏】38岁Java程序员的逆袭:我用AI+DeepSeek拿下字节200万年薪,技术瓶颈一朝突破!
38岁Java程序员通过Java+DeepSeek AI工具实现职业突破,获得200万年薪。文章分享了从基础API调用到开发AI代码助手插件、设计AI自适应微服务架构的全过程,重点介绍了数据隐私保护方案。核心观点强调AI不会取代程序员,但掌握AI工具的程序员更具竞争力,建议技术人员与时俱进地提升技能。
2025-11-28 18:35:55
383
原创 【收藏】LLM训练全流程解析:从随机初始化到推理微调,一文掌握核心知识
文章概述了大型语言模型(LLM)训练的四个核心阶段:随机初始化、预训练、指令微调和偏好/推理微调。通过海量语料预训练掌握语言基础后,模型经过指令微调获得对话能力,再通过人类偏好数据(RLHF)或正确答案反馈(GRPO)进一步优化。最后指出AI时代涌现的新职业机会,并推荐了大模型学习资源包,包含路线图、书籍、视频、实战项目等全套资料,帮助读者掌握这项前沿技术。
2025-11-28 18:34:59
397
原创 【必读收藏】Agent上下文工程革命:代码执行让token消耗降低98.7%,效率飙升
本文提出通过代码执行优化Agent与MCP服务器的交互方式,显著提升效率。传统直接工具调用导致上下文爆炸和token过度消耗,而让Agent编写代码调用工具可将token使用量从15万降至2千,效率提升98.7%。这种"Code Mode"范式支持按需加载工具、数据处理前过滤,并实现复杂逻辑单步执行,同时带来安全性和状态管理优势。该方法已成为继MCP后的新标准,为构建高效Agent系统提供了创新解决方案。
2025-11-28 18:34:16
358
原创 收藏级干货:LangChain与LangGraph对比解析,看透Agent智能体的本质
本文通过LangChain和LangGraph两大主流AI框架,深入剖析Agent智能体的本质。LangChain将大模型视为流水线工人,采用链式结构但过于死板;LangGraph引入图结构,赋予大模型决策能力,实现循环和记忆功能。Agent核心是"大模型+循环控制流+记忆",市场上的产品主要由反思模式、工具路由模式和监督者模式三种基础模式组合而成,理解这些模式就能看透Agent的本质。
2025-11-28 18:33:08
947
原创 【强烈推荐】AI大模型为何成薪资王者?政策、需求、人才缺口全解析,收藏不亏!
本文揭秘AI大模型领域成为"薪资天花板"的三大原因:国家政策大力支持AI发展;AI应用已从互联网扩展至各行各业,需求激增;AI大模型人才极度稀缺,供需失衡严重,人才缺口可能达400万。这些因素共同推动AI大模型薪资远超其他技术岗位。文章鼓励人们抓住AI时代机遇,通过学习相关技能获得高薪职业发展。任正非曾说:二十一世纪什么最贵?——人才!抢人就是抢未来!最近,一张热帖截图在程序员圈子疯传:“国内根本找不到搞大模型的人才!小红书给实习生开3600日薪。
2025-11-28 15:24:26
328
原创 收藏必备!5种经典提示词工程方法详解:从小白到精通大模型提示技巧
本文详细介绍了5种经典的大模型提示词工程方法:CoT Prompting、Self-Consistency+CoT、Least-to-Most Prompting、XoT改进方法及AutoGPT多重迭代模式。这些方法通过不同提示策略引导大模型进行复杂推理,从简单链式思考到树状结构探索,再到自主代理系统,逐步提升模型解决复杂问题的能力。文章分析了各方法的优势、局限及适用场景,为开发者提供了实用的大模型应用指导。
2025-11-28 15:22:58
1083
原创 大模型小白必学:Token全解析,值得收藏的入门指南
读到这里,Token还神秘吗?其实Token就是AI世界的"信息积木"。大模型通过计算这些积木之间的关系,推测下一个积木应该是哪个,从而生成连贯的文字。为什么大模型生成内容像"打字"?因为它一个Token一个Token地输出为什么API按使用量计费?因为Token数量对应计算成本为什么有时候大模型"卡住"了?可能是在计算下一个Token的概率分布为什么不同语言成本不同?因为Token切分方式导致的消耗差异。
2025-11-28 15:21:01
534
原创 【收藏必备】CentOS无GPU服务器部署AI聊天机器人:宝塔面板+Ollama+Dify全流程详解
AI时代催生新职业机遇,掌握大模型技术成关键竞争力。文章指出,随着ChatGPT等AI工具普及,自然语言处理、计算机视觉等领域涌现Prompt工程师、AI产品经理等高薪岗位。为帮助零基础学习者快速入门,提供了一套系统学习资源包,包含:1)详细学习路线图;2)专家撰写的经典书籍;3)视频教程;4)实战项目案例;5)行业分析报告;6)面试题库。资料由清华大学-加州理工双料博士团队研发,适合不同基础的学习者,助力转型AI领域获取职业发展新机会。
2025-11-27 19:34:01
284
原创 【必学技术】Function Calling详解:让LLM从文本生成到任务执行的完整指南
大型语言模型(LLM)存在三大核心局限:无法获取实时数据、仅能处理文本无法执行任务、生成结构化指令不可靠。Function Calling机制通过让LLM生成结构化JSON对象而非直接文本,成功突破了这些限制。该技术使模型能够识别用户意图并精确调用外部函数,实现从"信息处理器"到"任务执行者"的转变。其核心在于利用JSON Schema提供严格的输出契约,通过约束化生成确保可靠性,同时采用声明式交互范式降低提示复杂度。这一创新标志着LLM向"基于意图的计算&
2025-11-27 19:33:14
337
原创 【收藏必备】边缘端图像识别优化:小模型与大模型的结合实践(附3060显卡完整微调流程)
本文详细介绍了在Ubuntu系统使用3060显卡微调千问多模态大模型进行垂直领域图像识别的全流程,包括环境搭建、数据集准备(CSV转JSON)、模型训练(14小时/5轮次)、测试及量化部署。重点展示了如何结合小模型实时性优势与大模型高准确率特点,通过提示词工程优化边缘端检测效果。文章还探讨了AI时代Prompt工程师等新兴岗位的就业前景,并附赠大模型学习资源包获取方式。
2025-11-27 19:32:30
334
原创 【珍藏必备】LangGraph子图(Subgraph)实战指南:从入门到精通,提升代码可维护性
本文详细解析了LangGraph中的子图(Subgraph)功能,重点介绍了共享状态和不同状态两种实现模式。通过具体代码示例,展示了如何将复杂工作流模块化封装为可重用组件,包括状态管理、输入输出映射等关键实现细节。文章还探讨了子图在多智能体系统、团队协作开发等场景的实际应用价值,为构建可维护、可扩展的复杂系统提供了实用解决方案。
2025-11-27 19:31:52
303
原创 【必收藏】Agentic AI六大设计模式深度解析:从ReAct到多智能体协作的全栈开发指南
💰 投资规模:Gartner预测2025年全球软件支出将达到1.23万亿美元,同比增长14%🏢 企业需求:超过70%的企业将智能体AI列为2025年核心技术投资重点🔧 技术成熟度:大模型能力与成本已达到商业化应用的最优平衡点。
2025-11-27 14:49:34
1151
原创 从0到1成为AI工程师,7天掌握大模型高薪技能(必藏)
当下的AI真是百花齐放,ChatGPT、DeepSeek、扣子、豆包等工具直接把职场规则掀了个底朝天!一方面:求职者另一方面:企业也在疯抢 AI 人才,图引用自智联招聘说白了,现在不会点AI技能,不仅没法在职场中凸显优势,还不能抓住高薪机会😭。
2025-11-27 14:45:04
831
原创 谷歌AI Agent强化课Day1:从零搭建智能体系统,附源码收藏!小白必学的免费实战教程
《谷歌AI Agent强化课程Day1:从入门到实战》摘要 课程系统讲解了AI Agent核心概念,包括自主决策系统定义(感知环境-决策-执行)及三大组件(Gemini模型+指令+工具)。通过两个实战实验:1)创建集成Google Search工具的基础Agent,掌握提示词→工具调用→结果返回全流程;2)进阶学习单/多智能体等复杂设计模式。课程提供高质量免费源码(GitHub开源),特别适合AI领域初学者系统入门。首日内容即包含理论框架与项目实操,帮助学习者快速掌握AI Agent开发核心技能。
2025-11-26 19:00:57
337
原创 【强烈收藏】知识蒸馏技术深度剖析:让小模型学习大模型智慧的奥秘
知识蒸馏是将大模型(教师)知识传递给小模型(学生)的技术,分为白盒和黑盒两种方式。白盒方法可访问教师模型内部结构,通过优化输出分布间差异实现知识转移,如MiniLLM、GKD等方法。黑盒方法则通过模仿教师输入输出进行学习,如TAPIR框架和Step-by-Step蒸馏。知识蒸馏能有效压缩模型同时保持高性能,特别适用于资源受限场景,在大语言模型应用中具有重要价值。
2025-11-26 18:59:19
351
原创 【收藏级】RAG高级技术详解:让AI理解用户意图、获取实时信息、自进化知识库
本文系统性地介绍了RAG(检索增强生成)技术从基础到高级的完整知识体系。重点阐述了高级RAG的五大核心技术:Query改写(5种类型)、联网搜索、混合检索与Rerank、知识库自动维护(问题生成与沉淀)以及GraphRAG图谱增强。通过迪士尼客服场景的实例对比,展示了高级RAG相比基础版本在准确性(提升至90%+)、实时性(支持联网查询)、上下文理解(5种改写策略)和自动维护(降低70%成本)等方面的显著优势。文章提供了完整的技术架构图、核心概念解析和实战代码示例,帮助开发者构建企业级智能问答系统。
2025-11-26 18:58:04
1024
原创 【收藏】AI Agent记忆组件全解析:长期与短期记忆的协同工作机制与应用实战
AI Agent记忆系统通过长期记忆与短期记忆的协同工作实现智能决策。长期记忆存储持久知识,短期记忆处理即时信息,两者在存储容量、检索速度等方面互补。该系统广泛应用于智能客服、医疗诊断等领域,是提升AI智能水平的关键技术。随着AI发展,掌握大模型技术将成为职业发展新机遇,相关学习资源可帮助从业者快速提升技能。
2025-11-26 18:56:21
249
原创 【干货收藏】大模型学习避坑指南:从入门到副业变现,程序员和小白都能抄的实战路径
很多人问“现在学大模型还来得及吗?来得及,而且正是黄金期。目前中小企业的大模型需求正在爆发,但懂技术又懂落地的人才严重短缺,这就是我们的机会。不用等“学完所有知识”再行动,今天就可以:打开百度智能云,注册账号获取API密钥;用Streamlit写几行代码,做一个简单的文本总结工具;把这个工具分享到朋友圈,开启你的第一步。大模型学习的终点不是“学会技术”,而是“用技术创造价值”。愿你不仅能掌握这门技能,更能通过它实现收入提升和职业突破。如果在实操中遇到问题,随时在评论区留言,我会帮你解答。
2025-11-26 15:12:13
381
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅