自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2192)
  • 收藏
  • 关注

原创 大模型工程师完全指南:从概念到实践的全方位学习路径,AI大模型应用开发学习路线

本文从工程师视角系统介绍大语言模型(LLM)的核心概念、应用场景及工作原理。文章详细解析了LLM在医疗、教育、软件开发等领域的应用价值,对比了工程思维与算法思维的差异,并阐述了LLM基于海量数据训练的概率生成特性。通过实际案例展示了AI辅助编程实现微信小程序的完整流程,帮助读者理解LLM从理论到实践的转化过程。最后简要概述了从零构建LLM的关键步骤,为工程师提供系统性学习路径。

2025-12-16 14:59:25 1264

原创 如何从传统产品经理转行成为顶尖的AI产品经理?终于有人一次性说清楚了!

我们先来看看大模型对于AI产品经理的定义:通过这个定义,我们可以发现,AI产品经理相较于传统产品经理而言,主要的差异其实就是在对AI技术的理解与应用上。大部分传统产品经理并没有硬性的要求一定要懂技术,主要工作的重点更加偏向于需求分析、业务理解、用户体验、产品设计、策略等方面,懂技术只是一个加分项。但对于AI产品经理,了解诸如大模型、机器学习、深度学习、自然语言处理、计算机视觉等AI相关的技术,则是一项必要条件,因为只有懂AI,才能利用AI满足需求,设计出AI产品的解决方案。

2024-09-19 11:07:30 1754 1

原创 花3000元自学AI大模型后,她薪水涨了20%

我看到了一个充满无限可能的新世界”,在面试完AI产品经理这一岗位后,陈漫在社交平台上如此描述自己的感受。AGI大模型浪潮席卷全球,技术革新越是凶猛,人们的失业焦虑便越加强烈。为了应对AI带来的冲击,有些人决定“打不过就加入”,转身投向这个风口行业。陈漫便是转行潮中的一员。如今在社交媒体搜索“转行AI”“AGI”等关键词,就会涌现大量转行经验的帖子。不少博主呼吁大家抓紧时间转行进入AI领域,“真心建议大家冲一冲AI赛道”“抓住AI红利”,此类标题反复出现。

2024-08-08 10:48:25 1844 1

原创 字节大厂大模型面经,看完手撕面试官,非常详细收藏我这一篇就够了

以下是一些大模型大厂的面经,供参考:谷歌(Google):面试形式:电话面试、在线编程测试、现场面试。面试内容:数据结构和算法、机器学习、深度学习、NLP、项目经验。面试难度:较高,注重基础知识和实际应用能力。亚马逊(Amazon):面试形式:电话面试、在线编程测试、现场面试。面试内容:数据结构和算法、机器学习、深度学习、NLP、项目经验。面试难度:较高,注重基础知识和实际应用能力。微软(Microsoft):面试形式:电话面试、在线编程测试、现场面试。

2024-07-31 16:35:33 1687 1

原创 全方位大模型教程:从基础入门到实战应用

2023年大西洋彼岸的OpenAi公司,AI大模型,正在构建的颠覆力,为了更好的入局AI大模型,,包含🔻 压缩技术中,为什么量化要优于剪枝、蒸馏?🔻 如何搜索裁剪阈值用于裁剪outlier?🔻 包含有异常值outlier的特征如何量化?🔻 模型剪枝的技术背景🔻 模型剪枝具体方法🔻 模型剪枝前沿方法🔻 语言模型剪枝实例🔻 AI作画–以文生图🔻 扩散模型是什么🔻 扩散模型工作拓展🔻 扩散模型带来的机遇🔻 RLHF的优点和挑战🔻 RLHF如何改善大模型性能🔻 RLHF的实际应用案例。

2024-07-28 09:00:00 2100 1

原创 2025中国大模型行业深度报告:市场规模将破700亿,大厂算法岗薪资全攻略,助你把握职场风口!_看这行情,大模型今年真要起飞了

中国大模型行业迎来爆发式增长,2024年市场规模达294.16亿元,预计2026年突破700亿元。市场形成三大竞争梯队:阿里、字节等头部企业领跑,DeepSeek等新锐企业崛起,垂直领域企业深耕场景应用。行业高薪揽才趋势明显,科大讯飞、字节跳动等企业大模型岗位年薪最高达128万元。报告建议从业者关注技术研发与场景落地,推荐通过OfferShow平台获取最新求职信息。

2026-01-08 21:38:44 724

原创 三份“私人资料“让AI理解你的世界,回答质量提升80%

如何让AI真正理解你?作者分享了一个突破性发现:通过喂养三种个人资料(消费清单、童书和聊天记录),AI从泛泛而谈转变为精准理解个人需求的专属助手。这三类资料分别代表行为数据、认知素材和交互记录,从三个维度构建"提问者画像"。文章指出,AI需要的不是通用知识库,而是对"人"的深度理解,并提供了建立"灵魂资料库"的具体方法,包括记录生活轨迹、输入语言体系和映射决策模式。这种个性化喂养方式能让AI真正成为懂你的伙伴,而非冰冷的应答机器。

2026-01-08 21:37:43 435

原创 大模型强化学习新范式,GRPO崛起与LLM-GVF未来展望

2025年大模型训练范式迎来重大变革,强化学习(RL)地位显著提升。DeepSeek推出的GRPO算法取代PPO成为主流训练方法,被微软、字节等企业广泛采用。展望未来,具有泛化性的LLM-GVF(通用价值函数)可能成为关键突破点,解决当前RL信号效率低的问题。文章还分析了RL从辅助地位到核心角色的演变历程,指出大模型时代为RL发展提供了新机遇。

2026-01-08 21:36:17 570

原创 程序员必学!多智能体协同客服系统:大模型应用实战指南

AI智能体客服平台采用多智能体协同架构,突破传统单机模式,支持多渠道接入、智能编排和知识库管理(RAG)。系统优势包括:多智能体分工协作提升响应能力,RAG技术增强业务专业性,全渠道覆盖实现无缝服务,人机协同处理复杂场景。技术架构采用微服务设计,包含React前端、WebSocket实时通讯和Docker部署方案,支持OpenAI等主流模型接入。核心功能涵盖智能体编排、知识库管理、工具集成和人机协同,适用于各类企业客服场景,已实现多语言支持。部署灵活,最低要求2核CPU/8GB内存,推荐4核/16GB配置。

2026-01-08 21:35:24 480

原创 蒙特卡洛树搜索(MCTS)赋能大语言模型:从快思考到慢思考的进阶之路

本文探讨了将蒙特卡洛树搜索(MCTS)与大语言模型(LLM)结合的三种方法,旨在赋予LLM"慢思考"能力以解决复杂问题。PPO-MCTS利用价值函数减少计算复杂度;基于ChatGPT的任务规划方法通过状态和动作表示提升规划能力;AlphaZero类树搜索方法则优化了节点表示和价值函数评估。这些方法通过不同的技术路径实现了LLM在复杂任务中的序列决策优化,未来可进一步探索计算效率提升和多智能体协作等方向。研究结果表明,MCTS与LLM结合能显著增强模型的任务规划和问题解决能力。

2026-01-08 21:34:23 450

原创 2026年大模型学习路线图 | 四大方向+避坑指南,助你顺利转行0_基础能不能转大模型?到底怎么转?

本文针对2025年普通人转向大模型领域提供实用指南,指出大模型是包含应用层、模型层、训练链路等多层技术体系的完整产业链。文章揭示了新人常见的三大误区:过度关注模型调参、碎片化学习名词、忽视工程能力,并详细分析了数据、平台、应用、部署四大方向及其适用人群。作者提出分阶段学习路线:认知构建(0-30天)、实战落地(1-3个月)、项目打磨与简历优化(3-6个月),强调体系化思维和工程实践的重要性,为转行者提供清晰路径。最后介绍了训练营模式如何帮助学员快速掌握核心技能并获取大厂offer。

2026-01-07 22:03:32 527

原创 2026字节跳动大数据架构师面经:谓词下推与Flink状态深度解析

本文分享了字节跳动大数据架构师面试的核心知识点,包括SQL谓词下推技术和Flink状态管理机制。谓词下推通过提前过滤数据优化查询性能,文中通过SQL示例和原理图进行了详细说明。Flink状态管理部分重点解析了KeyedState和OperatorState的区别、扩缩容原理以及状态重建流程,并引入KeyGroup概念解决状态分配问题。文章还结合源码分析状态重建的实现逻辑,帮助读者深入理解大数据处理的核心技术。此外,文中提到字节26届校招顶尖人才年薪达260万,突显了大模型与AI领域的技术价值。

2026-01-07 22:02:26 338

原创 当数据开始为Agent而生:IDC FutureScape 2026 给中国企业的十个关键信号

摘要: IDC报告指出,数据正从AI输入转变为企业智能基石,中国企业面临数据架构重构拐点。报告提出十大关键预测:2027年80%的AI Agent需实时数据驱动联合治理;2028年60%企业采用HTAP架构支持实时决策;数据协作、合成数据、归档数据价值重估成为趋势;数据可观测性使AI落地成功率提升50%;自动化数据访问和Data Agent将普及。报告强调,AI Agent能否规模化取决于数据是否具备**"随时可用、始终可信、持续可控"**特性,建议企业从集中式供给转向联合治理范式,实现

2026-01-07 22:00:41 771

原创 Agent 成新基建,2030 年渗透率 90%,7 大赛道 + 标杆厂商深度拆解

摘要:生成式AI正从工具进化为自主执行的智能体(Agent),成为国家战略级技术。国务院要求2027年应用渗透率超70%,2030年达90%,推动Agent成为企业数字化转型的必修课。Agent通过大语言模型、规划能力等四大要素实现自主决策与闭环执行,重塑生产关系并激活新质生产力。爱分析报告指出,Agent在7大核心赛道(如智能分析、营销、数字人等)已形成成熟应用,各赛道标杆厂商通过差异化方案解决行业痛点。企业选型需聚焦场景适配、技术架构和落地能力三大原则,抓住Agent带来的生产力革命机遇。

2026-01-07 21:57:50 829

原创 智能体迈入 Agent RL 新架构时代,非常详细收藏这一篇就够了

0、序章:三大核心认知基石=============在探索 Agent RL 技术浪潮之前,我们需先锚定三个根本性认知:

2026-01-07 21:54:58 682

原创 2025金三银四:大模型训练岗年薪百万技术栈揭秘,非常详细收藏我这一篇就够了!

2025年大模型训练岗位校招薪资峰值突破​**​¥180万​**​(OpenAI中国研究院Offer),较算法工程师均值高出​**​300%​**​。本文基于猎聘/脉脉35家头部企业招聘数据,深度解析百万年薪背后的​**​技术能力图谱​**​:涵盖​**​万卡集群调度​**​(Kubernetes+Ray)、​**​混合专家训练​**​(MoE稀疏化)、​**​量子-经典混合计算​**​(QML)等12项硬核技能。首次公开华为/腾讯/字节等企业的岗位能力模型与面试题库,提供从理论学习(《深度学习高阶优化》)

2026-01-06 21:25:49 1317

原创 AI产品经理从小白到高薪专家的完整路径,3步掌握未来最吃香岗位

AI产品经理是未来最具前景的职业,分为工具型、应用型和专业型三个层次。对于大多数人,应用型AI产品经理是最佳选择。通过夯实产品基本功、掌握AI项目落地能力和补充AI知识技能三步,可系统成长为AI产品经理。起点课堂全站通会员提供完整学习路径,帮助学习者高效掌握相关技能,实现职业转型。

2026-01-06 21:24:15 741

原创 现在大厂的AI产品经理在做什么?怎么分类

摘要:文章分享了国庆期间几位大厂AI产品经理关于行业现状的讨论,将AI产品经理工作分为三类:1)大模型方向(基座模型开发与测评);2)AI+行业应用(场景落地与创新);3)产品AI功能设计(交互与项目管理)。指出第二类最具前景,建议求职者针对性提升大模型原理、Agent等技能,同时鼓励行情低迷时保持信心。文末附赠104G大模型学习资源包(含教程/案例/面试题),覆盖从入门到进阶的全栈知识体系,强调掌握大模型技术对职业发展的重要性。(149字)

2026-01-06 21:22:36 879

原创 豆包AI超越ChatGPT的3个技术临界点,程序员必看!

《豆包AI与老罗对话揭示大模型三大突破》摘要:本文通过豆包AI与老罗的科技春晚互动,展现了大模型技术的三大突破:1)情感对话能力可识别用户情绪并拟人化回应;2)2秒内快速响应优化用户体验;3)MBTI性格匹配实现个性化交互。相比ChatGPT和GROK,豆包AI在拟人化和响应速度上更胜一筹。文章探讨了AI作为人类情感伴侣的潜力,同时指出数据迁移等技术挑战,为开发者提供了大模型发展的新思路。(149字)

2026-01-06 21:21:41 419

原创 AI Agent 记忆系统设计:短期记忆与长期记忆

本文探讨了将无状态的大语言模型(LLM)进化为具备记忆能力的智能代理(Agent)的关键技术。文章指出,记忆系统是AI智能积累和复利效应的基础,并将其分为短期记忆(类似内存)和长期记忆(类似硬盘)。短期记忆受限于上下文窗口容量,可通过滑动窗口或摘要压缩优化;长期记忆则依赖向量数据库和RAG机制实现语义检索。文章强调,真正的智能在于短期与长期记忆的协同流动,提出了记忆巩固流程,并指出有效记忆的核心在于选择性保留有价值信息。最后,作者提供了大模型学习的资源路径和商业化应用方案。

2026-01-06 21:20:45 722

原创 AI大模型学习宝典:从技术入门到商业应用,全方位掌握_大模型产品经理课程(非常详细)大模型入门到精通

AI大模型行业快速发展,AIGC人才需求激增,尤其是AI产品经理岗位。AI产品经理负责将大模型技术转化为商业产品,需具备技术理解力和市场洞察力。该职位薪资优厚、前景广阔且工作压力相对合理。文章提供AI大模型产品经理四阶段学习路径(初阶到商业闭环)及全套学习资源(思维导图、视频教程等),帮助零基础者掌握核心技能,抓住AI时代机遇。

2026-01-05 20:07:15 1118

原创 FastGPT完全部署指南:从零搭建大语言模型知识平台

本文详细介绍了FastGPT项目的部署与使用流程。FastGPT是基于大语言模型的知识型平台,支持数据处理、RAG检索和可视化工作流编排等功能。文章从Git安装、Docker配置入手,解决了config.json路径问题,并演示了LLM和embedding模型的配置方法。通过PDF文档处理、图片标注和知识库查询等示例,展示了FastGPT强大的知识解析能力。该项目完全兼容OpenAI接口,可快速构建AI问答系统,是企业知识管理的理想选择。部署过程中遇到的技术问题及解决方案也提供了实用参考。

2026-01-05 20:06:19 738

原创 大模型知识增强完全指南:RAG与微调的实战对比与选择策略

RAG与模型微调是大模型知识增强的两种主要方法。RAG通过外部知识库检索资料辅助回答,适合普通用户快速获取本地知识,但受限于知识库内容;模型微调则通过特定数据训练改变模型参数,提升专业领域表现,但成本高且可能影响其他能力。二者可互补使用,选择需综合考虑需求、成本及技术能力。RAG操作简便、成本低,适合个人用户;模型微调效果稳定但门槛高,更适合专业机构。

2026-01-05 20:05:18 662

原创 LangGraph人机协同(HITL)实战:三种核心模式详解+企业部署避坑指南

本文介绍了LangGraph中人机协同(HITL)的三种核心模式:审批门(关键操作前暂停人工批准)、置信度阈值(置信度低于0.85触发审核)和反馈循环(人工修正反馈系统学习)。HITL可避免AI不可逆错误,部署时需注意设置超时处理和使用即时通讯工具通知。2026年HITL将成为企业采用AI系统的关键卖点,区分资深与初级AI工程师的核心在于把握人工监督时机。三种模式各具特点:审批门强制暂停规避风险,置信度阈值动态平衡效率,反馈循环持续优化决策能力。

2026-01-05 20:03:42 512

原创 Meta数十亿美元收购Butterfly Effect:中国AI团队如何打造自主智能体并成功出海

Meta收购中国AI团队Butterfly Event及其产品Manus,为中国技术团队出海提供了重要参考。Manus成功关键在于构建从"对话"到"执行"的自主智能体,实现任务闭环;同时采取全球化技术栈设计、引入顶级风投、选择成为巨头生态中不可或缺的关键组件。启示中国团队应将AI定位为工作流中的"自动化执行层",构建符合全球规则的商业智慧,才能在国际AI竞争中脱颖而出。

2026-01-05 20:02:36 625

原创 2026最新AI大模型学习指南:从理论到实战,附全套104G资料包_AI大模型学习路线解析,完美!

本文系统介绍了AI大模型学习的完整路径,涵盖理论基础、编程实践、领域知识融合、数据处理、模型优化等关键环节。从数学基础到前沿技术跟踪,再到模型部署与维护,全方位构建学习体系。同时提供了从零基础到进阶的七阶段学习路线,并附赠104G大模型学习资源包,包括视频教程、PDF书籍和商业化落地方案,帮助程序员从入门到精通AI大模型技术。

2026-01-04 17:36:44 962

原创 人工智能学习路线:小白到专家的进阶指南_【2026首发】AI大模型学习路线

本文系统介绍了人工智能学习的完整路线,分为四个阶段:入门阶段(Python编程、数学基础、机器学习基础)、中级阶段(深入学习算法、项目实践)、进阶阶段(自然语言处理、计算机视觉、强化学习)和高级阶段(深度强化学习、生成模型)。每个阶段都详细说明了需要掌握的知识点和技能,并提供了相应的学习资源建议。文章特别强调实践项目的重要性,并分享了包含书籍、报告、视频等在内的大模型学习资料包,帮助学习者从零基础逐步成长为人工智能领域的专业人才。

2026-01-04 17:34:16 1016

原创 深度学习本质:大模型如何学习人类潜意识实现智能对话

摘要:深度学习本质是对人类潜意识的学习。深层模型对应潜意识表达系统,浅层模型对应明意识表达系统。人类能相互理解源于共有的潜意识认知。真正AI的基础是表达系统,人类语言是从潜意识衍生的浅层模型。表达系统与客观世界存在偏差,而意识语言编程(NLP)可构建超越传统逻辑的AI。该技术既能创造更智能的系统,也可能被用于精神操控,关键在于表达系统与现实世界的偏差控制。知识工程是一门需要天赋的艺术,需通过拜师学习才能掌握。

2026-01-04 17:32:53 951

原创 无需编程,用Coze和NoCode打造你的AI产品帝国

文章介绍两款免费AI应用开发工具Coze和NoCode,展示如何无需编程知识就能开发AI助手、小游戏、市场调研报告等产品。强调AI工具普及使非技术人员也能进入产品开发领域,轻资产创业成为趋势,抓住用户需求和产品创新是提升竞争力的关键,2026年将是全生态数字产品爆发的一年。

2026-01-04 17:31:53 648

原创 大模型赋能零样本NILM:对比学习与多尺度时间融合的创新应用

文章介绍了一种基于对比学习的多尺度双路径时间融合网络(CLM-DTFN),用于解决非侵入式负荷监测(NILM)中的零样本问题。该框架通过多尺度能量感知嵌入捕获不同时间尺度特征,残差式功率解耦分离趋势项与季节项,以及AutoCon自相关对比学习提升跨家庭泛化能力。实验表明,该方法在无需目标家庭标签的情况下,在U.K.-DALE和REDD数据集上实现了当前最优的零样本负荷分解性能。

2026-01-04 17:30:53 654

原创 Java程序员如何转行大模型开发?超详细指南+学习资源,建议收藏_2025最新程序员转行AI大模型教程(非常详细)

文章介绍了Java程序员转型大模型开发的完整路径,包括学习基础知识、掌握工具框架、提升编程能力、储备数学知识和项目实践五大步骤。同时分析了Java程序员的转型优势,详细列出了AI时代的新兴技术岗位及所需知识体系,并提供了大模型学习路线和丰富资源,帮助程序员系统掌握AI技能,实现职业转型。

2025-12-31 14:57:36 841

原创 突破大模型Agent文档感知瓶颈:基于TextIn + Coze的智能文档解析实践

摘要:本文提出使用TextIn文档智能解析引擎解决大语言模型智能体处理复杂文档时的感知瓶颈问题。通过将PDF、Word等复杂文档转化为高质量Markdown结构化文本,有效解决了语义边界模糊和结构化信息丢失问题。基于TextIn+Coze平台构建的论文分析助手Agent方案,实现了对学术论文的高效解析与问答,单篇论文解析仅需2.8秒,显著提升了处理效率。该方案为复杂文档的智能化处理提供了有效解决方案。

2025-12-31 14:56:02 788

原创 英伟达Alpamayo-R1开源:揭秘VLA大模型的训练方法与技术优势

本文详细解析英伟达开源的VLA推理大模型Alpamayo-R1,该模型通过结构化"因果链"(CoC)框架提升自动驾驶决策能力。文章介绍了三大技术创新:CoC数据集解决因果推理问题、模块化VLA架构实现高效多模态处理、多阶段训练策略融合强化学习。实验显示,该模型在复杂场景中轨迹预测准确率提升12%,安全性指标显著改善,为L4级自动驾驶提供了技术路径。

2025-12-31 14:54:38 843

原创 DeepSeek大模型本地部署全教程,小白也能轻松上手,打造自己的AI管家

本文详细介绍了DeepSeek大模型的本地部署流程。首先需下载安装Ollama工具,然后根据硬件配置选择合适的模型版本(1.5b至671b不等),通过命令行完成模型安装。同时提供了可视化工具Chatbox的安装指南,使交互更加便捷。DeepSeek作为开源大语言模型,支持离线运行,无需API费用,用户可根据自身需求打造专属AI助手。文中还附有详细的配置说明、下载链接和安装截图指引,帮助用户顺利完成本地部署。

2025-12-31 14:52:19 822

原创 EvoLM开源套件:大模型训练全生命周期透明化,发现数据饱和点提升训练效率

EvoLM研究构建覆盖预训练到强化学习全阶段的透明模型套件,训练超100个1B/4B参数模型并开源。核心发现预训练存在"饱和区":数据量超过模型参数量80-160倍后,继续增加数据会损害下游OOD任务性能,挑战"数据越多越好"的认知。研究还揭示数据回放策略缓解灾难性遗忘,适度监督微调平衡ID与OOD性能,而强化学习主要增强答案置信度而非推理能力。这些发现为模型训练资源分配提供关键参考。

2025-12-31 14:50:01 823

原创 大模型学习全攻略:从零基础到项目实战(建议收藏)_大模型入门教程,零基础从0开始

大模型是包含超大规模参数的神经网络,分为语言、音频、视觉和多模态类型,通过预训练和微调获得能力。已广泛应用于金融、医疗、教育等领域,未来趋势是轻量化和终端化。但面临就业冲击、版权争议、算法偏见等挑战。系统学习应从基础到进阶,结合理论学习和项目实践,掌握核心原理和实际应用。

2025-12-30 16:33:39 1331

原创 DeepSpeed大模型训练优化全攻略:从安装到分布式训练,小白也能轻松上手

DeepSpeed是微软开源的大模型训练优化库,通过ZeRO技术显著减少GPU显存占用,支持训练千亿至万亿参数模型。其核心模块包括训练优化(ZeRO技术实现显存节省)、推理加速(模型并行与流水线并行)、模型压缩(稀疏注意力等优化)和科学计算应用。文章详细介绍了DeepSpeed与Transformers的集成方式、安装配置流程(包括GCC更新和源码编译),以及T5模型训练方法。通过ZeRO-2优化技术示例展示了如何在单机多卡和分布式环境下高效训练7.7亿参数的T5-Large模型,为资源受限场景下的大模型训

2025-12-30 16:31:25 1032

原创 Obsidian+Ollama打造完全本地隐私RAG知识库指南

本文详细介绍了如何使用Obsidian结合本地Ollama+Qwen 3模型构建完全本地化的隐私保护RAG知识库。通过文档读取、切片、向量化存储等步骤,解决了云端AI助手的隐私泄露风险和网络依赖问题。作者使用Electron构建的MyGPT应用实现了基于本地知识库的智能问答功能,支持直接跳转原始文档,打造了一个完全离线、绝对隐私的私人AI助理。

2025-12-30 16:30:27 1015

原创 【必学收藏】大模型入门全攻略:从数学基础到工程实践的完整路径

大模型(LLM)学习指南摘要 本文系统介绍了大模型学习的完整路径,分为基础、科学家和工程师三部分: 基础部分:涵盖数学基础(线性代数、微积分、概率统计)、Python编程(数据处理、机器学习库)、神经网络(结构、训练优化)和NLP(文本处理、词嵌入、RNN) 科学家部分:深入LLM架构(Transformer、注意力机制)、数据集构建(合成数据生成、数据过滤)、预训练微调、模型评估与量化 工程师部分:聚焦模型运行、RAG系统构建、推理优化和部署实践 文中提供了丰富的学习资源推荐,包括3Blue1Brown、

2025-12-30 16:27:48 606

原创 GitHub 上 10 个令人惊艳的 Agent 开发平台,太顶了

AutoGPT 是 AI Agent 领域的鼻祖级项目,现在已经 18 万+的 Star 了。与聊天机器人不一样,AutoGPT 能够自主地将一个大目标拆解为子任务,并利用互联网搜索、本地文件等操作来一步步实现目标。

2025-12-30 16:26:24 1022

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除