- 博客(1096)
- 收藏
- 关注
原创 程序员转行为什么这么难,2025年强烈建议程序员转行大模型试
文章分析了程序员职业转型的四大障碍:路径依赖、高薪成本、技能单一和他人期望。面对科技行业变革,传统IT岗位面临转型压力,而AI大模型领域需求激增。文章提供了一套系统的AI大模型学习资源,包括视频教程、书籍、面试题等,旨在帮助程序员掌握AI技能,实现职业跃迁,抓住AI时代机遇。在“大龄程序员的未来在何方”这篇文章里比较乐观地介绍了程序员保持竞争力的几个方向,但现实依然是残酷的:很多人将不得不离开软件开发工作,转型去从事其他职业。当你要这么做时,就会感慨:想不到一切竟如此艰难!
2025-12-12 20:26:16
919
原创 Agent爆发元年!从0到1搭建AI智能体,这篇文章讲透了!
在人工智能领域,Agent并非一个全新的概念,但在大模型时代,它被赋予了全新的生命力。简单来说,Agent是一个能够自主感知环境、理解任务、制定计划、调用工具并完成目标的智能实体。它不仅仅是与你对话的聊天机器人,更是能够代理你完成复杂工作的"数字员工"。
2025-12-12 20:25:13
661
原创 手搓一个智能体,也太简单了吧!(万能教程版)
今年你肯定已经无数次听到 AI Agent(智能体)这个词。但可能会觉得很陌生,感觉它既强大又遥远,似乎是程序员和技术专家的专属工具?事实上,普通人不仅能用,更能亲手创造属于自己的AI智能体。它们能成为你得力的“数字员工”,自动处理繁琐任务,从根本上改变你的工作方式。这篇文章将摒弃所有复杂的理论,旨在用最直接、最易懂的方式,带你从零到一,亲手搭建第一个能帮你干活的AI智能体。准备好了吗?让我们一起进入AI Agent的世界。
2025-12-12 20:23:58
844
原创 《Agentic设计模式》:构建智能系统的实战指南
简单来说,AI智能体是一个能够感知环境并采取行动以实现特定目标的系统。它是大语言模型(LLM)的进化版本,增强了规划、使用工具和与环境交互的能力。接受任务:你给它一个目标,如"整理我的日程"扫描环境:收集所有必要信息——读取邮件、检查日历、访问联系人制定计划:思考实现目标的最佳方法执行行动:发送邀请、安排会议、更新日历学习改进:观察结果并适应调整,持续优化这种循环机制让AI智能体能够像人类助手一样在工作中不断学习和改进。
2025-12-11 19:15:18
914
原创 智能体框架:11个顶级AI Agent 框架!
文章对比了开源与商业解决方案差异,提供框架选择标准,帮助开发者根据项目需求和技术水平构建智能、自主的AI应用系统,是开发者掌握大模型应用开发的实用指南。无论您需要用于构建对话 Agent、多 Agent 协作系统,还是复杂工作流自动化的框架,本指南介绍的 11 个框架都提供了多种选择,以满足不同的需求和技术专业水平。本指南将深入探讨当前最优秀的 11 个 AI Agent 框架,比较它们的特性、优势、劣势以及理想的应用场景,帮助您为下一个项目做出明智的决定。作为学习AI大模型技术的新手,方向至关重要。
2025-12-11 19:14:01
889
原创 基于大模型的领域场景开发:从单智能体到多智能体的React框
对于React,大家都有自己的理解。本文主要介绍我们是如何实现React框架,关于智能体React模式简单仅做个人简单的一些理解。1.首先LLM需要不断和环境作出反馈和判断,制定下一步的执行策略。这里的环境即工具列表、对话上下文、一些系统变量。2.上图可以看出,核心还是接收反馈后采用什么方式决策?以及和环境之间通信的上下文如何管理。因此关于决策方式和上下文管理大家都卷出了各种玩法:决策方式1.类manuas方式,使用PlanningAgent:负责规划;
2025-12-11 19:13:08
661
原创 2025程序员转行大模型全攻略:百万年薪岗位揭秘,零基础突围
本文解析2025年大模型领域的爆发机遇,指出市场需求激增、薪资远超传统岗位、政策资本双重驱动。文章为程序员提供四大黄金岗位选择、三大转型策略和六个月学习路线图,强调技能嫁接、技术栈组合和微项目实践。同时提醒避开盲目死磕数学、忽视垂直领域知识和低估工程化能力等陷阱,帮助程序员高效转型,抓住AI时代职业黄金期。2025年,全球大模型产业规模已突破5000亿美元,,资深算法工程师年薪直逼200万61。当传统开发岗位内卷加剧,大模型领域却以470%的岗位增速和3.2万平均月薪成为程序员转型的“诺亚方舟”5。
2025-12-11 19:12:27
784
原创 大模型面经——LoRA最全总结
通过低秩分解来模拟参数的改变量,从而以极小的参数量来实现大模型的间接训练。实现思想很简单,就是冻结一个预训练模型的矩阵参数,并选择用A和B矩阵来替代,在下游任务时只更新A和B。
2025-12-01 18:29:11
774
原创 写给大模型新人的经验,刷到少走三年弯路!
本文详细解析了新人转行大模型的四大方向:数据、平台、应用和部署,揭示了新手常犯的误区——直接选择应用方向。文章强调数据工程师是目前更容易入行的选择,同时介绍了平台和部署工程师的工作内容与发展前景。作者建议新人不要只关注算法调优,而应注重数据构建、工程能力和垂直领域深耕,通过系统性学习避开弯路,高效入行大模型领域。📖主线输出大模型面试干货,支线分享大模型行业动态这篇文章,我将结合自己在大模型领域的经验,给大家详细聊聊新人应该如何转行大模型赛道?比如大模型都有哪些方向?各方向的能力要求和岗位匹配?新手转行大模
2025-12-01 18:27:50
1156
原创 大龄程序员想转行大模型,应该往哪个方向转?_程序员中年失业后,如何选择方向,大模型算法
每个方向都有其独特的挑战和发展机遇,程序员可以根据自己的背景和兴趣选择最适合自己的路径。无论选择哪个方向,持续学习最新的技术和保持对行业的敏感度都是非常重要的。此外,积极参与社区活动、贡献开源项目也是提升技能和个人影响力的有效方式。在大模型时代,我们如何有效的去学习大模型?现如今大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。掌握大模型技术你还能拥有更多可能性。
2025-11-28 19:25:41
471
原创 2025年最新!后端程序员转行AI大模型学习路线,大模型入门到精通,超详细!_后端转ai agent
1.1 工程能力的降维打击后端程序员固有的系统架构设计、高并发处理及运维部署经验可直接迁移至AI应用开发:大模型服务的API化本质与微服务架构高度契合(如模型推理的异步队列设计)分布式系统经验可直接应用于模型训练集群管理(GPU资源调度、故障转移)容器化技术栈(Docker/K8s)无缝衔接大模型部署场景1.2 工具链的快速适配后端开发者的技术栈与大模型开发工具链存在天然交集:Python生态主导地位:FastAPI构建模型服务接口 vs Flask/Django后端开发经验数据库技能迁移:关系型数据
2025-11-28 19:25:02
577
原创 【转行大模型_】大数据时代终结?AI崛起!我为何选择进军大模
作为一名大数据开发工程师,我看到大模型技术正在重塑我们的行业。这次转型不仅是顺应技术潮流的选择,更是基于个人技能、市场需求和职业发展的综合考量。我相信,凭借我们在数据处理和分布式系统方面的专长,再辅以新的学习,我们完全有能力在大模型应用开发这个新领域大展身手。这次转型的思考是一个契机,后续还须更多步骤才能转型成功。我也会持续更新这一系列自己的心路历程,希望能为同样考虑转型的同行们提供一些参考和启发。让我们一起在这个AI驱动的新时代中,开创属于我们的新天地!
2025-11-26 15:54:42
430
原创 问答类AI智能体评测方案
维度用来描述从哪些方面对智能体进行效果评估。通常可以分层对维度进行细化,第一层维度通常是场景,用来描述智能体可以完成哪些业务场景,第二层维度通常是任务,描述一个业务场景下需要完成的具体任务。通过对智能体进行场景和任务的拆解,可以确保更加全面地对智能体进行多方面、多维度的效果评估。维度定义对于数据集构建、指标设定具有重要参考意义。业务场景(第一层维度)任务定义(第二层维度)销售相关问题:意图识别、黑化改写、文档检索、答案生成代码相关问题:联网搜索、知识检索模型调用、答案生成文档内容洞察。
2025-11-22 22:08:15
995
原创 前端程序员转行大模型岗:全面攻略,非常详细收藏我这一篇就够了_前端转ai
随着人工智能技术的快速发展,尤其是大规模语言模型(如GPT-3、BERT等)在自然语言处理领域的广泛应用,越来越多的技术人才开始考虑向这一前沿领域转型。除了 AI 入门课程,我还给大家准备了非常全面的**「AI 大模型面试题」,**包括字节、腾讯等一线大厂的 AI 岗面经分享、LLMs、Transformer、RAG 面试真题等,帮你在面试大模型工作中更快一步。教程从当下的市场现状和趋势出发,分析各个岗位人才需求,带你充分了解自身情况,get 到适合自己的 AI 大模型入门学习路线。
2025-11-21 18:37:20
848
原创 程序员转行到大模型开发领域,以下是几个推荐的方向、推荐原因以及学习路线!_程序员转大模型的几个方向
每个方向都有其独特的挑战和发展机遇,程序员可以根据自己的背景和兴趣选择最适合自己的路径。无论选择哪个方向,持续学习最新的技术和保持对行业的敏感度都是非常重要的。此外,积极参与社区活动、贡献开源项目也是提升技能和个人影响力的有效方式。在大模型时代,我们如何有效的去学习大模型?现如今大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。
2025-11-21 18:36:38
847
原创 万字长文教你从零实现百万参数LLM训练_llm是怎么生成
在这篇文章中,我们将尝试制作一个只有 230 万个参数的 LLM,有趣的是,我们不需要特别多的 GPU。除这些概念外,LLaMA 论文还介绍了其他重要方法,包括使用带有特定参数的 AdamW 优化器、高效实现(如 xformers 库中的因果多头注意力算子),以及手动实现Transformer层的后向传播函数,以优化后向传播过程中的计算。让我们相应地调整模型设置。在当前的架构中,嵌入层的词汇量为 65 个,代表了我们数据集中的字符数目。让我们创建一个函数,模仿论文中 RoPE 的实际实现:。
2025-11-21 18:18:17
570
原创 3个月转行ai产品经理靠谱吗?
另一个例子是个95后的女生,原来在一家To B公司做运营偏产品助理的角色,年初咬牙报了一个AI产品的实战班,就三个月时间,从零开始搭了个基于开源模型的客服机器人 demo,还做了份特别清晰的产品规划文档。反正AI行业刚刚起飞,岗位需求也远没有饱和,只要你能打出自己的“组合拳”——理解业务+理解AI+具备实战经验,那你就有足够的筹码在这个领域走下去,不是靠背景,不是靠学历,而是靠真能力和持续学习。说白了,3个月能不能转成AI产品经理,不是看时间,是看你“有没有用对时间”。从原理出发真正入局大模型。
2025-11-18 18:27:18
305
原创 【AI+医疗】知识图谱与大语言模型融合:破解生物医学AI的黑盒难题!
本文探讨了大语言模型在生物医学研究中的局限性,提出了通过知识图谱增强LLM可解释性的解决方案,并详细介绍了统一KG-LLM框架在生物自然语言处理中的应用前景和实践价值。
2025-11-17 18:45:06
370
原创 如何改变AI研究范式?谷歌DeepResearch新方法TT
谷歌提出的TTD-DR是新型AI深度研究范式,模仿人类"先拟初稿、再迭代完善"的研究方式。这里可以看到:与传统Deep Research相比,TTD-DR这种“先粗后精”的扩散式写作更加贴近人类的思维与创作模式: 先列提纲、写初稿,然后不断发现其中的不足,并查询资料不断打磨,直至足够完善。具体而言,对于产生中间结果的关键步骤(如生成需要搜索的问题或根据搜索结果综合出答案),系统不局限于一次性产出结果,而是并行生成多个不同版本,然后通过模拟环境反馈筛选出优秀的版本,并据此对结果进行改进。
2025-11-17 18:44:24
362
原创 一文全解析:AI 智能体8种常见的记忆(Memory)策略
它能够在保持对话响应速度的同时,保留大量历史信息,适合低延迟对话、时间跨度较大的任务型助手,以及需要随时回溯旧信息的场景:当用户提出涉及过往内容的问题时,系统可以像操作系统一样将“被交换出去”的记忆及时“唤醒”,实现高效又节省资源的记忆管理。其动机是像人类做笔记一样,将冗长的对话内容去除无用的信息(寒暄、闲聊、重复信息等),浓缩成关键要点(事实、关键数据、兴趣爱好等)保存。针对全量记忆的弊端,最简单的改进是**限制记忆长度:**人类对话中,我们往往只关注最近的信息,旧话题慢慢就淡忘了。
2025-11-17 18:43:29
727
原创 写给大模型新人的经验,刷到少走三年弯路!
不过这里我不禁要给各位泼一点冷水,在 AI 算法这个行业,三是很吃业务经验的,如果你之前本身就是做算法的,比如是做 NLP,又或者是做语音助手,对话机器人这类的,再顺水推舟做相关方向的大模型算法工程师,这是比较合适的。拿数据来说,先说通用的大模型训练,数据的来源,从哪里采,数据的质量怎么把控,如何过滤有毒信息,语言的筛选与比例,数据的去重,以及数据的规范化处理,评测集的构建。然后很多人可能往往忽视了上面的 1,2,4,觉得我学了这么多算法知识,学了机器学习,深度学习,还了解大模型,再去做数据,有点屈才了。
2025-11-17 18:38:20
448
原创 必知!AI大模型应用架构图(全)
内容从RAG知识库、AI智能体架构、代码解释器到LLM OS等多个维度,详细介绍了云原生架构与AI原生架构设计差异,帮助读者建立"全局-局部-细节"的认知链路,系统掌握大模型应用架构设计全貌。除了 AI 入门课程,我还给大家准备了非常全面的**「AI 大模型面试题」,**包括字节、腾讯等一线大厂的 AI 岗面经分享、LLMs、Transformer、RAG 面试真题等,帮你在面试大模型工作中更快一步。,规划属于你自己的大模型学习路线,并且专门提前收集了大家对大模型常见的疑问,集中解答所有疑惑!
2025-11-17 18:37:07
499
原创 复旦邱锡鹏团队突破RAG瓶颈!搞定“全局检索”难题,复旦邱锡鹏团队破局方案
这四种工具可组合形成计算框架,为全局RAG的数值推理提供可靠基础。而14B模型上,GlobalRAG的平均F1比HyperGraphRAG高6.54分,原因是图结构方法在构建过程中破坏了文档的结构完整性,丢失了关键元数据,而GlobalRAG的文档级检索确保了结构完整性。跨规模性能趋势:随着模型规模从3B增至14B,GlobalRAG的性能大幅提升,平均F1从2.52升至6.63,提升4.11分,而其他方法的提升有限或不稳定,表明GlobalRAG的多工具协作框架能更好地利用大型LLMs增强的推理能力。
2025-11-12 18:46:35
600
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅
1