自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1313)
  • 收藏
  • 关注

原创 经济大环境不好,软件业却“逆风翻盘”!2025上半年这波行情,打工人到底该喜还是该忧?

2025年上半年我国软件和信息技术服务业逆势增长,收入达7.06万亿元,同比增长11.9%。信息技术服务成为支柱产业,占比68.5%,其中云计算、大数据和集成电路设计表现突出。区域发展呈现东强西稳态势,长三角增速达13.7%,上海以18%领跑全国。AI技术正深刻改变行业生态,61.8%开发者已使用AI辅助编程,但复杂创新工作仍需人工主导。未来行业将聚焦云原生与AI融合、软件安全、工业软件国产化等领域,建议从业者提升架构设计、云原生等核心能力,积极拥抱AI工具。

2025-08-04 15:14:01 3869 1

原创 2025大模型面试「终极题库」刷完这份就够了!104道高频考点+深度解析,助你一举拿下Offer!

当前就业环境已不再是那个双向奔赴时代了。求职者在变多,岗位在变少,要求还更高了。最近,我们陆续整理了很多大厂的面试题,帮助网友解惑答疑和职业规划,分享了面试中的那些弯弯绕绕。

2025-11-24 16:47:09 565

原创 Java程序员的「无痛转型」路线图:12步精准拆解,平滑切入大模型应用开发新赛道!

Java程序员转型大模型应用开发应聚焦工程化优势:1)将大模型能力封装为微服务嵌入业务系统,利用Spring Boot、Vert.x等框架优化性能;2)采用Spring AI、LangChain4j等Java生态工具链构建AI应用。技术路径可分两步:先通过API调用实现情感分析等基础功能,再进阶为包含多模型路由、本地部署和降级方案的完整系统。核心在于发挥Java在企业级系统集成和高并发处理上的优势,而非直接参与模型训练。

2025-11-24 16:44:22 1146

原创 小白也能看懂的多模态大模型:行业应用与实施路径全解析!

当前,各行业都面临着数字化转型的深度挑战。教育机构在寻找因材施教的可行路径,医疗机构在探索精准诊疗的有效方法,制造企业在追求柔性生产的实现可能。这些看似不相关的行业痛点,其实都指向同一个核心需求:如何让系统真正理解业务场景的复杂性,并做出智能响应。

2025-11-24 16:40:30 492

原创 LangChain从入门到精通:手把手教你构建AI应用,解决大模型三大痛点!

本文详细介绍了LangChain框架,它是解决大模型三大局限性(知识过期、无记忆能力、缺乏工具使用能力)的关键工具。文章通过四阶段实战路线图,从基础到高级,逐步讲解如何使用LangChain构建AI应用:打通引擎、添加记忆功能、实现RAG检索增强生成、部署Agent智能体。最后还介绍了如何用Streamlit创建网页界面,以及LangGraph进阶技术。无论是否有Python基础,读者都能通过本教程掌握LangChain,构建自己的AI应用。

2025-11-24 16:34:51 555

原创 颠覆传统:基于Agent的工作流开发新模式详解!

本文介绍了基于Agent驱动的新型工作流开发模式,将Agent作为底层框架而非简单节点,颠覆了传统"先建模后执行"的思维。这种模式具有参数自组织、上下文自感知、无需固定流程路径等优势,大大简化了数据传递和流程编排的复杂度。通过AI的推理能力实现流程的自组织执行,既提高了开发效率,又增强了业务灵活性,为工作流开发带来了全新的范式。

2025-11-24 16:32:12 592

原创 上下文管理是大模型应用稳定性的一个重要环节:解决智能体异常终止的实战经验!

文章分析了大模型应用中智能体异常终止的原因是上下文窗口超长,指出问题在于历史记录管理不当。作者提出使用TrimmedInMemorySaver类过滤思考过程和工具调用结果,只保留对话内容,以控制上下文长度,提高应用稳定性。这种方法虽会导致部分记忆丢失,但能有效防止上下文超长问题。

2025-11-23 08:00:00 659

原创 【干货】词嵌入模型新趋势:BGE与Qwen3架构对比及训练方法详解!

文章详细对比了BGE和Qwen3两种词嵌入模型的架构差异,重点介绍了Qwen3 Embedding的创新训练方法,包括三阶段训练流程、高质量数据合成技术以及通过添加prompt实现多维度推荐的新用法。词嵌入模型正从使用公开数据转向大模型合成数据,从Encoder架构借鉴Decoder架构,训练方法也从传统的Mask猜词发展为多阶段训练与模型融合,显著提升了模型效果和泛化能力。

2025-11-23 07:00:00 709

原创 35岁程序员失业,只能开滴滴?这些大模型方向高价值转型方向很多人没想到!

“对不起,我们需要的是有AI背景的候选人。”35岁的李明(化名)在经历了第17次面试失败后,终于明白了一个残酷的现实:传统Java开发岗位正在快速萎缩,而大模型相关岗位却在爆发式增长。这不是个例。脉脉《2025年AI人才流动报告》显示,AI新发岗位量同比增长超10倍,而传统开发岗位需求却在下降。更令人震惊的是,35岁以上程序员投递AI岗位的通过率不足20%,但一旦成功转型,薪资普遍能提升30%-50%。

2025-11-22 13:50:39 937

原创 提示工程完全指南:从小白到专家掌握大模型交互核心技能!

文章系统介绍提示工程(Prompt Engineering)的概念、构成要素和应用方法。通过角色定义、指令描述、上下文信息、例子展示等构建有效提示词,并结合思维链、自洽性等进阶技巧提升AI响应质量。详细讲解了防止提示词攻击的方法,总结经验:先尝试用prompt解决问题,必要时使用思维链提高准确性。最后介绍了OpenAI API重要参数及使用prompt调优prompt的方法。

2025-11-22 13:44:47 650

原创 大模型从入门到精通:认知破局+技术透视+避坑指南+工具武器库,收藏级干货!

文章系统介绍了大模型的认知破局、技术透视、分轨进阶路径、避坑指南和工具武器库,涵盖从基础概念到行业应用的全景式内容。针对不同受众,提供了小白的30天零代码学习路线和程序员的2个月开发进阶方案,并详细解析了医疗、心理、法律等领域的专业大模型应用。文章通过澄清常见误解,帮助读者避开认知陷阱,掌握实用工具,实现从入门到精通的大模型学习之旅。

2025-11-22 13:41:19 960

原创 AI 正在颠覆编程,程序员的出路在哪里?转型还是被取代?

看看那些真正的技术大牛,比如 Google 的 Jeff Dean,他在推动系统架构与机器学习结合方面做出了巨大的贡献。他们的成功源于不断在核心技术领域的深耕。AI 时代的程序员,未来是属于那些技术深度过硬的人。

2025-11-21 13:55:16 719

原创 All in大模型的第378天,我劝你这么做!

"我在32岁那年决定All in大模型,一年后薪资翻倍,团队从5人扩大到50人。"一位刚转型成功的AI创业者分享道。这样的案例在2025年的科技圈已不罕见。行业数据显示,大模型全栈工程师岗位量同比激增470%,平均月薪突破3.2万元,远超传统开发岗位。而AGI(通用人工智能)的脚步越来越近——xAI创始人Elon Musk预测,AGI有望在2026年到来。

2025-11-21 13:51:36 508

原创 大模型落地应用全攻略:从智能体架构到业务赋能实战指南!

文章分析国内大模型落地应用现状,指出智能体和多智能体是当前潮流方向,低代码搭建将成为核心落地方向。强调业务认知和产品策划是落地关键,而非单纯技术。建议企业可在优势产品上AI赋能,结合项目定制垂直AI业务,或共建高质量数据集、开发行业知识智能体等。提醒拥有数据却未应用于AI的公司将面临被颠覆风险。

2025-11-21 13:47:10 547

原创 BERT预训练模型深度解析:基于Transformer的AI革命!

文章详细介绍了BERT模型的本质架构、工作原理及应用场景。BERT基于多层Transformer编码器,通过Tokenization、Segment和Position Embeddings捕获文本语义,利用MLM和NSP预训练任务学习语言规律。模型支持多种NLP任务的微调,如问答系统、聊天机器人等。BERT具有广泛适用性和高效性能优势,文章还提供了从基础到进阶的大模型学习路线,帮助开发者掌握AI技术。

2025-11-21 13:44:50 485

原创 LLM Agent与RAG技术全解析:从零构建智能决策系统!

文章详解LLM Agent智能代理系统的架构与核心模块(规划、记忆、工具、行动),并重点介绍其与RAG技术的结合应用。通过财报分析Agent案例,完整展示从需求分析到报告生成的实现流程,帮助读者理解如何构建具备动态知识接入能力的智能决策系统,适合程序员与AI学习者参考实践。

2025-11-21 13:39:24 534

原创 2025年崛起的新金矿:大模型应用开发师,成为下一个高薪风口!

“刚毕业就拿到了3个offer,年薪最高达50万!”一位2025年应届毕业生在技术论坛上分享自己的求职经历,他所在的大模型应用开发方向班级几乎全部就业。与此同时,脉脉高聘人才智库最新数据发现,2025年9月,中国AI相关新发岗位数量同比增长超过11倍。华为、字节跳动等科技巨头以及MiniMax等AI领域头部企业纷纷发布大量AI工程师岗位,年薪最高可达140万元。

2025-11-20 14:27:01 575

原创 2025年AI人才争夺战白热化:薪资飙升,这些技能让你成为抢手货!

2025年,AI领域正经历着前所未有的人才争夺战。据脉脉最新发布的《2025年AI人才流动报告》显示,今年1-7月,AI新发岗位量同比增长超10倍,简历投递量也暴涨了11倍。更令人惊讶的是,AI岗位不仅数量激增,薪资也水涨船高,AI新发岗位平均月薪达到61,475元,让众多从业者看到了实实在在的"技术红利"。

2025-11-20 14:18:00 979

原创 大模型预训练与微调技术全攻略:SFT、LoRA、RLHF、DPO和PPO等方法!

本文系统介绍大模型预训练与微调技术,包括SFT、LoRA、RLHF、DPO和PPO等方法,详细阐述定义、目的和流程。同时提供从基础到进阶的七阶段学习路线,涵盖系统设计、提示词工程、平台应用开发、知识库应用、微调开发及多模态应用,为不同水平学习者提供全面指南。

2025-11-20 14:09:23 740

原创 【珍藏版】Agent实战:智能体强化学习微调技术提升AI性能的完整指南!

Agent RFT(智能体强化学习微调)是一种允许智能体在训练过程中调用外部工具并从中学习的微调方法。它通过自定义奖励信号(Grader)引导智能体探索最佳任务实现路径,能显著提升特定领域任务性能、提高工具使用效率并降低延迟。该技术在FinQA基准测试和Cognition等客户案例中成功验证,通过端到端训练使模型更好使用工具,减少推理延迟,实现性能爬升。

2025-11-20 14:05:46 771

原创 大模型推理能力的真相:是真正的智能突破还是工程包装?

文章揭示了所谓"推理模型"的突破实则是通过工具调用与流程编排对模型能力停滞的工程补偿,而非智能的根本提升。OpenAI正从基础研究转向应用变现,如ChatGPT Apps和Atlas浏览器。文章指出行业面临两条路径:继续优化现有系统或直面Transformer架构的根本缺陷进行创新。整个AI生态的繁荣建立在"代码生成能力持续进步"的假设上,这一假设若被推翻,将影响3万亿美元的市场预期。

2025-11-20 14:04:08 796

原创 狠狠收藏!关于大模型,看这一篇就足够了!小白变大神!

大模型是依托深度神经网络构建,拥有数十亿至数千亿参数的机器学习系统。它通过海量数据训练习得复杂模式,能处理自然语言、图像等多领域任务,是当前人工智能领域的核心技术之一。本文将从基本概念入手,辨析易混淆的相关术语,详解其发展脉络、核心特性、分类方式及泛化与微调技术,为理解大模型提供全面参考。

2025-11-19 15:16:37 630

原创 大模型算法工程师职业指南:大模型时代如何成为高薪技术人才!

文章全面介绍了算法工程师的职业定义、工作任务、紧缺程度、薪酬水平、能力要求、院校推荐及发展前景。算法工程师作为数字经济的核心人才,利用数学、编程及机器学习知识解决复杂问题,长期处于紧缺状态,薪资高且晋升路径多样。文章还提供了专业选择建议和职业规划指导,帮助有志于从事此职业的人规划学习和发展方向。

2025-11-19 15:12:29 1201

原创 大模型的未来十年:继续火爆还是逐渐降温?从百模大战到智能体时代,一文带你看懂大模型的发展与红利!

文章阐述了大模型从"百模大战"到"百应用大战"的演变,强调解决具体业务痛点的重要性。大模型的"黄金范式"是Pre-Training打基础+Post-Training补技能,而智能体(Agent)将使大模型从"工具"变"同事"。未来10年,软件开发、内容营销和知识密集型行业将迎来大模型红利,普通人应学会利用大模型,从"使用者"变为"利用者",把人从繁琐执行中解放出来。

2025-11-19 15:09:40 607

原创 AI大模型中的AI Agent:定义、分类与发展趋势,一篇文章让你彻底明白!

文章详细介绍了AI大模型和AI Agent的定义、分类及发展历程,阐述了AI Agent作为AI迈向AGI的关键环节,分析了其在客服、数据分析等行业的应用场景及优秀厂商案例。文章展望了AI Agent从"AI辅助人类"到"AI自主服务"的发展趋势,以及与机器人结合带来的变革,强调了工具调用能力是AI Agent区别于普通AI模型的核心特征。

2025-11-19 15:07:32 552

原创 强化学习大揭秘:Loss与Reward的关系及反向传播奥秘,大模型训练必备干货!

本文深入探讨了强化学习中损失函数与奖励的关系。在RL中,由于环境、奖励模型不可微及采样路径离散,reward无法直接求导。因此,loss仅作为计算梯度的工具,其数值变化与reward提升无必然联系。真正应关注的是reward、win-rate等指标,只要loss不爆炸、梯度方向正确,即可安心训练。理解这一关系对大模型训练至关重要。

2025-11-19 15:05:35 912

原创 零基础转行大模型,年薪50W+不是梦!保姆级学习路线+避坑指南,收藏这篇就够!

2025年,大模型技术风暴席卷全球,不仅重构了AI行业的技术版图,更催生出全新的职业生态。据《2025年AI人才趋势报告》显示,大模型相关岗位平均薪资较上年涨幅达**40%**,其中算法工程师年薪中位数突破50万元,数据标注工程师、LLMOps工程师等细分岗位的招聘需求同比激增2.3倍。

2025-11-18 16:11:15 1559

原创 哈佛研究大揭秘:AI如何悄悄改变就业市场,初级岗位面临最大危机!

前阵子,我在社交平台上刷到一篇引发热议的经济学论文,其对AI与就业关系的剖析堪称“手术刀级别”。不同于市面上充斥着情绪煽动的AI讨论,这篇文章用海量真实数据,撕开了AI冲击就业市场的残酷现实——它没有制造大规模失业潮,却在悄悄改写职场的底层逻辑。今天,我们就从这篇极具分量的研究出发,聊聊AI究竟如何重塑我们的工作未来。

2025-11-18 15:38:11 360

原创 刚刚、Grok 4.1登顶大模型排行榜:31分优势碾压Gemini 3,免费体验情商巅峰!

马斯克的xAI发布Grok 4.1大模型,以31分优势登顶LMArena排行榜,碾压Gemini 2.5 Pro等顶级模型。Grok 4.1情商显著提升,在EQ-Bench测试中排名第一;幻觉率下降65%;创意写作能力大幅增强。该模型已通过"静默测试",64.78%用户更喜欢新版本。目前Grok 4.1已在全平台上线,免费可用,成为当前最值得尝试的大模型之一。

2025-11-18 15:36:59 593

原创 大模型入坑必备基础知识!推理模型新手指南:轻松理解当今最热门的AI推理技术!

这篇文章随便聊一下如今比较火的推理模型,给新入坑的同学做一些简单的科普,都是一些偏基础的知识。

2025-11-18 15:30:35 759

原创 为什么RL不如SFT稳定?大模型训练必备收藏指南,小白到程序员的进阶之路!

本文深入分析了大型语言模型中强化学习(RL)不如监督微调(SFT)稳定的原因。尽管两者在loss形式上相似(SFT可视为advantage全为1的RL特例),但RL面临基础设施难度大、数据质量参差不齐、训练样本可能带有"毒性"等问题。作者强调应谨慎使用RL技巧,优先分析数据分布变化,并指出高质量数据和精准reward模型是RL成功的关键,SFT因其稳定性仍是更可靠的选择。

2025-11-18 15:12:46 589

原创 大厂AI校招薪资飙升,顶尖博士年薪近200万,揭秘AI人才争夺战!

近日,一则关于95后“AI才女”罗福莉加入小米的消息引发业内广泛关注。作为DeepSeek-V2关键开发者之一,她在国际顶会发表过8篇论文,传闻雷军亲自出面以千万年薪招揽。这并非个例。在今年的校招季中,阿里巴巴、百度、腾讯、字节跳动等大厂不约而同地大幅提升AI岗位比例,百度2026届秋招中AI岗位占比超90%,阿里相关岗位占比也超过60%。

2025-11-17 14:13:23 1238

原创 AI领域职业规划全攻略:从岗位解析到入行准备,一文助你锁定未来百万年薪!

从智能医疗的影像诊断到金融行业的风险预测,从零售的智能推荐到制造业的自动化生产,人工智能(AI)正以前所未有的速度重塑各行各业的运作模式。这种技术革命不仅推动了产业升级,更催生了大量新兴职业,同时也改变了企业对人才的能力要求。本文将系统解析AI领域的就业机会、人才需求核心,以及入行前的准备方向,为求职者提供清晰的职业参考。

2025-11-17 14:08:26 837

原创 深入解析主动式RAG:让大模型学会自主决策何时使用搜索工具!

文章介绍了RAG的两种架构:被动式和主动式。被动式RAG总是先检索再回答,效率低下;而主动式RAG结合智能体技术,能像人类一样自主判断是否需要使用搜索工具,只有在自己无法回答时才调用检索功能,大大提高效率并提升用户体验。主动式RAG本质上是配置了召回工具的智能体,其工作流程更符合人类思维模式,能够根据问题复杂度决定是否需要查阅资料。

2025-11-17 14:07:10 563

原创 大模型智能体搭建实战:简单可组合模式打造高效系统!

本文是Anthropic提供的LLM智能体搭建指南,强调采用简单可组合模式而非复杂框架。文章区分了工作流(固定步骤)和智能体(动态规划)两种模式,详细介绍了5种实用工作流:提示链、路由、并行化、协调者-执行者、评估者-优化器。核心原则是保持设计简洁、工具接口友好、规划步骤透明。实际应用场景包括客户支持和编程辅助,开发者应优先选择最简单方案,仅在必要时增加复杂度。

2025-11-17 14:00:25 999

原创 GPT-5.1升级解读:OpenAI重塑AI情商,日常版更温暖,深度推理版更强大!

三个月前,GPT 5 发布时,CEO Sam Altman 说:“这是我们最强的模型”。三个月后,OpenAI 发布 GPT 5.1,官方博客罕见地承认:“我们听到了用户的声音,真正好用的 AI 不仅要有智商,还得有情商。”

2025-11-17 13:57:55 790

原创 DeepSeek-OCR-WebUI部署指南:7种识别模式,GPU加速大模型应用!

本文介绍了DeepSeek-OCR-WebUI的部署与使用,这是一个基于DeepSeek-OCR模型的图像识别web应用,提供7种识别模式、PDF支持等功能。文章详细讲解了Docker环境搭建、NVIDIA Container Toolkit配置、服务启动等步骤,展示了UI界面的实际应用效果。该项目使用transformers引擎,相比vLLM更稳定且兼容性更好,适合生产环境使用。

2025-11-15 09:30:00 1958

原创 2025大模型开源生态全景图发布:135个核心项目,三大主导赛道,七大趋势解析!

蚂蚁集团开源团队发布《2025大模型开源开发生态全景图》,涵盖135个核心项目和19个技术领域。报告揭示当前三大主导赛道:模型训练框架、高效推理引擎、低代码应用开发框架。开源生态呈现"黑客松现象",项目靠热点驱动但高淘汰率。七大趋势包括Agent框架褪去、低代码平台崛起、标准协议层登场、AI Coding红火等。这份全景图为开发者提供技术路线参考,帮助在快速变化的大模型领域找准方向。

2025-11-15 09:00:00 875

原创 2025年AI就业浪潮:AI人才百万年薪时代来临,传统岗位何去何从?

2025年,全球招聘市场整体下降8%,但这简单的数字背后隐藏着截然不同的现实:一边是AI人才千金难求,一边是传统岗位悄然萎缩。当DeepSeek等大模型技术推动AI从实验室走向产业落地,就业市场正在经历一场无声革命。算法工程师年薪百万已不罕见,而计算机图形设计师的岗位却减少了33%。

2025-11-14 10:50:17 1429

原创 AI核心概念揭秘:大语言模型,掌握Transformer架构,从预训练到微调!

大语言模型是基于Transformer架构的超大规模神经网络,通过预训练和微调获得知识,展现出规模带来的涌现能力。它们能理解语言、掌握世界知识并进行复杂推理,具备多任务通用能力。尽管存在幻觉、知识截止等局限,但大语言模型已成为AI发展的重要里程碑,为通用人工智能(AGI)提供了可能。掌握提示工程技巧能更好地发挥其潜力。

2025-11-14 09:54:59 1168

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除