- 博客(1954)
- 收藏
- 关注
原创 LLM大模型:从新手到专家:AI大模型学习与实践完全指南
大模型,通常指的是在人工智能领域中的大型预训练模型。你可以把它们想象成非常聪明的大脑,这些大脑通过阅读大量的文本、图片、声音等信息,学习到了世界的知识。这些大脑(模型)非常大,有的甚至有几千亿个参数,这些参数就像是大脑中的神经元,它们通过复杂的计算来理解和生成语言、图片等。举个例子,你可能听说过GPT-3,它就是一个非常著名的大模型。GPT-3可以通过理解你提出的问题,然后给出回答,或者根据你给它的提示,生成一篇文章、一个故事,甚至是一段代码。
2024-09-06 10:30:00
2882
1
原创 更高级的 RAG 架构:提升 AI 大模型回答准确性的前沿技术
本文介绍了更高级的 RAG 架构,也详细介绍了更多的 RAG 技术,希望对你有所帮助。RAG 技术依然还在快速发展中,也还存在诸多挑战。前段时间微软发布了 GraphRAG 让 RAG 的应用延伸到了图领域。我相信,在今后 RAG 的应用将会越来越广泛,与 LLM 的结合越来越紧密,我们所使用的 AI 功能也肯定会更加强大。
2024-09-06 09:00:00
1774
1
原创 深入剖析:从落地场景到实现路径——14份报告揭秘大模型热点问题
生成式AI通过学习大量原始内容,生成新的、原本并不存在的数据、文本、图像或其他类型的内容,具有一定的创造性和想象力。生成式AI对企业带来了创新的机会和自动化的潜力,提高了产品设计、广告创作和个性化服务的水平,使企业能够更高效地自动生成内容、提供个性化的客户体验。2023年是生成式AI的突破时刻,也是中国大模型的发展“元年”。通用大模型的快速迭代推动着生成式AI市场的发展。当前,企业的重点已经从围绕基础大模型的兴奋点转向推动投资回报率的用例。
2024-09-01 12:45:00
2171
1
原创 从零到精通:详解如何训练大模型的完整指南,非常详细,收藏我这一篇就够了
尽管可以使用一些技巧方法来构造一些看起来特别平滑的指标来反对大模型涌现这个词汇,但是不可否认的事实是,在不同的尺寸变化或者数据量、计算量变化之后,人们可以非常明显地感知到大模型表现的巨大差异,这就是一个相变的结果,就像是炼制一门18连环刃的法器,从第一把的炼制到第18把,从个数的指标上来说是非常平滑的,但是从威力上来说,18把可以构建一个法阵,极大地增加了武器的威力,与之前不可同日而语。以及,另外一个可能,小模型每一层cos都小,有可能每一层在干不同的事,或者每一层都会注意到新的东西。
2024-08-21 22:06:26
3348
1
原创 【深入探讨】AI大模型的学习路径:理论构建、技术创新与应用实践
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。随着技术的不断进步和理论的不断完善,相信AI大模型学习将会在更多的领域展现出强大的应用潜力,为人类社会带来更多的便利和进步。算法优化是提升模型性能的重要手段。总的来说,AI大模型学习在医疗健康领域的应用将为医疗诊断、治疗和管理带来革命性的变革,有望提高医疗服务的效率和质量,最终造福于人类的健康。
2024-08-16 17:03:58
1846
1
原创 2025年AGI大模型趋势必读:大模型本质、应用场景与人才需求解析,附大模型学习路径!
与此同时,某招聘平台2025年1-7月AI新发岗位量同比增长超10倍,简历投递量也暴涨了11倍。算法类人才持续紧缺,“搜索算法”人才供需比仅为0.39,相当于5个岗位争夺2个人才。这一切背后,是AGI从概念走向落地的加速。图灵奖得主杨立昆(Yann LeCun)近期离职创业,将以“世界模型”为核心技术方向,直指当前大语言模型的根本局限。
2025-11-24 10:48:08
977
原创 【AI产品经理简历】不靠研发也能拥有AI项目经验,面试offer拿到手软!
文章分享了如何利用AI工具(如Dify、Coze等)快速构建项目作品,即使没有公司工作经验也能获取AI产品实战经验。通过几个成功转岗案例展示了具体实践方法,并推广了《AI产品经理转岗特训营》课程,该课程通过系统学习和项目实践帮助学员掌握提示词工程、RAG知识库等技能,快速打造可写进简历的AI项目作品,提升面试成功率。
2025-11-24 10:38:16
651
原创 企业智能化转型关键:如何打通企业智能化转型最后一公里?
文章详解了大模型在企业落地的四个阶段及"六问"关键问题,涵盖规划准备、实施落地和运营迭代全过程。强调业务价值、数据和技术是三大核心要素,提出以数据为中心的落地范式,需各部门协作通过持续优化实现迭代。从场景挖掘、平台建设到应用落地,遵循敏捷迭代原则,最终实现智能决策支持。
2025-11-24 10:35:59
515
原创 RAG入门到精通:理解其方法论本质,提升大模型生成质量!
RAG的本质是一种方法论而非具体技术,旨在解决大模型的幻觉、知识不足及更新慢问题。其原理类似于开卷考试,在模型回答前提供参考文档。RAG包含检索和增强生成两部分,检索可采用传统匹配、语义检索等多种技术,而模型仅关注上下文管理。通过RAG可显著提升大模型生成质量,是当前大模型应用中的重要方法。
2025-11-24 10:32:27
230
原创 AI智能体实战指南:揭秘AI智能体背后的三大核心组件,让AI从对话走向行动!
本文介绍了AI Agent的基本概念和核心构成。Agent是能代表用户独立完成任务的系统,由模型(大脑)、工具(手脚)和指令(操作手册)三大组件组成。模型负责思考决策,工具执行具体操作,指令规范行为边界。通过抢机票案例,文章详细解释了各组件功能,展示了Agent如何实现从思考到行动的闭环,让AI从对话走向实际执行任务。
2025-11-24 10:32:16
271
原创 【AI医疗】迈瑞启元超声大模型如何实现医疗AI落地!
迈瑞发布启元超声大模型,推出"设备+IT+AI"原生智能超声解决方案,解决超声行业漏诊误诊、工作重复、质控难等痛点。该模型在乳腺和妇产超声领域实现全流程智慧赋能,提升诊断准确性5%-10%,优化工作流程,降低人力消耗。迈瑞与医院合作打造"数智超声样板间",推动超声迈入全流程数智化新阶段。
2025-11-23 07:00:00
1626
原创 一线大厂程序员都在内卷转型AI大模型,再不学就跟不上时代了!内卷转型路线图曝光
2025年初,一则消息在技术圈炸开:微软全球裁员6000人,41%是软件工程师岗位,而AI代码生成在该公司的占比已超过30%。同时,LinkedIn数据显示,AI相关岗位需求同比增长217%,传统开发岗位却缩减18%。“公司去年招聘的20名初级程序员,今年全部转岗AI工程组,不会大模型技术的薪资直接倒挂。”一位字节跳动技术总监在内部会议上坦言。技术淘汰从不打招呼,只发通知。
2025-11-22 11:40:39
1322
原创 AI圈大事件:Grok 4.1与Gemini 3 Pro新版本引爆热潮,揭秘模型更新背后的赚钱机会!
文章介绍了Grok 4.1和Gemini 3 Pro等最新大模型,并分享了产品经理通过三阶段AI应用提升生产力的方法:付费模型基础应用、AI编程自动化、私有化部署定制任务流。当前是AI应用的"蜜月期",善用AI可获最大收益,但随着普及度提高,收益将逐渐降低。
2025-11-22 11:37:21
477
原创 大模型落地全攻略:零基础程序员也能上手的效率革命指南,不懂这3步框架,90%企业烧钱打水漂!
本文详细阐述了企业如何落地大模型技术,通过解构业务流程、绘制价值流图,结合数据驱动决策、自动化服务、个性化推荐、预测优化和流程改进五大场景,帮助企业实现效率提升、成本降低和客户满意度提高。通过智能客服、供应链管理和生产线质检三个实战案例,验证了大模型的实际价值。
2025-11-22 11:35:57
999
原创 从入门到精通:知识图谱+LLM构建企业级智能系统的完整指南!
知识图谱与大语言模型通过检索增强生成(RAG)技术结合,将LLM的语言能力与知识图谱的结构化事实连接,解决LLM缺乏企业实际数据的问题。这一技术应用于客户服务、业务决策和语义搜索,能提供精准、一致的回答,提高决策效率,并通过实际案例展示其如何将AI从"听起来聪明"转变为真正理解企业业务,为企业构建可扩展、可靠的企业级智能基础。
2025-11-22 11:34:11
632
原创 35+程序员转行大模型月入2万+:2个月零基础入门AI高薪领域的真实经历!
作为一名30+的北漂男程序员,我用2个月时间从零基础切入大模型领域,最终成功拿到月薪2w+的offer。这段转型经历里,有踩过的坑、总结的实战方法,更有对“大龄转行”的真实思考。今天把这些干货分享出来,希望能帮还在职业迷茫中打转的你,找到破局的方向!
2025-11-21 14:30:16
964
原创 大模型算法岗面试宝典:100道常见面试题,助你轻松应对技术挑战!
本文提供了一份全面的大模型算法岗位面试题清单,包括基础理论、模型结构、训练微调策略、应用框架、分布式训练和模型推理等方面的知识点,旨在帮助求职者准备相关技术面试。
2025-11-21 14:25:45
701
原创 2025年主流大语言模型盘点:GPT-5、Gemini到DeepSeek R1!模型众多,该如何选择?
本文详细介绍了当前主流大语言模型,包括OpenAI的GPT-5系列、谷歌的Gemini 2.5 Pro与Nano Banana、马斯克的Grok 4、国产DeepSeek R1 0528以及Claude系列等。文章分析了各模型在编程、科研、绘画、推理等不同领域的优势,并提供了具体使用方法和场景应用指南,帮助读者根据自身需求选择最适合的AI工具,提升工作效率。
2025-11-21 14:16:59
873
原创 【保姆级教程】工程AI知识库搭建攻略:RAGFlow参数全解析,打造你的AI助理!
这篇文章详细介绍了如何使用RAGFlow开源引擎为工程行业构建高效AI知识库。文章从文档预处理、智能分块、知识图谱到召回增强(RAPTOR)四个方面,系统讲解了参数配置的原理与方法,提供了工程场景下的量化配置表和实操指南。针对技术规范查询、项目管理资料和投标答疑三大高频场景,给出了可直接复用的配置方案,并附有避坑指南,帮助工程人打造专业可靠的AI知识管家。
2025-11-21 14:12:24
787
原创 从零开始构建AI智能体:开发者必收藏的Google官方指南!
Google发布的《Introduction to Agents》白皮书介绍了AI智能体的完整框架,包括定义(模型、工具、编排层、部署服务)、五级分类体系、核心架构设计和生产级部署策略。文章探讨了多智能体系统设计模式、安全治理机制、学习进化方法,并通过Google Co-Scientist和AlphaEvolve等案例展示应用。该指南旨在帮助开发者构建从原型到生产级的智能体系统,解决安全性、质量和可靠性挑战。
2025-11-21 13:43:21
1026
原创 2025年开发人新机遇!揭秘未来5年最火就业方向,这个新兴岗位将引领潮流!
更严峻的是,当业务面临转型时,领导要求用RAG技术优化知识库检索,你却缺乏相关技能;带领AI团队时,对微调大模型所需的数据量毫无概念;试图转型大模型应用开发工程师等岗位,却因缺乏项目实操经验而寸步难行……这已不再是单纯的技术焦虑,而是关乎职业生存的严峻危机!
2025-11-20 14:57:20
886
原创 AI狂潮席卷应届生就业市场:猎聘网惊现百万年薪岗位,是泡沫还是新机遇?
只要你是真心想学AI大模型,我这份资料就可以无偿共享给你学习。大模型行业确实也需要更多的有志之士加入进来,我也真心希望帮助大家学好这门技术,如果日后有什么学习上的问题,欢迎找我交流,有技术上面的问题,我是很愿意去帮助大家的!
2025-11-20 14:31:39
1274
原创 【干货收藏】从技术本质看LLM:不懂意义的智能能否通向AGI?
文章探讨了杨立昆关于LLM是"模式拟合"而非真正理解意义的观点。作者认为LLM虽不懂语义,但通过规模扩展涌现出上下文学习、思维链等能力。LLM可作为AGI的知识底座,但要实现真正AGI,还需结合世界模型和具身智能,解决与物理世界交互的问题。当前LLM是通向AGI的重要积木,而非终点。
2025-11-20 14:17:17
814
原创 大模型分布式训练完全指南:从数据并行到多维混合并行的技术详解!
本文系统介绍大模型分布式训练中的七大并行技术:数据并行、流水线并行、张量并行、序列并行、多维混合并行、自动并行和MOE并行,详细分析各种技术的实现原理、优缺点及适用场景。同时提供不同硬件环境下并行策略的选择指南,以及FP16与BF16混合精度训练的对比分析,为开发者提供完整的大模型分布式训练技术路线图。
2025-11-20 14:15:29
847
原创 AI大模型推理框架揭秘:vLLM与SGLang的区别,你了解多少?
文章对比了两种大模型推理框架SGLang和vLLM的技术特点和性能表现。SGLang采用RadixAttention技术,擅长处理多轮对话、结构化输出和高并发场景;vLLM以PagedAttention和ContinuousBatching技术见长,在高吞吐单轮推理方面表现优异。测试表明,高并发环境下SGLang稳定性更好,而VLLM在首字输出速度上有优势。文章建议根据具体业务需求和场景选择合适的框架,并提供了大模型学习路线资源。
2025-11-20 14:00:21
995
原创 抓住机会!高薪急聘新兴领域人才,月薪45K只是起点,未来不可限量!
文章针对想从技术岗位转向大模型产品经理的学习者提出建议:不应只关注技术实现,而应理解大模型在实际场景中的应用价值;补齐应用思维,思考技术如何解决业务痛点;提升沟通表达能力。建议三步走:了解大模型应用全景、做小Demo、结合业务写PRD。文章强调有通信背景的人在大模型领域有独特优势,建议定位为"懂大模型的业务产品经理"而非纯技术专家。
2025-11-19 15:44:07
804
原创 985应数大二迷茫?Java太卷、C++太专、算法太玄?大模型时代技术方向怎么选?
今天给大家分享的是一位粉丝的提问,985应数大二Java太卷、C++太专,算法太玄,到底选哪个?接下来把粉丝的具体提问和我的回复分享给大家,希望也能给一些类似情况的小伙伴一些启发和帮助。
2025-11-19 15:34:21
950
原创 大语言模型时代,知识图谱构建全攻略!一篇文章带你轻松掌握!
文章综述了大语言模型在知识图谱构建中的应用进展,分析了LLMs在知识抽取、融合和推理三大环节的技术突破,探讨了知识问答和检索增强生成系统的应用价值,指出知识更新难、冲突、可解释性不足等挑战。未来研究方向包括端到端KG构建、LLMs理解KG结构、KG增强LLMs等多维度融合路径。
2025-11-19 15:32:02
884
原创 【大模型应用落地】落地AI智能体的最大挑战:从招聘到管理,AI如何变身HR最佳拍档?
文章详细介绍了AI在HR领域的五大应用场景:智能招聘、实战陪练、课程生成、领导力教练和员工助手,展示了AI如何从工具转变为业务伙伴。文章指出AI落地分为三个阶段:功能型、工具型和业务型,强调HR需要拥抱变化,亲自参与AI应用设计,才能不被淘汰。AI不会取代HR,但会淘汰只停留在事务处理层面的HR角色。
2025-11-19 15:28:51
749
原创 谷歌Gemini 3 Pro震撼发布:超越GPT-5.1,开启AI智能体新时代!
谷歌发布Gemini 3 Pro旗舰模型,凭借顶尖推理能力和多模态理解在多项基准测试中超越GPT-5.1。该模型支持100万token上下文,具备强大的氛围编程和智能体能力,并推出Google Antigravity开发平台。开发者现可在Google AI Studio等多平台使用,为AI应用开发带来新可能,标志着谷歌在AGI道路上迈出重要一步。
2025-11-19 15:19:17
782
原创 2025年AI产品经理薪资揭秘:程序员转型薪资涨幅高达40%?附完整学习体系与成功案例!
自2023年ChatGPT引爆全球AI革命后,技术迭代进入“加速度模式”。国内科技巨头百度(文心一言)、腾讯(混元大模型)、阿里(通义千问)、字节(豆包)纷纷将大模型技术列为战略核心,AI相关岗位需求呈爆发式增长。与之形成鲜明对比的是,传统互联网行业历经多年发展,流量红利基本见顶,产品同质化严重,程序员的职业发展逐渐陷入“瓶颈期”。
2025-11-18 14:48:38
1496
原创 AI Agent元年开启:程序员的新机遇,深度解析技术革新与市场新机遇!
2025年被誉为“Agent元年”,AI智能体正以惊人的速度从概念走向产业化落地。根据IDC最新市场概览,2025年第三季度,AI Agent领域迎来了显著的技术跃迁,其核心突破集中体现在多模态大模型驱动的跨平台协同能力上。对于广大程序员和技术从业者来说,这不仅是技术的革新,更是职业发展的重大机遇。
2025-11-18 14:41:32
487
原创 LangChain进阶:RAG Agent记忆功能实现与优化!
本文介绍了如何为LangChain的RAG Agent添加记忆功能,实现短期记忆以记住用户交互历史。文章详细讲解了通过消息列表实现记忆的方法,并针对对话历史过长导致上下文窗口限制的问题,提出了三种解决方案:Trim Messages、Delete messages和Summarize messages。此外,还介绍了如何自定义AgentState来扩展记忆功能。教程提供了完整的源码,适合希望提升RAG Agent交互能力的开发者学习。
2025-11-18 14:40:20
986
原创 ReAct与Reflexion:提升大模型性能的两大核心技术框架!
文章介绍了大语言模型在复杂任务处理中的局限性,以及ReAct和Reflexion两种解决方案。ReAct通过"推理+行动"循环机制使模型与外部环境交互,减少幻觉;Reflexion在此基础上增加评估和反思机制,形成完整学习闭环。两者结合显著提升模型在知识密集型任务、决策任务和编程任务中的表现,是构建下一代智能系统的核心技术。
2025-11-18 14:39:05
862
原创 多模态视角+大视觉模型:DMMV框架突破时间序列预测瓶颈,附代码实现!
DMMV框架首次将大视觉模型与数值建模结合,解决视觉模型在时间序列预测中"只擅长周期、忽略趋势"的偏置问题。通过显式与自适应分解机制,分别利用LVM捕捉周期性结构、数值预测器建模全局趋势,并通过门控融合实现动态平衡。实验表明在8个基准数据集上全面超越14个主流模型,证明了视觉与数值融合能显著提升长时序预测的准确性与泛化能力,为多模态大模型在时间序列领域开辟了新方向。
2025-11-18 14:34:14
634
原创 2026届AI人才争夺战白热化!大厂校招薪资飙升,顶尖博士年薪近200万,AI能力成求职必备!
2026届互联网大厂校招呈现AI人才争夺战态势,AI岗位占比大幅提升,百度超90%,阿里超60%。校招时间前移至"金八银九",规模扩大。企业更看重实际项目/实习经历,AI能力成为技术岗和非技术岗必备技能。AI岗位薪资大幅上涨,顶尖高校应届博士年薪近200万。预计2030年中国对AI人才需求将增至2022年的6倍,AI人才紧缺将成为常态。
2025-11-17 14:34:46
1318
原创 AI编程时代来临!普通程序员如何抓住行业机遇?AI大模型时代,从’码农’到’智农’的逆袭之路!
AI不会淘汰程序员,只会淘汰拒绝进化的"码农"。行业巨头普遍认为,掌握AI技术的"智农"将更加吃香,薪资更高,市场缺口大。AI应作为程序员的辅助工具,帮助提升效率和价值。未来程序员需兼具编码能力和AI应用能力,成为复合型人才才能在智能时代立足。学习AI大模型技术是程序员进化的必经之路,也是把握AI时代机遇的关键。
2025-11-17 14:29:09
1378
原创 AI智能体深度解析:原理、应用与未来趋势,引领人工智能新纪元!
AI智能体是AI领域的重要进展,具有自主性、适应性和目标导向性等特性。其核心架构包括大语言模型作为"大脑"、记忆系统、规划决策和工具使用模块。关键技术涵盖提示工程、RAG和多模态协同能力等。AI智能体已广泛应用于企业流程自动化、软件开发、电商运营、医疗健康等领域,但仍面临不确定性、安全风险和伦理挑战等挑战。未来将向更强自主性、多模态融合和具身智能方向发展。
2025-11-17 14:27:41
1246
原创 大模型蒸馏必看:解决DeepSeek R1长think问题的三种实用策略!
文章探讨了蒸馏大型推理模型(如DeepSeek R1)时遇到的"长think"问题及其解决方案。长think导致显存压力大、冗余信息过多和泛化性下降。作者提出了三种应对策略:压缩或总结think内容、结构化蒸馏(只学习推理框架)、调整训练损失(降低think权重)。通过实际流程展示,这些方法能在保证推理能力的前提下显著减小训练负担,使学生模型能够高效学习。
2025-11-17 14:22:17
811
原创 Meta开源REFRAG:RAG架构的革命性突破,效率提升30倍,大模型开发者必备!
Meta开源的REFRAG RAG方案通过在embedding层面压缩无关上下文,只给模型呈现真正有用的信息,实现了首token延迟提升30.85倍,上下文窗口扩大16倍,token消耗减少2-4倍的效果。该方案使用强化学习训练的策略网络对压缩向量打分,只保留高分内容完整展示,其余保持压缩状态。这不仅解决了传统RAG中90%上下文无用的痛点,还大幅降低了推理成本,使长上下文应用成为可能,代码已在GitHub开源。
2025-11-17 14:16:37
614
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅